<div dir="ltr">I submitted this a couple day ago.  Subject: Workers disappearing / canceled tasks after upgrading to 2.7.0.1 - CentOS 6.7<div><br></div><div>Can these be merged?<br><div class="gmail_extra"><br><div class="gmail_quote">On Wed, Nov 18, 2015 at 9:05 AM, Brian Bouterse <span dir="ltr"><<a href="mailto:bbouters@redhat.com" target="_blank">bbouters@redhat.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">Jason and Jeffrey,<br>
<br>
Thanks for reporting this. I've written up a bug [0] and I am<br>
investigating the root cause.<br>
<br>
On the bug are you able to leave some answers to these questions?<br>
<br>
- Can you confirm that it affects both RabbitMQ and Qpid usage?<br>
- Can you confirm that the workers "go missing" and then return, and<br>
then "go missing" in a continuous cycle? I expect it to happen every 90<br>
seconds.<br>
<br>
- Jeffrey specifically, what OS are you using?<br>
<br>
[0]: <a href="https://pulp.plan.io/issues/1380" rel="noreferrer" target="_blank">https://pulp.plan.io/issues/1380</a><br>
<br>
Thanks,<br>
Brian<br>
<span><br>
On 11/18/2015 09:33 AM, Miller, Jeffrey L wrote:<br>
> I am seeing this behavior as well after upgrading from 2.6 to 2.7.<br>
> However, I am using qpid not rabbitmq.<br>
><br>
><br>
><br>
> -Jeffrey<br>
><br>
><br>
><br>
><br>
><br>
><br>
><br>
</span>> *From:* <a href="mailto:pulp-list-bounces@redhat.com" target="_blank">pulp-list-bounces@redhat.com</a><br>
> [mailto:<a href="mailto:pulp-list-bounces@redhat.com" target="_blank">pulp-list-bounces@redhat.com</a>] *On Behalf Of *Ashby, Jason (IMS)<br>
> *Sent:* Wednesday, November 18, 2015 8:29 AM<br>
> *To:* <a href="mailto:pulp-list@redhat.com" target="_blank">pulp-list@redhat.com</a><br>
> *Subject:* [Pulp-list] Missing celery workers<br>
<div><div>><br>
><br>
><br>
> Hi all,<br>
><br>
> I’m hitting another issue with the upgrade to Pulp 2.7.0 + changing from<br>
> qpid to rabbitmq for messaging.  The workers are continuously going<br>
> missing, every minute or so.  The effect is that the tasks in the task<br>
> list stay in a Waiting state and are never completed.<br>
><br>
><br>
><br>
> Rabbitmq looks healthy; I see successful accepted connections per the<br>
> logs and can see a bunch of connections in the rabbitmq management GUI.<br>
> I’m kind of stuck as far as troubleshooting goes.  Any tips on what else<br>
> to investigate?<br>
><br>
><br>
><br>
> Pulp and rabbitmq servers are both CentOS 6.<br>
><br>
><br>
><br>
> # /var/log/messages<br>
><br>
> Nov 18 08:53:56 pulp01 pulp: celery.worker.consumer:INFO: missed<br>
> heartbeat from resource_manager@pulp01<br>
><br>
> Nov 18 09:05:46 pulp01 pulp: pulp.server.async.worker_watcher:INFO: New<br>
> worker 'reserved_resource_worker-3@pulp01' discovered<br>
><br>
> Nov 18 09:05:46 pulp01 pulp: pulp.server.async.worker_watcher:INFO: New<br>
> worker 'reserved_resource_worker-1@pulp01' discovered<br>
><br>
> Nov 18 09:05:46 pulp01 pulp: pulp.server.async.worker_watcher:INFO: New<br>
> worker 'reserved_resource_worker-2@pulp01' discovered<br>
><br>
> Nov 18 09:05:46 pulp01 pulp: pulp.server.async.worker_watcher:INFO: New<br>
> worker 'reserved_resource_worker-0@pulp01' discovered<br>
><br>
> Nov 18 09:05:56 pulp01 pulp: pulp.server.async.worker_watcher:INFO: New<br>
> worker 'resource_manager@pulp01' discovered<br>
><br>
> Nov 18 09:06:46 pulp01 pulp: pulp.server.async.scheduler:ERROR: Worker<br>
> 'reserved_resource_worker-3@pulp01' has gone missing, removing from list<br>
> of work<br>
><br>
> ers<br>
><br>
> Nov 18 09:06:46 pulp01 pulp: pulp.server.async.tasks:ERROR: The worker<br>
> named reserved_resource_worker-3@pulp01 is missing. Canceling the tasks<br>
> in its q<br>
><br>
> ueue.<br>
><br>
> Nov 18 09:06:46 pulp01 pulp: pulp.server.async.scheduler:ERROR: Worker<br>
> 'reserved_resource_worker-1@pulp01' has gone missing, removing from list<br>
> of work<br>
><br>
> ers<br>
><br>
> Nov 18 09:06:46 pulp01 pulp: pulp.server.async.tasks:ERROR: The worker<br>
> named reserved_resource_worker-1@pulp01 is missing. Canceling the tasks<br>
> in its q<br>
><br>
> ueue.<br>
><br>
> Nov 18 09:06:46 pulp01 pulp: pulp.server.async.scheduler:ERROR: Worker<br>
> 'reserved_resource_worker-2@pulp01' has gone missing, removing from list<br>
> of work<br>
><br>
> ers<br>
><br>
> Nov 18 09:06:46 pulp01 pulp: pulp.server.async.tasks:ERROR: The worker<br>
> named reserved_resource_worker-2@pulp01 is missing. Canceling the tasks<br>
> in its q<br>
><br>
> ueue.<br>
><br>
> Nov 18 09:06:46 pulp01 pulp: pulp.server.async.scheduler:ERROR: Worker<br>
> 'reserved_resource_worker-0@pulp01' has gone missing, removing from list<br>
> of work<br>
><br>
> ers<br>
><br>
> Nov 18 09:06:46 pulp01 pulp: pulp.server.async.tasks:ERROR: The worker<br>
> named reserved_resource_worker-0@pulp01 is missing. Canceling the tasks<br>
> in its q<br>
><br>
> ueue.<br>
><br>
> Nov 18 09:06:46 pulp01 pulp: pulp.server.async.scheduler:ERROR: Worker<br>
> 'resource_manager@pulp01' has gone missing, removing from list of workers<br>
><br>
> Nov 18 09:06:46 pulp01 pulp: pulp.server.async.tasks:ERROR: The worker<br>
> named resource_manager@pulp01 is missing. Canceling the tasks in its queue.<br>
><br>
> Nov 18 09:06:46 pulp01 pulp: pulp.server.async.scheduler:ERROR: There<br>
> are 0 pulp_resource_manager processes running. Pulp will not operate<br>
> correctly without<br>
><br>
> at least one pulp_resource_mananger process running.<br>
><br>
><br>
><br>
</div></div>> ------------------------------------------------------------------------<br>
<span>><br>
><br>
> Information in this e-mail may be confidential. It is intended only for<br>
> the addressee(s) identified above. If you are not the addressee(s), or<br>
> an employee or agent of the addressee(s), please note that any<br>
> dissemination, distribution, or copying of this communication is<br>
> strictly prohibited. If you have received this e-mail in error, please<br>
> notify the sender of the error.<br>
><br>
><br>
><br>
</span>> _______________________________________________<br>
> Pulp-list mailing list<br>
> <a href="mailto:Pulp-list@redhat.com" target="_blank">Pulp-list@redhat.com</a><br>
> <a href="https://www.redhat.com/mailman/listinfo/pulp-list" rel="noreferrer" target="_blank">https://www.redhat.com/mailman/listinfo/pulp-list</a><br>
><br>
<br>
_______________________________________________<br>
Pulp-list mailing list<br>
<a href="mailto:Pulp-list@redhat.com" target="_blank">Pulp-list@redhat.com</a><br>
<a href="https://www.redhat.com/mailman/listinfo/pulp-list" rel="noreferrer" target="_blank">https://www.redhat.com/mailman/listinfo/pulp-list</a><br>
</blockquote></div><br></div></div></div>