<div dir="ltr">I have a broken IPA replica that appears to be suffering from a hung directory server. The master seems to be working fine, but LDAP requests to the replica hang indefinitely. I attached gdb to ns-slapd and suspect a deadlock in cos_cache.c.<div>

<br></div><div>Thread 7 seems to be hung on an LDAP delete for a user account that we recently removed. Every time the directory server is started, it tries to issue this delete, apparently to sync the replica.</div><div>

<br></div><div>I have been unsuccessful in trying to remove the offending replica because ipa-replica-manage seems to need to make LDAP requests against the replica. For example:</div><div><br></div><div>$ ipa-replica-manage del <a href="http://p-ipa-wd02.prod.the.flatiron.com">p-ipa-wd02.prod.the.flatiron.com</a>                     </div>

<div>^CConnection to '<a href="http://p-ipa-wd02.prod.the.flatiron.com">p-ipa-wd02.prod.the.flatiron.com</a>' failed: Insufficient access: SASL(0): successful result:</div><div>Unable to delete replica '<a href="http://p-ipa-wd02.prod.the.flatiron.com">p-ipa-wd02.prod.the.flatiron.com</a>'</div>

<div><br></div><div>^CTraceback (most recent call last):</div><div>  File "/usr/sbin/ipa-replica-manage", line 1252, in <module></div><div>    main()</div><div>KeyboardInterrupt</div><div><br></div><div>Backtraces of the suspicious threads and log excerpts are at <a href="http://p.flatiron.com/~jmou/ipa/">http://p.flatiron.com/~jmou/ipa/</a> . I was only able to install a limited set of debugging symbols; let me know if I can be of more help.</div>

<div><br></div><div>Any help in fixing this replica or even just removing it would be greatly appreciated!</div><div><br></div><div>Joe</div></div>