<div dir="ltr">Thanks for the info Dennis!<div><br></div><div>I tried 'rpm repo sync sun --force-full' but it didn't help to clear the corrupted entry. How can I drop this on the server side? Should I just directly edit an entry in mongodb?</div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">пт, 2 окт. 2020 г. в 14:39, Dennis Kliban <<a href="mailto:dkliban@redhat.com">dkliban@redhat.com</a>>:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div>Filelists are stored in the database in a compressed form[0]. During publishing of metadata, each fillist is decompressed before being written to a file[1]. It's hard to speculate when data corruption occurred. It's possible that the data was corrupted in the remote repository the first time that this RPM was downloaded. That metadata could have been fixed since then, but Pulp thinks it already has the information and is not trying to re-download.<br></div><div><br></div><div>[0] <a href="https://github.com/pulp/pulp_rpm/blob/2-master/plugins/pulp_rpm/plugins/db/models.py#L1051" target="_blank">https://github.com/pulp/pulp_rpm/blob/2-master/plugins/pulp_rpm/plugins/db/models.py#L1051</a></div><div>[1] <a href="https://github.com/pulp/pulp_rpm/blob/2-master/plugins/pulp_rpm/plugins/db/models.py#L1064" target="_blank">https://github.com/pulp/pulp_rpm/blob/2-master/plugins/pulp_rpm/plugins/db/models.py#L1064</a></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Fri, Oct 2, 2020 at 3:27 AM Konstantin M. Khankin <<a href="mailto:khankin.konstantin@gmail.com" target="_blank">khankin.konstantin@gmail.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div>Sorry for reviving this thread but I think I found something.</div><div><br></div><div>Today I tried to install CentOS 7 and got an error:</div><div>"TypeError: Parsing filelists.xml error: expected '>'"</div><div><div><br></div></div><div>So I did this:</div><div><br></div>>>> import xml.etree.ElementTree as ET<br>>>> tree = ET.parse('/mnt/sysimage/var/tmp/yum.cache/centos_updates/gen/filelists.xml')<br>...<br>  File "/usr/lib64/python2.7/xml/etree/ElementTree.py", line 1506, in _raiseerror<br>    raise err<br>xml.etree.ElementTree.ParseError: not well-formed (invalid token): line 1884123, column 136<br><div><br></div><div>I opened filelists.xml and found that line 1884123 is indeed corrupt and looks like this:</div><div>    <file>/usr/share/javadoc/java-1.8.0-openjdk-1.8.0.111-1.b15.el7_2-debug/api/javax/sql/rowset/serial/compact3-package-frame.html</fil%   !,^@ 0 480!share/javadoc/java-1.8.0-openjdk-1.8.0.111-1.b15.el7_2-debug/api/javax/sql/rowset/serial/compact3-package-summary.html</file><br></div><div><br></div><div>I verified another consumer has exactly the same issue with this file.</div><div><br></div><div>Do I understand correctly Pulp generates filelists.xml? If so, can it be because of a bug in Pulp or should I look for a silent data corruption issue on my pulp server?</div><div><br></div><div>Thanks!</div><div><div><br></div></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">вт, 1 сент. 2020 г. в 17:14, Dennis Kliban <<a href="mailto:dkliban@redhat.com" target="_blank">dkliban@redhat.com</a>>:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr">The repoview feature requires the sqlite db to be generated. This  feature generates HTML pages for browsing the repository in a web browser. I believe that users are still able to browse the repository without it, but in that case the HTML listing of directories is generated by the web server each time a user requests it.<br></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Tue, Sep 1, 2020 at 4:53 AM Konstantin M. Khankin <<a href="mailto:khankin.konstantin@gmail.com" target="_blank">khankin.konstantin@gmail.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr">Thank you, that obviously helped. Still would be useful to know the root cause.<div><br></div><div>OTOH, if sqlite creation functionality is not that critical - why would we ever enable something which only consumes time during sync for no benefit?</div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">вт, 1 сент. 2020 г. в 00:26, Dennis Kliban <<a href="mailto:dkliban@redhat.com" target="_blank">dkliban@redhat.com</a>>:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div>Looks like everything is up to date. I have no idea what the root cause is, but according to this comment[0], you can work around the problem by disabling the generation of sqlite db. I am not sure what the exact effect of this will be for the clients that are consuming this content, but the repository will be usable. <br></div><div><br></div><div>[0] <a href="https://pulp.plan.io/issues/2019#note-2" target="_blank">https://pulp.plan.io/issues/2019#note-2</a></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Mon, Aug 31, 2020 at 4:10 PM Konstantin M. Khankin <<a href="mailto:khankin.konstantin@gmail.com" target="_blank">khankin.konstantin@gmail.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"># rpm -qa | grep pulp | sort<br>pulp-admin-client-2.21.3-1.el7.noarch<br>pulp-agent-2.21.3-1.el7.noarch<br>pulp-consumer-client-2.21.3-1.el7.noarch<br>pulp-deb-admin-extensions-1.10.1-1.el7.noarch<br>pulp-deb-plugins-1.10.1-1.el7.noarch<br>pulp-docker-admin-extensions-3.2.6-1.el7.noarch<br>pulp-docker-plugins-3.2.6-1.el7.noarch<br>pulp-puppet-consumer-extensions-2.21.3-1.el7.noarch<br>pulp-puppet-handlers-2.21.3-1.el7.noarch<br>pulp-python-admin-extensions-2.0.4-1.el7.noarch<br>pulp-python-plugins-2.0.4-1.el7.noarch<br>pulp-rpm-admin-extensions-2.21.3-1.el7.noarch<br>pulp-rpm-consumer-extensions-2.21.3-1.el7.noarch<br>pulp-rpm-handlers-2.21.3-1.el7.noarch<br>pulp-rpm-plugins-2.21.3-1.el7.noarch<br>pulp-rpm-yumplugins-2.21.3-1.el7.noarch<br>pulp-selinux-2.21.3-1.el7.noarch<br>pulp-server-2.21.3-1.el7.noarch<br>python-pulp-agent-lib-2.21.3-1.el7.noarch<br>python-pulp-bindings-2.21.3-1.el7.noarch<br>python-pulp-client-lib-2.21.3-1.el7.noarch<br>python-pulp-common-2.21.3-1.el7.noarch<br>python-pulp-deb-common-1.10.1-1.el7.noarch<br>python-pulp-docker-common-3.2.6-1.el7.noarch<br>python-pulp-oid_validation-2.21.3-1.el7.noarch<br>python-pulp-puppet-common-2.21.3-1.el7.noarch<br>python-pulp-python-common-2.0.4-1.el7.noarch<br>python-pulp-repoauth-2.21.3-1.el7.noarch<br>python-pulp-rpm-common-2.21.3-1.el7.noarch<br><div><br></div><div># rpm -qa | grep createrepo<br>createrepo-0.9.9-28.el7.noarch<br>createrepo_c-0.10.0-20.el7.x86_64<br>createrepo_c-libs-0.10.0-20.el7.x86_64<br></div><div><br></div><div># cat /etc/redhat-release <br>CentOS Linux release 7.8.2003 (Core)<br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">пн, 31 авг. 2020 г. в 22:48, Dennis Kliban <<a href="mailto:dkliban@redhat.com" target="_blank">dkliban@redhat.com</a>>:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div>This looks exactly like the issue that was reported here[0].</div><div><br></div><div>What version of pulp are you using? What version of createrepo_c is installed?<br></div><div><br></div><div>[0] <a href="https://pulp.plan.io/issues/2019" target="_blank">https://pulp.plan.io/issues/2019</a></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Mon, Aug 31, 2020 at 3:16 PM Konstantin M. Khankin <<a href="mailto:khankin.konstantin@gmail.com" target="_blank">khankin.konstantin@gmail.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="auto">Hi!<div dir="auto"><br></div><div dir="auto">The issue still persists. Could someone take a look please?</div><div dir="auto"><br></div><div dir="auto">Thanks!</div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">ср, 19 авг. 2020 г., 13:15 Konstantin M. Khankin <<a href="mailto:khankin.konstantin@gmail.com" target="_blank">khankin.konstantin@gmail.com</a>>:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr">Hi!<div><br></div><div>I found that my pulp2-managed mirror of <a href="http://mirror.yandex.ru/centos/7/updates/x86_64" rel="noreferrer" target="_blank">http://mirror.yandex.ru/centos/7/updates/x86_64</a> has not been successfully published since April 30. I ran publish manually and received an error:</div><div><br></div><div>'''</div><div>Generating sqlite files<br>[/]<br>... failed<br>Error occurred during 'sqliterepo_c' execution: Preparing sqlite<br>DBs<br><br>::<br>C_CREATEREPOLIB: Critical: cr_xml_parser_generic: parsing error<br>'/var/cache/pulp/reserved_resource_worker-1@hive.gsk.loc/12257118-33e7-4294-ad68<br>-98e0515f2627/repodata/9e958c09c7880d130ef3321332000f43a4e4e701e416801a0f54313f5<br>766d03b-filelists.xml.gz': not well-formed (invalid token)<br>Parse error<br>'/var/cache/pulp/reserved_resource_worker-1@hive.gsk.loc/12257118-33e7-4294-ad68<br>-98e0515f2627/repodata/9e958c09c7880d130ef3321332000f43a4e4e701e416801a0f54313f5<br>766d03b-filelists.xml.gz' at line: 1884123 (not well-formed (invalid token))<br><div>'''</div><div><br></div><div>I can't open .sqlite files in /tmp from CLI either:</div><div><br></div><div>'''</div><div>-rw-------. 1 apache apache  54066176 Aug 19 15:12 filelists.211JP0.sqlite<br>-rw-------. 1 apache apache 157097984 Aug 19 15:12 primary.PQ3JP0.sqlite<br>-rw-------. 1 apache apache         0 Aug 19 15:12 other.X201JP0.sqlite<br></div><div><br></div><div>[root@hive tmp]# sqlite3 primary.PQ3JP0.sqlite<br>SQLite version 3.7.17 2013-05-20 00:56:22<br>Enter ".help" for instructions<br>Enter SQL statements terminated with a ";"<br>sqlite> .databases<br>Error: file is encrypted or is not a database<br></div><div>'''</div><div><br></div><div>I have multiple repos managed by pulp, some of which originate also from <a href="http://mirror.yandex.ru" rel="noreferrer" target="_blank">mirror.yandex.ru</a>, and they are synced and published normally. --force-full doesn't help.</div><div><br></div><div>What issue could be here?</div><div><br></div><div>Thanks!</div><div><br></div>-- <br><div dir="ltr">Konstantin Khankin<br></div></div></div>
</blockquote></div>
_______________________________________________<br>
Pulp-list mailing list<br>
<a href="mailto:Pulp-list@redhat.com" target="_blank">Pulp-list@redhat.com</a><br>
<a href="https://www.redhat.com/mailman/listinfo/pulp-list" rel="noreferrer" target="_blank">https://www.redhat.com/mailman/listinfo/pulp-list</a></blockquote></div>
</blockquote></div><br clear="all"><div><br></div>-- <br><div dir="ltr">Ханкин Константин<br></div>
</blockquote></div>
</blockquote></div><br clear="all"><div><br></div>-- <br><div dir="ltr">Ханкин Константин<br></div>
</blockquote></div>
</blockquote></div><br clear="all"><div><br></div>-- <br><div dir="ltr">Ханкин Константин<br></div>
</blockquote></div>
</blockquote></div><br clear="all"><div><br></div>-- <br><div dir="ltr" class="gmail_signature">Ханкин Константин<br></div>