<html>
  <head>
    <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
  </head>
  <body>
    <p><br>
    </p>
    <div class="moz-cite-prefix">On 2/14/20 1:09 PM, David Davis wrote:<br>
    </div>
    <blockquote type="cite"
cite="mid:CAHa=2WmpC-+ZOg5dF+RqfbQsQFkj9J1UXUEXchpwfj0ym4gMcQ@mail.gmail.com">
      <meta http-equiv="content-type" content="text/html; charset=UTF-8">
      <div dir="ltr">
        <div>Grant and I met today to discuss importers and exporters[0]
          and we'd like some feedback before we proceed with the design.
          To sum up this feature briefly: users can export a repository
          version from one Pulp instance and import it to another. </div>
        <div><br>
        </div>
        # Master/Detail vs Core
        <div><br>
        </div>
        <div>So one fundamental question is whether we should use a
          Master/Detail approach or just have core control the flow but
          call out to plugins to get export formats.</div>
        <div><br>
        </div>
        <div>To give some background: we currently define Exporters (ie
          FileSystemExporter) in core as Master models. Plugins extend
          this model which allows them to configure or customize the
          Exporter. This was necessary because some plugins need to
          export Publications (along with repository metadata) while
          other plugins who don't have Publications or metadata export
          RepositoryVersions.</div>
        <div><br>
        </div>
        <div>The other option is to have core handle the workflow. The
          user would call a core endpoint and provide a
          RepositoryVersion. This would work because for
          importing/exporting, you wouldn't ever use Publications
          because metadata won't be used for importing back into Pulp.
          If needed, core could provide a way for plugin writers to
          write custom handlers/exporters for content types.</div>
        <div><br>
        </div>
        <div>If we go with the second option, the question then becomes
          whether we should divorce the concept of Exporters and
          import/export. Or do we also switch Exporters from
          Master/Detail to core only?</div>
        <div><br>
        </div>
        <div># Foreign Keys</div>
        <div><br>
        </div>
        <div>Content can be distributed across multiple tables (eg
          UpdateRecord has UpdateCollection, etc). In our export, we
          could either use primary keys (UUIDs) or natural keys to
          relate records. The former assumes that UUIDs are unique
          across Pulp instances. The safer but more complex alternative
          is to use natural keys. This would involve storing a set of
          fields on a record that would be used to identify a related
          record.</div>
        <div><br>
        </div>
        <div># Incremental Exports</div>
        <div><br>
        </div>
        <div>There are two big pieces of data contained in an export:
          the dataset of Content from the database and the artifact
          files. An incremental export cuts down on the size of an
          export by only exporting the differences. However, when
          performing an incremental export, we could still export the
          complete dataset instead of just a set of differences
          (additions/removals/updates). This approach would be simpler
          and it would allow us to ensure that the new repo version
          matches the exported repo version exactly. It would however
          increase the export size but not by much I think--probably
          some number of megabytes at most.</div>
      </div>
    </blockquote>
    <p>If its simper, i would go with that.  Saving even ~100-200 MB
      isn't that big of a deal IMO.  the biggest savings is in the RPM
      content.  <br>
    </p>
    <p><br>
    </p>
    <blockquote type="cite"
cite="mid:CAHa=2WmpC-+ZOg5dF+RqfbQsQFkj9J1UXUEXchpwfj0ym4gMcQ@mail.gmail.com">
      <div dir="ltr">
        <div><br>
        </div>
        <div>[0] <a href="https://pulp.plan.io/issues/6134"
            moz-do-not-send="true">https://pulp.plan.io/issues/6134</a></div>
        <div><br>
        </div>
        <div>
          <div>
            <div dir="ltr" class="gmail_signature"
              data-smartmail="gmail_signature">
              <div dir="ltr">
                <div>
                  <div dir="ltr">
                    <div>
                      <div dir="ltr">
                        <div>David<br>
                        </div>
                      </div>
                    </div>
                  </div>
                </div>
              </div>
            </div>
          </div>
        </div>
      </div>
      <br>
      <fieldset class="mimeAttachmentHeader"></fieldset>
      <pre class="moz-quote-pre" wrap="">_______________________________________________
Pulp-dev mailing list
<a class="moz-txt-link-abbreviated" href="mailto:Pulp-dev@redhat.com">Pulp-dev@redhat.com</a>
<a class="moz-txt-link-freetext" href="https://www.redhat.com/mailman/listinfo/pulp-dev">https://www.redhat.com/mailman/listinfo/pulp-dev</a>
</pre>
    </blockquote>
  </body>
</html>