On 8/16/07, <b class="gmail_sendername">seth vidal</b> <<a href="mailto:skvidal@fedoraproject.org">skvidal@fedoraproject.org</a>> wrote:<div><span class="gmail_quote"></span><br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<br>Colin,<br> This is with all sincerity and not at all meant to be dismissive: If<br>you have the time to automate this I think we'll be glad to listen.</blockquote><div><br>There are a lot of components to automation of this kind of thing; in fact people have made entire companies and product lines around (as far as I can tell) essentially this problem:  
<a href="http://www.blackducksoftware.com/">http://www.blackducksoftware.com/</a><br><br>However, I was fairly sure there had to already be something open source out there to use as a start.  My initial googling wasn't too successful (a lot of things called licenses), but then I had the bright idea to add "Debian" to my search.  Turns out there's a license analyzing script in one of their packages:
<br><a href="http://packages.debian.org/unstable/devel/devscripts">http://packages.debian.org/unstable/devel/devscripts</a><br><br>There is also: <a href="http://www.murrayc.com/blog/permalink/2006/10/04/debian-repository-analyzer-for-license-compliance/">
http://www.murrayc.com/blog/permalink/2006/10/04/debian-repository-analyzer-for-license-compliance/</a><br>Which looks kind of frightening but maybe useful.<br><br>The Debian script supports far fewer licenses the Fedora wiki page on this topic; however, it would probably be pretty useful to run over the whole source tree as a start; I bet you'd find a number of cases where things today are specified just as GPL but have some other stuff.
<br><br>Moving more advanced from that, associate the wiki license list set with a list of fuzzy text segments combined with regular expressions.<br></div></div>