<br><br>
<div><span class="gmail_quote">2006/1/16, Gregory Machin <<a href="mailto:gregory.machin@gmail.com">gregory.machin@gmail.com</a>>:</span>
<blockquote class="gmail_quote" style="PADDING-LEFT: 1ex; MARGIN: 0px 0px 0px 0.8ex; BORDER-LEFT: #ccc 1px solid">I agree with you, but the boss wants ocr.. I think i will leave hime to figure is out I have to much coding to do .. lol ...
<br><br>thanks for the input .. have a grate day .. 
<div><span class="e" id="q_108d23dce4db40cd_1"><br><br>
<div><span class="gmail_quote">On 1/13/06, <b class="gmail_sendername">Bill Rugolsky Jr.</b> <<a onclick="return top.js.OpenExtLink(window,event,this)" href="mailto:brugolsky@telemetry-investments.com" target="_blank">
brugolsky@telemetry-investments.com</a>> wrote:</span> 
<blockquote class="gmail_quote" style="PADDING-LEFT: 1ex; MARGIN: 0pt 0pt 0pt 0.8ex; BORDER-LEFT: rgb(204,204,204) 1px solid">On Fri, Jan 13, 2006 at 10:47:02AM +0000, Paul F. Johnson wrote:<br>> Grab a copy of gocr, compile and install (it's not in FE which is odd).
<br>> When you scan, ensure it's at as high a resolution as possible (minimum <br>> in my experience of 300 dpi) and grey scaled.<br>><br>> Use either gimp or xsane to grab the scan and tell gocr to do it's<br>
> business.<br>><br>> OCR is not an exact science and you will really need to sit down and go <br>> through the scanned text to ensure that the numbers scanned are correct<br>> (very easy to spot, you may have @ instead of 0, l for 1 and the such).
<br>> Save the file generated. You may then need to either write a script to <br>> delimit using " " as the target or feed it into emacs and then search<br>> and replace " " for "," - save.
<br><br>Sadly, in my (limited) experience, none of the free software solutions <br>such as Gocr or Clara OCR is really up to the task.  The leading<br>proprietary packages are vastly superior.  Some of them have free 30-day
<br>evaluations.<br><br>With a proper setup for lots of automated training, Clara might be able <br>to do the job.  Especially if you do some image morphology (using, e.g.,<br>GIMP) to clean up the scans.  But you'll have to do some serious work.
<br><br>A tried and true technique that avoids using proprietary software <br>is to simply pay multiple people to type the whole thing, and then<br>reconcile the differences (or use majority voting). :-)<br><br>Regards,<br>
<br>        Bill Rugolsky<br></blockquote></div><br><br clear="all"><br>-- <br></span></div>
<div><span class="e" id="q_108d23dce4db40cd_2">Gregory Machin<br><a onclick="return top.js.OpenExtLink(window,event,this)" href="mailto:greg@linuxpro.co.za" target="_blank">greg@linuxpro.co.za</a><br><a onclick="return top.js.OpenExtLink(window,event,this)" href="mailto:gregory.machin@gmail.com" target="_blank">
gregory.machin@gmail.com</a><br><a onclick="return top.js.OpenExtLink(window,event,this)" href="http://www.linuxpro.co.za/" target="_blank">www.linuxpro.co.za</a> <br><a onclick="return top.js.OpenExtLink(window,event,this)" href="http://www.exponent.co.za/" target="_blank">
www.exponent.co.za</a><br>Web Hosting Solutions<br>Scalable Linux Solutions <br><a onclick="return top.js.OpenExtLink(window,event,this)" href="http://www.iberry.info/" target="_blank">www.iberry.info</a> (support and admin)
<br><br>+27 72 524 8096 </span></div><br>--<br>fedora-list mailing list<br><a onclick="return top.js.OpenExtLink(window,event,this)" href="mailto:fedora-list@redhat.com">fedora-list@redhat.com</a><br>To unsubscribe: <a onclick="return top.js.OpenExtLink(window,event,this)" href="https://www.redhat.com/mailman/listinfo/fedora-list" target="_blank">
https://www.redhat.com/mailman/listinfo/fedora-list</a></blockquote>
<div> </div>
<div> </div>
<div>Thats another reason to get the best available solution packaged into extras... if its beeing widely used its probably beeing improved at a faster rate.</div>
<div> </div>
<div>regards,</div>
<div>Rudolf Kastl</div>
<div> </div><br> </div><br>