<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html style="direction: ltr;">
<head>
  <meta content="text/html;charset=UTF-8" http-equiv="Content-Type">
</head>
<body style="direction: ltr;" bgcolor="#ffffff" text="#000000">
<p>Hi all,<span></span></p>
<p style="margin-bottom: 0cm; margin-top: 0pt;"><span></span></p>
<span><br>
<style type="text/css">blockquote {color: navy !important; background-color: RGB(245,245,245) !important; padding: 0 15 10 15 !important; margin: 15 0 0 0; border-left: #1010ff 2px solid;}  blockquote blockquote {color: maroon !important; background-color: RGB(235,235,235) !important; border-left-color:maroon !important}  blockquote blockquote blockquote {color: green !important; background-color: RGB(225,225,225) !important; border-left-color:teal !important}  blockquote blockquote blockquote blockquote {color: purple !important; background-color: RGB(215,215,215) !important; border-left-color: purple !important}  blockquote blockquote blockquote blockquote blockquote {color: teal !important; background-color: RGB(205,205,205) !important; border-left-color: green !important}</style><i><b>Jerry
James <a class="moz-txt-link-rfc2396E"
 href="mailto:loganjerry@gmail.com"><loganjerry@gmail.com></a></b></i>
wrote on ۰۹/۰۳/۲۶ 07:16:47:</span><br>
<blockquote
 style="border-left: 2px solid rgb(16, 16, 255); color: navy; background-color: rgb(245, 245, 245); padding-left: 15px;"
 cite="mid:870180fe0903251946s59ab8e56q31e58f28dbc36f23@mail.gmail.com"
 type="cite">
  <pre wrap="">On Wed, Mar 25, 2009 at 6:17 PM, Olivier Galibert <a
 class="moz-txt-link-rfc2396E" href="mailto:galibert@pobox.com"><galibert@pobox.com></a> wrote:
  </pre>
  <blockquote type="cite">
    <pre wrap="">For speech recognition, software is only part of the problem and,
fundamentally, the easiest one (take the algorithms, implement them,
optimize/debug at will). �The real problem is the data needed to build
the models to feed the algorithms. �There isn't as far as I know any
reasonable set of corpus available under an open source license usable
to build a decent speech recognizer. �Which makes open source speech
recognition something not doable yet.
    </pre>
  </blockquote>
  <pre wrap=""><!---->
There are some small databases available [1], although admittedly too
small for accurate general purpose use.  There are some models
available [2], built from databases which are not themselves
redistributable.  There are also a number of model-building tools
available [3-5], which may be sufficient for small command-and-control
tasks.

But you are right.  For general-purpose voice recognition, we don't
have the data we need.  Still, I think it may be worth putting the
software in place so that those who wish to purchase licenses to
commercial data have everything else they need, and to encourage the
production of better quality free data [6].
  </pre>
</blockquote>
I also think that making the software available has a considerable
effect in encouraging people to generate free data. When speech
recognition software is available, community will be encouraged to
generate data to make it more robust. But people will not generate
required data when they can use it already!<br>
<br>
I have not much free time, but I'm interested to help you in this
direction if I can. :) <br>
<br>
Good luck,<br>
Hedayat<br>
<blockquote
 style="border-left: 2px solid rgb(16, 16, 255); color: navy; background-color: rgb(245, 245, 245); padding-left: 15px;"
 cite="mid:870180fe0903251946s59ab8e56q31e58f28dbc36f23@mail.gmail.com"
 type="cite">
  <pre wrap="">References:
[1] <a class="moz-txt-link-freetext"
 href="http://www.speech.cs.cmu.edu/databases/">http://www.speech.cs.cmu.edu/databases/</a>
[2] <a class="moz-txt-link-freetext"
 href="http://www.speech.cs.cmu.edu/sphinx/models/">http://www.speech.cs.cmu.edu/sphinx/models/</a>
[3] <a class="moz-txt-link-freetext"
 href="http://www.speech.sri.com/projects/srilm/">http://www.speech.sri.com/projects/srilm/</a>
[4] <a class="moz-txt-link-freetext"
 href="http://cmusphinx.sourceforge.net/html/download.php#SphinxTrain">http://cmusphinx.sourceforge.net/html/download.php#SphinxTrain</a>
[5] <a class="moz-txt-link-freetext"
 href="http://cmusphinx.sourceforge.net/html/download.php/#cmulclmtk">http://cmusphinx.sourceforge.net/html/download.php/#cmulclmtk</a>
[6] <a class="moz-txt-link-freetext" href="http://www.voxforge.org/">http://www.voxforge.org/</a>
  </pre>
</blockquote>
</body>
</html>