<div dir="ltr"><span style="font-family:arial,sans-serif;font-size:13px">Hello,</span><div style="font-family:arial,sans-serif;font-size:13px">I am Karan, a research student of IIIT Hyderabad and I am working primarily in Machine Translation and have also worked with pocket sphinx and at&t watson to build ASR for Hindi and Bengali as a part of SEECAT Project</div>
<div style="font-family:arial,sans-serif;font-size:13px"><br></div><div style="font-family:arial,sans-serif;font-size:13px"><a href="http://bridge.cbs.dk/platform/?q=SEECAT" target="_blank">http://bridge.cbs.dk/platform/?q=SEECAT</a><br>
</div><div style="font-family:arial,sans-serif;font-size:13px"><br></div><div style="font-family:arial,sans-serif;font-size:13px">We also worked on making ASR for malayalam by Bootstraping from Hindi, but the results were not good. actually worse( like 18% word accuracy )</div>
<div style="font-family:arial,sans-serif;font-size:13px"><br></div><div style="font-family:arial,sans-serif;font-size:13px">Do we have resources available ?</div><div style="font-family:arial,sans-serif;font-size:13px">1. Phonetic Dictionary ( phones need to mapped to English Phones, if we are using Sphinx)</div>
<div style="font-family:arial,sans-serif;font-size:13px">2. We can train a basic model from the dictionary and get grapheme to phoneme mappings for all the words in the language model too. Thus creating a bigger phonetic dictionary.</div>
<div style="font-family:arial,sans-serif;font-size:13px"><br></div><div style="font-family:arial,sans-serif;font-size:13px">It will be great, if i could get guidance from where to start with ?</div><div style="font-family:arial,sans-serif;font-size:13px">
<br></div><div style="font-family:arial,sans-serif;font-size:13px"><br></div><div style="font-family:arial,sans-serif;font-size:13px">Regards,</div><div style="font-family:arial,sans-serif;font-size:13px">Karan Singla</div>
<div style="font-family:arial,sans-serif;font-size:13px">LTRC, IIIT-Hyderabad</div></div>