<div dir="ltr"><div dir="ltr"><div>Hi Julin,</div><div><br></div><div>We do not have a ready to use, open source  speech to text tool for Malayalam as of now.</div><div><br></div><div>But there are works going on in this domain. I am working on a <a href="https://kaldi-asr.org/">Kaldi</a> based solution as an academic researcher. This <a href="https://gitlab.com/kavyamanohar/malayalam-spoken-digit-recognizer">repo </a>demonstrates the development of a spoken digit recognizer for Malayalam. A past attempt on Malayalam ASR using CMUSphinx by Sreenadh is available <a href="https://github.com/sreecodeslayer/ml-am-lm-cmusphinx">here</a>.<br></div><div><br></div><div>SMC has taken initiatives for collecting <a href="https://msc.smc.org.in">Malayalam speech corpus</a> for training general purpose automatic speech recognition (ASR) systems. The audio recorded so far is available <a href="https://gitlab.com/smc/msc">here</a>.<br></div><div> A grapheme to phoneme converter, <a href="https://gitlab.com/smc/mlphon">mlphon</a>  that creates a phonetic lexicon (a dictionary of Malayalam words and its pronunciation) needed for ASR training is another project.  Mlphon is available as a <a href="https://pypi.org/project/mlphon/">Pypi</a> library.</div><div></div><div><br></div><div></div><div>Regards<br></div><div><br></div></div>-- <br><div dir="ltr" class="gmail_signature"><div dir="ltr"><div>Kavya Manohar</div><div>Research Scholar</div><div>College of Engineering Trivandrum<br></div><a href="https://kavyamanohar.com" target="_blank">https://kavyamanohar.com</a><br></div></div></div>