[smc-discuss] Status of Tesseract Malayalam trained data

Baiju M baiju.m.mail at gmail.com
Fri Oct 18 20:47:45 PDT 2013


2013/10/17 Anivar Aravind <anivar.aravind at gmail.com>:
>
> On Thu, Oct 17, 2013 at 10:34 AM, Baiju M <baiju.m.mail at gmail.com> wrote:
>>
>> Hi,
>>
>> Can someone give some pointers about Tesseract Malayalam trained data ?
>> I can see one file in my system here:
>> /usr/share/tesseract/tessdata/mal.traineddata
>
>
> http://wiki.smc.org.in/OCR
> http://hacking-tesseract.blogspot.in/2012/11/why-foss-indic-ocr-is-now-feasible.html
> മനോജ് തന്നതല്ലാതെ ഒരു ട്രെയിനിങ്ങ് ഡാറ്റ ഇവിടെയുണ്ട് . ഇതു് സിഡാക്ക്
> ടെസറാക്റ്റ് ഫോര്‍ക്ക് ചെയ്ത പരിചിത് എന്ന പ്രൊജക്റ്റിന്റേതാണ്
> http://code.google.com/p/parichit/downloads/detail?name=mal.traineddata

ഈ കണ്ണികള്‍ക്കായി നന്നി.  എന്റെ നോട്ടുകള്‍ ഞാനിവിടെ ഇടുന്നുണ്ട്.
http://etherpad.wikimedia.org/p/mal-ocr

Regards,
Baiju M


More information about the discuss mailing list