[smc-discuss] Status of Tesseract Malayalam trained data

manoj k manojkmohanme03107 at gmail.com
Fri Oct 18 21:35:35 PDT 2013


ഇതിന്റെ അന്വേഷണത്തിനിടയില്‍ എനിക്ക് ശരിക്കും ഇന്‍സ്പെയേഡ് ആയ ഒരു സാധനം
ഒപ്പം ചേര്‍ക്കുന്നു. :)

അറ്റാച്ച് ചെയ്തിരിക്കുന്ന djvu ഫയല്‍ ഡൗണ്‍ലോഡ് ചെയ്ത് അതില്‍ ctrl+f
(സെര്‍ച്ച്) അടിച്ച് അ എന്ന് കൊടുത്ത് നോക്കൂ. :)
സെര്‍ച്ച് റിസള്‍ട്ട് തരുന്നുണ്ട്. ;) ഈ djvu ഫയല്‍ മലയാളം
വിക്കിഗ്രന്ഥശാലയില്‍ അപ്ലോഡ് ചെയ്ത് ടൈപ്പ് ചെയ്യാനുള്ള
സൂചികാതാളുണ്ടാക്കുമ്പോള്‍ ടെക്സ്റ്റ് ലെയറും താനെ വരുന്നുണ്ട്.
സൊലൂഷന് ആക്യുറസി കുറവാണെങ്കിലും കുറേ നാള്‍ മുമ്പ് ഇത് കണ്ടപ്പോഴുണ്ടായ
സന്തോഷം പറഞ്ഞറിയ്ക്കാന്‍ പറ്റാത്തതാ :)

ടെക്നോളജി ഉണ്ട്. പക്ഷേ ട്രൈയിങ്ങ് ഡാറ്റയുടെ അപര്യാപ്തതയാണ് ടെസറാക്റ്റിന്റെ
പ്രശ്നമെന്നാണ് മനസ്സിലാക്കുന്നത്. കൂടുതല്‍ ഉള്ളിലേക്ക് കടക്കാന്‍ സമയം
കിട്ടിയിട്ടില്ല

2013/10/19 manoj k <manojkmohanme03107 at gmail.com>

> ടെസറാക്റ്റിന്റെ ഇപ്പോഴുള്ള ഒരു സാമ്പിള്‍ ഔട്ട് പുട്ട്
> സ്ക്രീന്‍ഷോട്ടിലുണ്ട്.
>
>
> 2013/10/19 Baiju M <baiju.m.mail at gmail.com>
>>
>>> ഈ കണ്ണികള്‍ക്കായി നന്നി.  എന്റെ നോട്ടുകള്‍ ഞാനിവിടെ ഇടുന്നുണ്ട്.
>>> http://etherpad.wikimedia.org/p/mal-ocr
>>>
>>> Regards,
>>> Baiju M
>>>
>>
>> Manoj.K/മനോജ്.കെ
>> www.manojkmohan.com
>>
>
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.smc.org.in/pipermail/discuss-smc.org.in/attachments/20131019/4700de22/attachment-0002.htm>
-------------- next part --------------
A non-text attachment was scrubbed...
Name: booknewml.djvu
Type: application/octet-stream
Size: 7396 bytes
Desc: not available
URL: <http://lists.smc.org.in/pipermail/discuss-smc.org.in/attachments/20131019/4700de22/attachment.obj>


More information about the discuss mailing list