[smc-discuss] Status of Tesseract Malayalam trained data
manoj k
manojkmohanme03107 at gmail.com
Fri Oct 18 21:35:35 PDT 2013
ഇതിന്റെ അന്വേഷണത്തിനിടയില് എനിക്ക് ശരിക്കും ഇന്സ്പെയേഡ് ആയ ഒരു സാധനം
ഒപ്പം ചേര്ക്കുന്നു. :)
അറ്റാച്ച് ചെയ്തിരിക്കുന്ന djvu ഫയല് ഡൗണ്ലോഡ് ചെയ്ത് അതില് ctrl+f
(സെര്ച്ച്) അടിച്ച് അ എന്ന് കൊടുത്ത് നോക്കൂ. :)
സെര്ച്ച് റിസള്ട്ട് തരുന്നുണ്ട്. ;) ഈ djvu ഫയല് മലയാളം
വിക്കിഗ്രന്ഥശാലയില് അപ്ലോഡ് ചെയ്ത് ടൈപ്പ് ചെയ്യാനുള്ള
സൂചികാതാളുണ്ടാക്കുമ്പോള് ടെക്സ്റ്റ് ലെയറും താനെ വരുന്നുണ്ട്.
സൊലൂഷന് ആക്യുറസി കുറവാണെങ്കിലും കുറേ നാള് മുമ്പ് ഇത് കണ്ടപ്പോഴുണ്ടായ
സന്തോഷം പറഞ്ഞറിയ്ക്കാന് പറ്റാത്തതാ :)
ടെക്നോളജി ഉണ്ട്. പക്ഷേ ട്രൈയിങ്ങ് ഡാറ്റയുടെ അപര്യാപ്തതയാണ് ടെസറാക്റ്റിന്റെ
പ്രശ്നമെന്നാണ് മനസ്സിലാക്കുന്നത്. കൂടുതല് ഉള്ളിലേക്ക് കടക്കാന് സമയം
കിട്ടിയിട്ടില്ല
2013/10/19 manoj k <manojkmohanme03107 at gmail.com>
> ടെസറാക്റ്റിന്റെ ഇപ്പോഴുള്ള ഒരു സാമ്പിള് ഔട്ട് പുട്ട്
> സ്ക്രീന്ഷോട്ടിലുണ്ട്.
>
>
> 2013/10/19 Baiju M <baiju.m.mail at gmail.com>
>>
>>> ഈ കണ്ണികള്ക്കായി നന്നി. എന്റെ നോട്ടുകള് ഞാനിവിടെ ഇടുന്നുണ്ട്.
>>> http://etherpad.wikimedia.org/p/mal-ocr
>>>
>>> Regards,
>>> Baiju M
>>>
>>
>> Manoj.K/മനോജ്.കെ
>> www.manojkmohan.com
>>
>
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.smc.org.in/pipermail/discuss-smc.org.in/attachments/20131019/4700de22/attachment-0002.htm>
-------------- next part --------------
A non-text attachment was scrubbed...
Name: booknewml.djvu
Type: application/octet-stream
Size: 7396 bytes
Desc: not available
URL: <http://lists.smc.org.in/pipermail/discuss-smc.org.in/attachments/20131019/4700de22/attachment.obj>
More information about the discuss
mailing list