[smc-discuss] മലയാളം ഒസിആര്‍ നിര്‍മിക്കാന്‍

Anivar Aravind anivar at movingrepublic.org
Mon Nov 26 20:54:41 PST 2007


കഴിഞ്ഞ ത്രെഡ് സെര്‍ച്ച് ചെയ്ത് മലയാളം ഒസിആര്‍ നിര്‍മ്മിക്കാനുള്ള മോഹവുമായി വരുന്നവരോട്

ഇന്ന് മലയാളത്തിന് ഏറ്റവും ഉചിതമായത് പുതിയ പൂര്‍ണ്ണ  ഒസിആര്‍ നിര്‍മ്മാണമല്ല.

ഇന്ന്  ഉപയോഗിക്കാവുന്ന ഏറ്റവും നല്ല വഴി  tesseract-ocr ന് മലയാളം സപ്പോര്‍ട്ട് 
ഉണ്ടാക്കുകയെന്നതാണ്
http://code.google.com/p/tesseract-ocr/

tesseract-ocr  നല്ല ഒരു എന്‍ജിനാണ്  പൂര്‍ണ്ണമായും യൂണിക്കോഡ് പിന്തുണയുമുണ്ട്.   ഇന്‍ഡിക് 
പിന്തുണ ചേര്‍ക്കേണ്ടി വന്നേയ്ക്കും . ഇതിന്റെ ഫീച്ചറുകളറിയാന്‍ 
http://tesseract-ocr.googlecode.com/files/TesseractOSCON.pdf കാണുക

ഇത് Apache  ലൈസന്‍സാണ് ഉപയോഗിക്കുന്നത്.

ഗൂഗിളിന്റെ ഒസിആര്‍ ഓപ്പസ് പോലുള്ള പ്രൊജക്റ്റുകളുടേയും അടിത്തറ tesseract-ocr ആണ്.

അനിവര്‍

--~--~---------~--~----~------------~-------~--~----~
സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങ് - എന്റെ കമ്പ്യൂട്ടറിന് എന്റെ ഭാഷ
പിരിഞ്ഞു പോകാന്‍: smc-discuss-unsubscribe at googlegroups.com
സംരംഭം: https://savannah.nongnu.org/projects/smc
-~----------~----~----~----~------~----~------~--~---



More information about the discuss mailing list