[smc-discuss] [RFC]Project: Malayalam Autocorrect in openoffice

santhosh.thottingal santhosh.thottingal at gmail.com
Wed Sep 1 20:55:50 PDT 2010


നിര്‍ദ്ദേശങ്ങള്‍ക്കു നന്ദി. പക്ഷേ ആരും ഈ പ്രൊജക്ട് ഏറ്റെടുക്കാന്‍ മുന്നോട്ടു വന്നില്ലല്ലോ.  

ഒരു 10 വാക്കെങ്കിലും ഉള്ള ഒരു ഓട്ടോകറക്ട് ഡിക്ഷ്ണറി ആദ്യം ഉണ്ടാക്കണം. എന്നിട്ടതു് ഓപ്പണ്‍ഓഫീസില്‍ പരീക്ഷിക്കണം.  അതു പ്രവര്‍ത്തിക്കുന്നുണ്ടെങ്കില്‍ സാങ്കേതികമായ കാര്യങ്ങളെല്ലാം ഓകെ ആണെന്നു കരുതാം. ആര്‍ക്കെങ്കിലും ഇതു ചെയ്യാമോ? നിലവിലുള്ള ഭാഷകളുടെ ഉദാഹരണത്തിനു് ഇംഗ്ലീഷിന്റെ ഡിക്ഷ്ണറി റെഫര്‍ ചെയ്താല്‍ മതി.

നമ്മുടെ നിഘണ്ടുവില്‍ എകദേശം 10000 വാക്കുകളുണ്ടു്. നിലവിലെ സ്പെല്‍ചെക്ക് ഡിക്ഷ്ണറിയില്‍ 1,40000 വാക്കുകളുണ്ട്. ഇവ രണ്ടും കൂട്ടിച്ചേര്‍ത്ത് സോര്‍ട്ട് ചെയ്യണം(by avoiding duplicates). എന്നിട്ടു് ഓരോ വാക്കും എടുത്തു് അതിനു് വരാവുന്ന, സാധാരണ കാണുന്ന അക്ഷരത്തെറ്റുകള്‍ ഉണ്ടോന്നു നോക്കണം. ഉണ്ടെങ്കില്‍ അതു ഓട്ടോകറക്ട് ഡിക്ഷണറിയില്‍ ചേര്‍ക്കണം.

വേറൊരു നിര്‍ദ്ദേശം ഇതാണു്: ഇംഗ്ലീഷ് വിക്കിപീഡിയയില്‍ സാധാരണ കാണുന്ന അക്ഷരത്തെറ്റുകള്‍ ലിസ്റ്റ് ചെയ്തിട്ടുണ്ടു്. മലയാളം വിക്കിപീഡിയയ്ക്കും ഇതു ചെയ്യാവുന്നതല്ലേ?

വേറൊന്നു് ഓര്‍ക്കാനുള്ളതു് മലയാളത്തിലെ പലവാക്കുകളുടെയും എഴുത്തുരീതിയ്ക്കു് ഏകീകൃത സ്വഭാവം ഇല്ല.  അദ്ധ്യാപകനും അധ്യാപകനും ശരിയാണെന്നും ഊര്‍ജവും ഊര്‍ജ്ജവും ശരിയാണെന്നും ഒന്നു മാത്രമേ ശരിയുള്ളൂവെന്നും പലവാദങ്ങളുണ്ടു്. ഇതില്‍ എന്തു സമീപനമെടുക്കണം?


-സന്തോഷ്

-- 
സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങ് - എന്റെ കമ്പ്യൂട്ടറിനു് എന്റെ ഭാഷ 
സംരംഭം: https://savannah.nongnu.org/projects/smc
വെബ്‌സൈറ്റ് : http://smc.org.in  IRC ചാനല്‍ : #smc-project @ freenode
പിരിഞ്ഞു പോകാന്‍: smc-discuss-unsubscribe at googlegroups.com


More information about the discuss mailing list