[smc-discuss] [RFC]Project: Malayalam Autocorrect in openoffice
santhosh.thottingal
santhosh.thottingal at gmail.com
Wed Sep 1 20:55:50 PDT 2010
നിര്ദ്ദേശങ്ങള്ക്കു നന്ദി. പക്ഷേ ആരും ഈ പ്രൊജക്ട് ഏറ്റെടുക്കാന് മുന്നോട്ടു വന്നില്ലല്ലോ.
ഒരു 10 വാക്കെങ്കിലും ഉള്ള ഒരു ഓട്ടോകറക്ട് ഡിക്ഷ്ണറി ആദ്യം ഉണ്ടാക്കണം. എന്നിട്ടതു് ഓപ്പണ്ഓഫീസില് പരീക്ഷിക്കണം. അതു പ്രവര്ത്തിക്കുന്നുണ്ടെങ്കില് സാങ്കേതികമായ കാര്യങ്ങളെല്ലാം ഓകെ ആണെന്നു കരുതാം. ആര്ക്കെങ്കിലും ഇതു ചെയ്യാമോ? നിലവിലുള്ള ഭാഷകളുടെ ഉദാഹരണത്തിനു് ഇംഗ്ലീഷിന്റെ ഡിക്ഷ്ണറി റെഫര് ചെയ്താല് മതി.
നമ്മുടെ നിഘണ്ടുവില് എകദേശം 10000 വാക്കുകളുണ്ടു്. നിലവിലെ സ്പെല്ചെക്ക് ഡിക്ഷ്ണറിയില് 1,40000 വാക്കുകളുണ്ട്. ഇവ രണ്ടും കൂട്ടിച്ചേര്ത്ത് സോര്ട്ട് ചെയ്യണം(by avoiding duplicates). എന്നിട്ടു് ഓരോ വാക്കും എടുത്തു് അതിനു് വരാവുന്ന, സാധാരണ കാണുന്ന അക്ഷരത്തെറ്റുകള് ഉണ്ടോന്നു നോക്കണം. ഉണ്ടെങ്കില് അതു ഓട്ടോകറക്ട് ഡിക്ഷണറിയില് ചേര്ക്കണം.
വേറൊരു നിര്ദ്ദേശം ഇതാണു്: ഇംഗ്ലീഷ് വിക്കിപീഡിയയില് സാധാരണ കാണുന്ന അക്ഷരത്തെറ്റുകള് ലിസ്റ്റ് ചെയ്തിട്ടുണ്ടു്. മലയാളം വിക്കിപീഡിയയ്ക്കും ഇതു ചെയ്യാവുന്നതല്ലേ?
വേറൊന്നു് ഓര്ക്കാനുള്ളതു് മലയാളത്തിലെ പലവാക്കുകളുടെയും എഴുത്തുരീതിയ്ക്കു് ഏകീകൃത സ്വഭാവം ഇല്ല. അദ്ധ്യാപകനും അധ്യാപകനും ശരിയാണെന്നും ഊര്ജവും ഊര്ജ്ജവും ശരിയാണെന്നും ഒന്നു മാത്രമേ ശരിയുള്ളൂവെന്നും പലവാദങ്ങളുണ്ടു്. ഇതില് എന്തു സമീപനമെടുക്കണം?
-സന്തോഷ്
--
സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങ് - എന്റെ കമ്പ്യൂട്ടറിനു് എന്റെ ഭാഷ
സംരംഭം: https://savannah.nongnu.org/projects/smc
വെബ്സൈറ്റ് : http://smc.org.in IRC ചാനല് : #smc-project @ freenode
പിരിഞ്ഞു പോകാന്: smc-discuss-unsubscribe at googlegroups.com
More information about the discuss
mailing list