[smc-discuss] ചില്ലക്ഷരങ്ങളുടെ രാഷ്ട്രീയം

Jayadevan Raja jayadevanraja at gmail.com
Tue Jan 18 09:00:07 PST 2011


@Santhosh: Your reply was really informative, detailed and excellent,
showing the major concerns of people who use unicode, around the world.

But the implementation of Unicode string searches and comparisons in text
processing software must take into account the presence of equivalent code
points. In the absence of this feature, users searching for a particular
code point sequence would be unable to find other visually indistinguishable
glyphs that have a different, but canonically equivalent, code point
representation.

So, aren't atomic chills and non-atomic (composite) chills in Malayalam
canonically equivalent? If we use "Normalization Form Canonical Composition"
everywhere, and consider the chills to be composite characters, isn't the
problem solved? Isn't the same issue there in almost all major scripts other
than basic Latin?

2011/1/18 Santhosh Thottingal <santhosh.thottingal at gmail.com>

> 2011/1/17 Jayadevan Raja <jayadevanraja at gmail.com>:
> > I think that there is no Malayalam font which uses any smart-font
> technology
> > (I might be wrong, but I have not found one).
> >
> > If we use a technology like SIL
> > (
> http://scripts.sil.org/cms/scripts/page.php?site_id=nrsi&cat_id=RenderingGraphite
> ),
> > won't all problems be solved?
>
> Problem is with encoding. Font, Rendering Engine are higher level
> applications or user space applications and can't solve problems in
> lower level.
>
> But that require some explanation, since I recently saw an argument
> like- "high level applications can solve the encoding issues of
> Malayalam".
>
> It is true that what ever we cannot achieve(or complex) in low level
> programming/technology can be done in High level user space
> applications.
>
>
> ന്റയുടെ കാര്യമെടുക്കുക. ന് + റ,  ന്‍+റ(kartika font) , ൻ(atomic)+ ് +
> റ തുടങ്ങിയ യുണിക്കോഡ് നിര്‍വചനത്തിന്റെതായ പ്രശ്നങ്ങളുണ്ടു്. ആളുകള്‍ പല
> രീതിയില്‍ ന്റ എഴുതും. അപ്പോള്‍ ഒന്നാമത്തെ പ്രശ്നം- എല്ലാം ഒരു പോലെ
> കാണിക്കാന്‍ ഫോണ്ടുകള്‍ വേണം. ഇതത്ര പ്രശ്നമുള്ള കാര്യമല്ല- ഫോണ്ട്
> ഫോര്‍ജ് എടുത്ത് ഒരു 5 മിനിറ്റില്‍ ഈ മൂന്നും ഒരു പോലെയാക്കാം.
> ആളുകള്‍ക്ക് സന്തോഷമാകും. ഇതു ചെയ്യാത്ത ഫോണ്ട് ഡെവലപ്പര്‍മാരെ
> പിന്തിരിപ്പന്‍മാരെന്നു വിളിക്കും. ഇതാണു് ഒരു  "ഹയര്‍ ലെവല്‍ ഫിക്സ്".
>  ഈ ഫോണ്ടുകള്‍  ഒക്കെ വെച്ച് തോന്നിയപോലെ കുറേ  കാലം
> എഴുതിക്കഴിയുമ്പോള്‍ ഒരു വെബ്സൈറ്റ് വരുന്നു. കുറേ മലയാളം പാട്ടുകളൊക്കെ
> ഒക്കെ ഉള്ള ഒരു വെബ്‌സൈറ്റാണെന്നു കരുതുക. ഒരാള്‍ പോയി "നിലാവിന്റെ
> പൂങ്കാവില്‍" എന്നു തുടങ്ങുന്ന പാട്ടിനായി തിരയുന്നു. കിട്ടുന്നില്ല.
> വെബ്‌സൈറ്റ് നടത്തുന്ന ഒരാളോടു പരാതിപ്പെട്ടപ്പോള്‍ അയാള്‍ സെര്‍ച്ച്
> ചെയ്തു റിസള്‍ട്ട് കിട്ട്യ സ്ക്രീന്‍ഷോട്ട് കാണിക്കുന്നു. ഇതെന്തു
> മറിമായം? അന്വേഷണത്തിനൊടുവില്‍ മനസ്സിലാവുന്നു സൈറ്റിലുള്ള പാട്ടിലെ ന്റ
> ൻ(atomic)+ ് + റ  എന്ന രീതിയിലാ എഴുതിയിരിക്കുന്നതു്.  ഉടന്‍ വരുന്നു
> വേറൊരു ഹൈ ലെവല്‍ ഫിക്സ് - വെബ്സൈറ്റില്‍ ആരെഴുതിയാലും ഉടന്‍ പിടിച്ച്
> ൻ(atomic)+ ് + റ  ആക്കും. അപ്പൊ പിന്നെ വെബ്‌സൈറ്റീലെ ഡാറ്റയൊക്കെ ഒരു
> പോലെയായല്ലോ? "നിലാവിന്റെ പൂങ്കാവില്‍" പ്രശ്നമൊന്നുമില്ല. ഈ ഫിക്സ്
> ചെയ്യാതെ കിടക്കുന്ന വേറൊരു പാട്ടു സൈറ്റിനെ കുറ്റം പറയാന്‍ ചാന്‍സായി.
> കുറച്ചു കാലം കഴിഞ്ഞ് വേറൊരാള്‍ ഇന്റര്‍നെറ്റില്‍ ഈ പാട്ടിനുവേണ്ടി
> സെര്‍ച്ച് ചെയ്തു. ഈ സൈറ്റിലെക്ക് ലിങ്കില്ല. പക്ഷേ നേരിട്ടു ചെന്നപ്പൊ
> ഉണ്ടു താനും. പ്രശ്നത്തിന്റെ അവസാനം മനസ്സിലാവുന്നു നമ്മള്‍ പിടിച്ചു
> മാറ്റുന്ന പോലെ ഗൂഗിള്‍ ന്റയെ  മാറ്റുന്നില്ല.  ഇവിടെ  നമുക്ക് ഫിക്സാന്‍
> പറ്റില്ല. ഗൂഗിളു ഫിക്സണം.  ഇനി ഗൂഗിളിന്റെ ദയ. ഇനിയും ഒരാള്‍ വന്നു
> ചോദിക്കുന്നു - ഏഴാം ക്ലാസില്‍ ടൈപ്പിങ്ങ് പഠിപ്പിക്കുന്നതു് ന്+റ = ന്റ
> എന്നല്ലേ , ഇതെന്താ ഈ സൈറ്റില്‍ ഇങ്ങനെ? "അതു സാരമില്ല, നിങ്ങള്‍
> ഇന്‍സ്ക്രിപ്റ്റൊക്കെ മറന്നു് ട്രാന്‍സ്ലിറ്ററേഷന്‍ ഉപയോഗിക്കൂ.
> ഇന്റലിജന്റായി അതു നോക്കും കാര്യങ്ങള്‍."
>
> മുകളില്‍ പറഞ്ഞതു് ചില്ലക്ഷരങ്ങളുടെ കാര്യത്തില്‍ ഒന്നു
> മാറ്റിയെഴുതിയാല്‍ യഥാര്‍ത്ഥത്തില്‍ നടന്ന ഒരു ഹയര്‍ലെവല്‍ ഫിക്സിന്റെ
> ചിത്രം കിട്ടും.
> നമ്മളും ചെയ്തിട്ടുണ്ട്. fix-ml എന്ന ഫയര്‍ഫോക്സ് എക്സ്റ്റന്‍ഷന്‍
> എന്താണു് ചെയ്യുന്നതു്?
>
> പറഞ്ഞു വന്നതു് , ഇതെല്ലാം മുറിവൈദ്യമേ ആവുന്നുള്ളൂ എന്നാണു്.
>
> What is the purpose of standards in encoding? It allows application
> developers to use common data interchange and processing so that one
> can use and process the data created by somebody else.
> When it is well defined, the low level applications/programming
> languages/technology can implement and allow any high level
> applications to use it. ie,  It is not required to solve the same
> problem by each and every application developer.
>
> നേരത്തെ പറഞ്ഞ സാങ്കല്‍പിക സന്ദര്‍ഭം നോക്കുക. ഒരു സൈറ്റ്  ഒരു പ്രശ്നം
> അവരുടെ രീതിയില്‍ സോള്‍വ് ചെയ്തു. ഇതേ പ്രശ്നം വേറൊരു സൈറ്റിനും
> ഒഴിവാക്കേണ്ടിവരുന്നു. മലയാളത്തിലെ ഈ ഗുലുമാലുകള്‍ അറിയാത്തവര്‍ പ്രത്യേക
> ലോജിക്കൊന്നുമില്ലാതെ സാധാരണ രീതിയില്‍ കോഡെഴുതും. ഇതൊക്കെ
> നോക്കിയിട്ടാണു് ടെക്നോളജിയുടെ ഏതു ലെവലില്‍ ഏതൊക്കെ ചെയ്യണമെന്നു
> തീരുമാനിക്കുന്നതു്.
>
> മലയാളഭാഷയോടു യാതൊരു ഉത്തരവാദിത്വമില്ലാത്തവര്‍ ഒട്ടും സുതാര്യമല്ലാത്ത
> രീതിയില്‍ തീരുമാനങ്ങളെടുക്കുകയും ഈ തീരുമാനങ്ങള്‍ അനുസരിച്ചു് ഹയര്‍
> ലെവല്‍ ഫിക്സുകള്‍ തേടുകയാണോ നമ്മള്‍ ചെയ്യേണ്ടതു്? മലയാളത്തിനു
> മാത്രമായി അപ്ലിക്കേഷനുകളില്‍ പ്രത്യേക കോഡെഴുതണോ? ഒരു അപ്ലികേഷന്‍
> internationalize ചെയ്യാന്‍ മലയാള എന്‍കോഡിങ്ങ് വിവാദങ്ങളില്‍ ഗവേഷണം
> നടത്തണോ?
>
> അതോ സ്റ്റാന്‍ഡേഡ് നേരെയെക്കാന്‍ കഴിയും വണ്ണം ഇടപെടണോ?
> എന്‍കോഡിങ്ങ് പ്രശ്നങ്ങളും , സുതാര്യമല്ലാത്ത ഒരു സ്റ്റാന്‍ഡേഡും ഒരേ
> ഗൌരവത്തോടെ സമീപിക്കേണ്ട പ്രശ്നങ്ങളാണു്. ചില്ലുകള്‍ ഒരു പ്രശ്നം മാത്രം
> ആണു്.
>
> -സന്തോഷ്
> _______________________________________________
> Swathanthra Malayalam Computing discuss Mailing List
> Project: https://savannah.nongnu.org/projects/smc
> Web: http://smc.org.in | IRC : #smc-project @ freenode
> discuss at lists.smc.org.in
> http://lists.smc.org.in/listinfo.cgi/discuss-smc.org.in
>
>


-- 
Thanking You,
Jayadevan V
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.smc.org.in/pipermail/discuss-smc.org.in/attachments/20110118/8e3119f8/attachment-0003.htm>


More information about the discuss mailing list