To register a new account on this wiki, contact us

സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങ്/സുറുമയിട്ട പാംഗോയും ചില സംശയങ്ങളും: Difference between revisions

From FSCI Wiki
Jump to navigation Jump to search
 
No edit summary
 
(One intermediate revision by the same user not shown)
Line 1: Line 1:
#REDIRECT [[Main Memory Database Systems]]
==സുറുമയിട്ട പാംഗോയും ചില സംശയങ്ങളും==
 
സുറുമയ്ക്ക് മലയാളം എന്‍കോഡിങ്ങുമായി യാതൊരു ബന്ധവുമില്ല. സുറുമ പാംഗോ ചിത്രീകരണ എഞ്ചിനിലാണ് മാറ്റം വരുത്തുന്നത്. നേരത്തെ എന്‍കോഡ് ചെയ്ത ടെക്സ്റ്റ് ചിത്രീകരിയ്ക്കുക എന്നത് മാത്രമാണ് പാംഗോ ചെയ്യുന്നത്. സുറുമയിട്ടാലും ഇല്ലെങ്കിലും ടെക്സ്റ്റ് എന്‍കോഡിങ്ങിലൊരു മാറ്റവുമുണ്ടാകില്ല. മൈക്രോസോഫ്റ്റിന്റെ അക്ഷരരൂപ സ്റ്റാന്‍ഡേൈര്‍ഡില്‍ '്യ, ്ര, ്വ' എന്നിവ വ്യഞ്ജനാക്ഷരങ്ങളോട് ചേരുമ്പോള്‍  കിട്ടുന്ന കൂട്ടക്ഷരങ്ങളെ അക്ഷരരൂപത്തിനകത്ത് തെറ്റായി സൂക്ഷിയ്ക്കുകയും, ചിത്രീകരണ എഞ്ചിന്‍ യൂണികോഡ് എന്‍കോഡ് ചെയ്ത ടെക്സ്റ്റിനെ അക്ഷരൂപത്തിനനുസൃതമായി മാറ്റുകയും ചെയ്യുമ്പോഴാണ് ശരിയായ ചിത്രീകരണം കിട്ടുന്നത്. ഇത് മനസ്സിലാക്കാനായി ലളിതമായ ഒരു ഉദാഹരണം എടുക്കാം - ക്യ
 
ക്യ എന്നത് ടൈപ് ചെയ്യുന്നതും സൂക്ഷിയ്ക്കുന്നതും ക+്+യ എന്നായിട്ടാണ്. ഇനി മൈക്രോസോഫ്റ്റ് പിന്തുടരുന്ന രീതി നോക്കാം. അക്ഷരരൂപത്തിനകത്ത് ഇത് ക+യ+് (ചന്ദ്രക്കലയുടെ സ്ഥാനം മാറ്റിയത് ശ്രദ്ധിയ്ക്കുക) എന്നായിട്ടാണ് സൂക്ഷിയ്ക്കുന്നത് (ശരിയ്ക്കും യ+് എന്നത് ്യ എന്ന ചിഹ്നമാണെന്ന് മാത്രമാണ് അക്ഷരരൂപത്തിനകത്ത് നല്‍കുന്ന വിവരം). ഇനി ചിത്രീകരണ എഞ്ചിനുകള്‍ (മൈക്രോസോഫ്റ്റ് ചിത്രീകരണ എഞ്ചിനായ യൂണിസ്ക്രൈബ് തുടങ്ങി വച്ച ഈ രീതി മറ്റുള്ളവയും പിന്തുടരുന്നു) ക+്+യ എന്ന് എന്‍കോഡ് ചെയ്ത ടെക്സ്റ്റിനെ അക്ഷരരൂപത്തിനനുസൃതമായി ക+യ+് എന്നായി മാറ്റുന്നു. ഇത് യൂണിസ്ക്രൈബില്‍ ശരിയ്ക്കും ചെയ്തിട്ടുണ്ട്. ഇനി പാംഗോയില്‍ വരുമ്പോള്‍ അവരും ഇത് പോലെ ചെയ്യാന്‍ നോക്കി പക്ഷേ പൂര്‍ണ്ണമായും ശരിയായില്ല. പാംഗോയ്ക്ക് പിഴച്ചതെവിടെയാണെന്ന് നോക്കാം. മുഖ്യമന്ത്രി, ഉപയോഗശൂന്യമാണ് (കോമ ശ്രദ്ധിയ്ക്കുക :-) ) എന്നിവ ചിത്രീകരിയ്ക്കുമ്പോള്‍ പറ്റുന്നതെന്താണെന്ന് നോക്കാം.
 
ഖ്യമ, ന്യമ എന്നിവയാണതിലെ പാഗോയ്ക്ക് ശരിയാക്കാന്‍ പറ്റാതെ പോയ ഭാഗങ്ങള്‍. അവ എന്‍കോഡ് ചെയ്യുന്നത് ഖ+്+യ+മ ന+്+യ+മ എന്നായിട്ടാണ്. ഖ+യ+് ന+യ+് എന്നിങ്ങനെയാണ്. ഇനി അക്ഷരരൂപത്തിനനുസൃതമാക്കുന്നത് പാംഗോയുടെ ജോലിയാണ്, അവന്‍ ആ ചന്ദ്രക്കല വലത്താട്ടൊന്ന് നീക്കും. ഇപ്പോള്‍ അത് ഖ+യ+്+മ ന+യ+്+മ എന്നാകുകയും അക്ഷരരൂപത്തിനകത്ത് നിന്നും യ+് എന്നതിന് പകരം ്യ എന്ന് കൂട്ടിച്ചേര്‍ക്കുകയും ചെയ്യും. അപ്പോള്‍ ഖ്യമ ന്യമ എന്നിവ കിട്ടിയില്ലേ എന്ന് നിങ്ങള്‍ ചോദിയ്ക്കും. പാഗോ ഒന്നുകൂടി നോക്കുമ്പോള്‍ യ+്+മ എന്നതിന് യ്മ എന്ന കൂട്ടക്ഷരമുള്ളതായി കാണുന്നു. അപ്പോള്‍ ഇതിന്റെ അവസാന ഫലം മുഖയ്മന്ത്രി, ഉപയോഗശൂനയ്മാണ് എന്നിങ്ങനെയാകും. ഇനി സുരേഷ് സുറുമയില്‍ ചെയ്തതെന്താണെന്ന് നോക്കാം.
 
്യ എന്നത് ്+യ എന്ന് തന്നെ അക്ഷരരൂപത്തില്‍ വയ്ക്കുകയും ചന്ദ്രക്കല നീക്കുന്ന സര്‍ക്കസ് ഒഴിവാക്കുകയും ചെയ്തു. സുറുമയിട്ട പാംഗോയില്‍ ശരിയായി കാണണമെങ്കില്‍ ഈ മാറ്റങ്ങള്‍ അക്ഷരരൂപങ്ങളിലും വരുത്തണമെന്നാണ്. സുരേഷ് തന്നെ സുറുമ എന്ന പേരില്‍ ഈ രീതിയിലുള്ള ഒരു അക്ഷരരൂപം [http://suruma.sarovar.org suruma.sarovar.org] ല്‍ വച്ചിട്ടുണ്ട് രചന, ഫ്രീസെരിഫ് തുടങ്ങിയ അക്ഷരരൂപങ്ങളും സുറുമയിട്ട പാംഗോയോടൊത്ത് പ്രവര്‍ത്തിയ്ക്കുന്ന രീതിയില്‍ അതേ സൈറ്റില്‍ ലഭ്യമാണ്. എല്ലാ സ്വതന്ത്ര അക്ഷരരൂപങ്ങളും ഈ രീതിയില്‍ എളുപ്പത്തില്‍ മാറ്റാവുന്നതാണ് (ഇങ്ങനെ മാറ്റം വരുത്തുന്ന അക്ഷരങ്ങള്‍ എല്ലാ ലിനക്സ് ചേര്‍ത്ത ഗ്നു വിതരണങ്ങളിലും ഉള്‍പ്പെടുത്താവുന്നതും സഹജമായ വിലയായി നല്‍കാവുന്നതുമാണ്). ഇതിനെതിരായുയര്‍ത്തുന്നൊരു വാദം സ്വതന്ത്രമല്ലാത്ത അക്ഷരരൂപങ്ങളെങ്ങനെ പ്രവര്‍ത്തിയ്ക്കുമെന്നതാണ്. ഇങ്ങനെ തന്നെയേ ഇത് ശരിയാക്കാവൂ എന്ന് ഞങ്ങള്‍ക്ക് വാശിയൊന്നുമില്ല. ഈ രീതിയില്‍ ശരിയാക്കണമെന്ന് താത്പര്യമുള്ള ആര്‍ക്കും ഇത് ശരിയാക്കാന്‍ മുന്നോട്ട് വരാം. മലയാളത്തിലെ ചിത്രീകരണ പ്രശ്നങ്ങളെങ്ങനെ പൂര്‍ണ്ണമായും പരിഹരിയ്ക്കാമെന്നു മാത്രമേ ഞങ്ങള്‍ക്കുത്കണ്ഠയുള്ളൂ.
 
ക്യൂട്ടിയില്‍ ഈ പ്രശ്നമില്ലാത്തതിന് കാരണം അതില്‍ രണ്ടിലധികം അടിസ്ഥാനാക്ഷരങ്ങള്‍ ചേര്‍ന്ന കൂട്ടക്ഷരങ്ങളെ പിന്തുണയ്ക്കുന്നില്ല എന്നതിനാലാണ്.

Latest revision as of 12:14, 11 June 2008

സുറുമയിട്ട പാംഗോയും ചില സംശയങ്ങളും

സുറുമയ്ക്ക് മലയാളം എന്‍കോഡിങ്ങുമായി യാതൊരു ബന്ധവുമില്ല. സുറുമ പാംഗോ ചിത്രീകരണ എഞ്ചിനിലാണ് മാറ്റം വരുത്തുന്നത്. നേരത്തെ എന്‍കോഡ് ചെയ്ത ടെക്സ്റ്റ് ചിത്രീകരിയ്ക്കുക എന്നത് മാത്രമാണ് പാംഗോ ചെയ്യുന്നത്. സുറുമയിട്ടാലും ഇല്ലെങ്കിലും ടെക്സ്റ്റ് എന്‍കോഡിങ്ങിലൊരു മാറ്റവുമുണ്ടാകില്ല. മൈക്രോസോഫ്റ്റിന്റെ അക്ഷരരൂപ സ്റ്റാന്‍ഡേൈര്‍ഡില്‍ '്യ, ്ര, ്വ' എന്നിവ വ്യഞ്ജനാക്ഷരങ്ങളോട് ചേരുമ്പോള്‍ കിട്ടുന്ന കൂട്ടക്ഷരങ്ങളെ അക്ഷരരൂപത്തിനകത്ത് തെറ്റായി സൂക്ഷിയ്ക്കുകയും, ചിത്രീകരണ എഞ്ചിന്‍ യൂണികോഡ് എന്‍കോഡ് ചെയ്ത ടെക്സ്റ്റിനെ അക്ഷരൂപത്തിനനുസൃതമായി മാറ്റുകയും ചെയ്യുമ്പോഴാണ് ശരിയായ ചിത്രീകരണം കിട്ടുന്നത്. ഇത് മനസ്സിലാക്കാനായി ലളിതമായ ഒരു ഉദാഹരണം എടുക്കാം - ക്യ

ക്യ എന്നത് ടൈപ് ചെയ്യുന്നതും സൂക്ഷിയ്ക്കുന്നതും ക+്+യ എന്നായിട്ടാണ്. ഇനി മൈക്രോസോഫ്റ്റ് പിന്തുടരുന്ന രീതി നോക്കാം. അക്ഷരരൂപത്തിനകത്ത് ഇത് ക+യ+് (ചന്ദ്രക്കലയുടെ സ്ഥാനം മാറ്റിയത് ശ്രദ്ധിയ്ക്കുക) എന്നായിട്ടാണ് സൂക്ഷിയ്ക്കുന്നത് (ശരിയ്ക്കും യ+് എന്നത് ്യ എന്ന ചിഹ്നമാണെന്ന് മാത്രമാണ് അക്ഷരരൂപത്തിനകത്ത് നല്‍കുന്ന വിവരം). ഇനി ചിത്രീകരണ എഞ്ചിനുകള്‍ (മൈക്രോസോഫ്റ്റ് ചിത്രീകരണ എഞ്ചിനായ യൂണിസ്ക്രൈബ് തുടങ്ങി വച്ച ഈ രീതി മറ്റുള്ളവയും പിന്തുടരുന്നു) ക+്+യ എന്ന് എന്‍കോഡ് ചെയ്ത ടെക്സ്റ്റിനെ അക്ഷരരൂപത്തിനനുസൃതമായി ക+യ+് എന്നായി മാറ്റുന്നു. ഇത് യൂണിസ്ക്രൈബില്‍ ശരിയ്ക്കും ചെയ്തിട്ടുണ്ട്. ഇനി പാംഗോയില്‍ വരുമ്പോള്‍ അവരും ഇത് പോലെ ചെയ്യാന്‍ നോക്കി പക്ഷേ പൂര്‍ണ്ണമായും ശരിയായില്ല. പാംഗോയ്ക്ക് പിഴച്ചതെവിടെയാണെന്ന് നോക്കാം. മുഖ്യമന്ത്രി, ഉപയോഗശൂന്യമാണ് (കോമ ശ്രദ്ധിയ്ക്കുക :-) ) എന്നിവ ചിത്രീകരിയ്ക്കുമ്പോള്‍ പറ്റുന്നതെന്താണെന്ന് നോക്കാം.

ഖ്യമ, ന്യമ എന്നിവയാണതിലെ പാഗോയ്ക്ക് ശരിയാക്കാന്‍ പറ്റാതെ പോയ ഭാഗങ്ങള്‍. അവ എന്‍കോഡ് ചെയ്യുന്നത് ഖ+്+യ+മ ന+്+യ+മ എന്നായിട്ടാണ്. ഖ+യ+് ന+യ+് എന്നിങ്ങനെയാണ്. ഇനി അക്ഷരരൂപത്തിനനുസൃതമാക്കുന്നത് പാംഗോയുടെ ജോലിയാണ്, അവന്‍ ആ ചന്ദ്രക്കല വലത്താട്ടൊന്ന് നീക്കും. ഇപ്പോള്‍ അത് ഖ+യ+്+മ ന+യ+്+മ എന്നാകുകയും അക്ഷരരൂപത്തിനകത്ത് നിന്നും യ+് എന്നതിന് പകരം ്യ എന്ന് കൂട്ടിച്ചേര്‍ക്കുകയും ചെയ്യും. അപ്പോള്‍ ഖ്യമ ന്യമ എന്നിവ കിട്ടിയില്ലേ എന്ന് നിങ്ങള്‍ ചോദിയ്ക്കും. പാഗോ ഒന്നുകൂടി നോക്കുമ്പോള്‍ യ+്+മ എന്നതിന് യ്മ എന്ന കൂട്ടക്ഷരമുള്ളതായി കാണുന്നു. അപ്പോള്‍ ഇതിന്റെ അവസാന ഫലം മുഖയ്മന്ത്രി, ഉപയോഗശൂനയ്മാണ് എന്നിങ്ങനെയാകും. ഇനി സുരേഷ് സുറുമയില്‍ ചെയ്തതെന്താണെന്ന് നോക്കാം.

്യ എന്നത് ്+യ എന്ന് തന്നെ അക്ഷരരൂപത്തില്‍ വയ്ക്കുകയും ചന്ദ്രക്കല നീക്കുന്ന സര്‍ക്കസ് ഒഴിവാക്കുകയും ചെയ്തു. സുറുമയിട്ട പാംഗോയില്‍ ശരിയായി കാണണമെങ്കില്‍ ഈ മാറ്റങ്ങള്‍ അക്ഷരരൂപങ്ങളിലും വരുത്തണമെന്നാണ്. സുരേഷ് തന്നെ സുറുമ എന്ന പേരില്‍ ഈ രീതിയിലുള്ള ഒരു അക്ഷരരൂപം suruma.sarovar.org ല്‍ വച്ചിട്ടുണ്ട് രചന, ഫ്രീസെരിഫ് തുടങ്ങിയ അക്ഷരരൂപങ്ങളും സുറുമയിട്ട പാംഗോയോടൊത്ത് പ്രവര്‍ത്തിയ്ക്കുന്ന രീതിയില്‍ അതേ സൈറ്റില്‍ ലഭ്യമാണ്. എല്ലാ സ്വതന്ത്ര അക്ഷരരൂപങ്ങളും ഈ രീതിയില്‍ എളുപ്പത്തില്‍ മാറ്റാവുന്നതാണ് (ഇങ്ങനെ മാറ്റം വരുത്തുന്ന അക്ഷരങ്ങള്‍ എല്ലാ ലിനക്സ് ചേര്‍ത്ത ഗ്നു വിതരണങ്ങളിലും ഉള്‍പ്പെടുത്താവുന്നതും സഹജമായ വിലയായി നല്‍കാവുന്നതുമാണ്). ഇതിനെതിരായുയര്‍ത്തുന്നൊരു വാദം സ്വതന്ത്രമല്ലാത്ത അക്ഷരരൂപങ്ങളെങ്ങനെ പ്രവര്‍ത്തിയ്ക്കുമെന്നതാണ്. ഇങ്ങനെ തന്നെയേ ഇത് ശരിയാക്കാവൂ എന്ന് ഞങ്ങള്‍ക്ക് വാശിയൊന്നുമില്ല. ഈ രീതിയില്‍ ശരിയാക്കണമെന്ന് താത്പര്യമുള്ള ആര്‍ക്കും ഇത് ശരിയാക്കാന്‍ മുന്നോട്ട് വരാം. മലയാളത്തിലെ ചിത്രീകരണ പ്രശ്നങ്ങളെങ്ങനെ പൂര്‍ണ്ണമായും പരിഹരിയ്ക്കാമെന്നു മാത്രമേ ഞങ്ങള്‍ക്കുത്കണ്ഠയുള്ളൂ.

ക്യൂട്ടിയില്‍ ഈ പ്രശ്നമില്ലാത്തതിന് കാരണം അതില്‍ രണ്ടിലധികം അടിസ്ഥാനാക്ഷരങ്ങള്‍ ചേര്‍ന്ന കൂട്ടക്ഷരങ്ങളെ പിന്തുണയ്ക്കുന്നില്ല എന്നതിനാലാണ്.