To register a new account on this wiki, contact us
സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങ്/സുറുമയിട്ട പാംഗോയും ചില സംശയങ്ങളും: Difference between revisions
സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങ്/സുറുമയിട്ട പാംഗോയും ചില സംശയങ്ങളും moved to Main Memory Database Systems: Heading is junk |
No edit summary |
||
| (One intermediate revision by the same user not shown) | |||
| Line 1: | Line 1: | ||
==സുറുമയിട്ട പാംഗോയും ചില സംശയങ്ങളും== | |||
സുറുമയ്ക്ക് മലയാളം എന്കോഡിങ്ങുമായി യാതൊരു ബന്ധവുമില്ല. സുറുമ പാംഗോ ചിത്രീകരണ എഞ്ചിനിലാണ് മാറ്റം വരുത്തുന്നത്. നേരത്തെ എന്കോഡ് ചെയ്ത ടെക്സ്റ്റ് ചിത്രീകരിയ്ക്കുക എന്നത് മാത്രമാണ് പാംഗോ ചെയ്യുന്നത്. സുറുമയിട്ടാലും ഇല്ലെങ്കിലും ടെക്സ്റ്റ് എന്കോഡിങ്ങിലൊരു മാറ്റവുമുണ്ടാകില്ല. മൈക്രോസോഫ്റ്റിന്റെ അക്ഷരരൂപ സ്റ്റാന്ഡേൈര്ഡില് '്യ, ്ര, ്വ' എന്നിവ വ്യഞ്ജനാക്ഷരങ്ങളോട് ചേരുമ്പോള് കിട്ടുന്ന കൂട്ടക്ഷരങ്ങളെ അക്ഷരരൂപത്തിനകത്ത് തെറ്റായി സൂക്ഷിയ്ക്കുകയും, ചിത്രീകരണ എഞ്ചിന് യൂണികോഡ് എന്കോഡ് ചെയ്ത ടെക്സ്റ്റിനെ അക്ഷരൂപത്തിനനുസൃതമായി മാറ്റുകയും ചെയ്യുമ്പോഴാണ് ശരിയായ ചിത്രീകരണം കിട്ടുന്നത്. ഇത് മനസ്സിലാക്കാനായി ലളിതമായ ഒരു ഉദാഹരണം എടുക്കാം - ക്യ | |||
ക്യ എന്നത് ടൈപ് ചെയ്യുന്നതും സൂക്ഷിയ്ക്കുന്നതും ക+്+യ എന്നായിട്ടാണ്. ഇനി മൈക്രോസോഫ്റ്റ് പിന്തുടരുന്ന രീതി നോക്കാം. അക്ഷരരൂപത്തിനകത്ത് ഇത് ക+യ+് (ചന്ദ്രക്കലയുടെ സ്ഥാനം മാറ്റിയത് ശ്രദ്ധിയ്ക്കുക) എന്നായിട്ടാണ് സൂക്ഷിയ്ക്കുന്നത് (ശരിയ്ക്കും യ+് എന്നത് ്യ എന്ന ചിഹ്നമാണെന്ന് മാത്രമാണ് അക്ഷരരൂപത്തിനകത്ത് നല്കുന്ന വിവരം). ഇനി ചിത്രീകരണ എഞ്ചിനുകള് (മൈക്രോസോഫ്റ്റ് ചിത്രീകരണ എഞ്ചിനായ യൂണിസ്ക്രൈബ് തുടങ്ങി വച്ച ഈ രീതി മറ്റുള്ളവയും പിന്തുടരുന്നു) ക+്+യ എന്ന് എന്കോഡ് ചെയ്ത ടെക്സ്റ്റിനെ അക്ഷരരൂപത്തിനനുസൃതമായി ക+യ+് എന്നായി മാറ്റുന്നു. ഇത് യൂണിസ്ക്രൈബില് ശരിയ്ക്കും ചെയ്തിട്ടുണ്ട്. ഇനി പാംഗോയില് വരുമ്പോള് അവരും ഇത് പോലെ ചെയ്യാന് നോക്കി പക്ഷേ പൂര്ണ്ണമായും ശരിയായില്ല. പാംഗോയ്ക്ക് പിഴച്ചതെവിടെയാണെന്ന് നോക്കാം. മുഖ്യമന്ത്രി, ഉപയോഗശൂന്യമാണ് (കോമ ശ്രദ്ധിയ്ക്കുക :-) ) എന്നിവ ചിത്രീകരിയ്ക്കുമ്പോള് പറ്റുന്നതെന്താണെന്ന് നോക്കാം. | |||
ഖ്യമ, ന്യമ എന്നിവയാണതിലെ പാഗോയ്ക്ക് ശരിയാക്കാന് പറ്റാതെ പോയ ഭാഗങ്ങള്. അവ എന്കോഡ് ചെയ്യുന്നത് ഖ+്+യ+മ ന+്+യ+മ എന്നായിട്ടാണ്. ഖ+യ+് ന+യ+് എന്നിങ്ങനെയാണ്. ഇനി അക്ഷരരൂപത്തിനനുസൃതമാക്കുന്നത് പാംഗോയുടെ ജോലിയാണ്, അവന് ആ ചന്ദ്രക്കല വലത്താട്ടൊന്ന് നീക്കും. ഇപ്പോള് അത് ഖ+യ+്+മ ന+യ+്+മ എന്നാകുകയും അക്ഷരരൂപത്തിനകത്ത് നിന്നും യ+് എന്നതിന് പകരം ്യ എന്ന് കൂട്ടിച്ചേര്ക്കുകയും ചെയ്യും. അപ്പോള് ഖ്യമ ന്യമ എന്നിവ കിട്ടിയില്ലേ എന്ന് നിങ്ങള് ചോദിയ്ക്കും. പാഗോ ഒന്നുകൂടി നോക്കുമ്പോള് യ+്+മ എന്നതിന് യ്മ എന്ന കൂട്ടക്ഷരമുള്ളതായി കാണുന്നു. അപ്പോള് ഇതിന്റെ അവസാന ഫലം മുഖയ്മന്ത്രി, ഉപയോഗശൂനയ്മാണ് എന്നിങ്ങനെയാകും. ഇനി സുരേഷ് സുറുമയില് ചെയ്തതെന്താണെന്ന് നോക്കാം. | |||
്യ എന്നത് ്+യ എന്ന് തന്നെ അക്ഷരരൂപത്തില് വയ്ക്കുകയും ചന്ദ്രക്കല നീക്കുന്ന സര്ക്കസ് ഒഴിവാക്കുകയും ചെയ്തു. സുറുമയിട്ട പാംഗോയില് ശരിയായി കാണണമെങ്കില് ഈ മാറ്റങ്ങള് അക്ഷരരൂപങ്ങളിലും വരുത്തണമെന്നാണ്. സുരേഷ് തന്നെ സുറുമ എന്ന പേരില് ഈ രീതിയിലുള്ള ഒരു അക്ഷരരൂപം [http://suruma.sarovar.org suruma.sarovar.org] ല് വച്ചിട്ടുണ്ട് രചന, ഫ്രീസെരിഫ് തുടങ്ങിയ അക്ഷരരൂപങ്ങളും സുറുമയിട്ട പാംഗോയോടൊത്ത് പ്രവര്ത്തിയ്ക്കുന്ന രീതിയില് അതേ സൈറ്റില് ലഭ്യമാണ്. എല്ലാ സ്വതന്ത്ര അക്ഷരരൂപങ്ങളും ഈ രീതിയില് എളുപ്പത്തില് മാറ്റാവുന്നതാണ് (ഇങ്ങനെ മാറ്റം വരുത്തുന്ന അക്ഷരങ്ങള് എല്ലാ ലിനക്സ് ചേര്ത്ത ഗ്നു വിതരണങ്ങളിലും ഉള്പ്പെടുത്താവുന്നതും സഹജമായ വിലയായി നല്കാവുന്നതുമാണ്). ഇതിനെതിരായുയര്ത്തുന്നൊരു വാദം സ്വതന്ത്രമല്ലാത്ത അക്ഷരരൂപങ്ങളെങ്ങനെ പ്രവര്ത്തിയ്ക്കുമെന്നതാണ്. ഇങ്ങനെ തന്നെയേ ഇത് ശരിയാക്കാവൂ എന്ന് ഞങ്ങള്ക്ക് വാശിയൊന്നുമില്ല. ഈ രീതിയില് ശരിയാക്കണമെന്ന് താത്പര്യമുള്ള ആര്ക്കും ഇത് ശരിയാക്കാന് മുന്നോട്ട് വരാം. മലയാളത്തിലെ ചിത്രീകരണ പ്രശ്നങ്ങളെങ്ങനെ പൂര്ണ്ണമായും പരിഹരിയ്ക്കാമെന്നു മാത്രമേ ഞങ്ങള്ക്കുത്കണ്ഠയുള്ളൂ. | |||
ക്യൂട്ടിയില് ഈ പ്രശ്നമില്ലാത്തതിന് കാരണം അതില് രണ്ടിലധികം അടിസ്ഥാനാക്ഷരങ്ങള് ചേര്ന്ന കൂട്ടക്ഷരങ്ങളെ പിന്തുണയ്ക്കുന്നില്ല എന്നതിനാലാണ്. | |||
Latest revision as of 12:14, 11 June 2008
സുറുമയിട്ട പാംഗോയും ചില സംശയങ്ങളും
സുറുമയ്ക്ക് മലയാളം എന്കോഡിങ്ങുമായി യാതൊരു ബന്ധവുമില്ല. സുറുമ പാംഗോ ചിത്രീകരണ എഞ്ചിനിലാണ് മാറ്റം വരുത്തുന്നത്. നേരത്തെ എന്കോഡ് ചെയ്ത ടെക്സ്റ്റ് ചിത്രീകരിയ്ക്കുക എന്നത് മാത്രമാണ് പാംഗോ ചെയ്യുന്നത്. സുറുമയിട്ടാലും ഇല്ലെങ്കിലും ടെക്സ്റ്റ് എന്കോഡിങ്ങിലൊരു മാറ്റവുമുണ്ടാകില്ല. മൈക്രോസോഫ്റ്റിന്റെ അക്ഷരരൂപ സ്റ്റാന്ഡേൈര്ഡില് '്യ, ്ര, ്വ' എന്നിവ വ്യഞ്ജനാക്ഷരങ്ങളോട് ചേരുമ്പോള് കിട്ടുന്ന കൂട്ടക്ഷരങ്ങളെ അക്ഷരരൂപത്തിനകത്ത് തെറ്റായി സൂക്ഷിയ്ക്കുകയും, ചിത്രീകരണ എഞ്ചിന് യൂണികോഡ് എന്കോഡ് ചെയ്ത ടെക്സ്റ്റിനെ അക്ഷരൂപത്തിനനുസൃതമായി മാറ്റുകയും ചെയ്യുമ്പോഴാണ് ശരിയായ ചിത്രീകരണം കിട്ടുന്നത്. ഇത് മനസ്സിലാക്കാനായി ലളിതമായ ഒരു ഉദാഹരണം എടുക്കാം - ക്യ
ക്യ എന്നത് ടൈപ് ചെയ്യുന്നതും സൂക്ഷിയ്ക്കുന്നതും ക+്+യ എന്നായിട്ടാണ്. ഇനി മൈക്രോസോഫ്റ്റ് പിന്തുടരുന്ന രീതി നോക്കാം. അക്ഷരരൂപത്തിനകത്ത് ഇത് ക+യ+് (ചന്ദ്രക്കലയുടെ സ്ഥാനം മാറ്റിയത് ശ്രദ്ധിയ്ക്കുക) എന്നായിട്ടാണ് സൂക്ഷിയ്ക്കുന്നത് (ശരിയ്ക്കും യ+് എന്നത് ്യ എന്ന ചിഹ്നമാണെന്ന് മാത്രമാണ് അക്ഷരരൂപത്തിനകത്ത് നല്കുന്ന വിവരം). ഇനി ചിത്രീകരണ എഞ്ചിനുകള് (മൈക്രോസോഫ്റ്റ് ചിത്രീകരണ എഞ്ചിനായ യൂണിസ്ക്രൈബ് തുടങ്ങി വച്ച ഈ രീതി മറ്റുള്ളവയും പിന്തുടരുന്നു) ക+്+യ എന്ന് എന്കോഡ് ചെയ്ത ടെക്സ്റ്റിനെ അക്ഷരരൂപത്തിനനുസൃതമായി ക+യ+് എന്നായി മാറ്റുന്നു. ഇത് യൂണിസ്ക്രൈബില് ശരിയ്ക്കും ചെയ്തിട്ടുണ്ട്. ഇനി പാംഗോയില് വരുമ്പോള് അവരും ഇത് പോലെ ചെയ്യാന് നോക്കി പക്ഷേ പൂര്ണ്ണമായും ശരിയായില്ല. പാംഗോയ്ക്ക് പിഴച്ചതെവിടെയാണെന്ന് നോക്കാം. മുഖ്യമന്ത്രി, ഉപയോഗശൂന്യമാണ് (കോമ ശ്രദ്ധിയ്ക്കുക :-) ) എന്നിവ ചിത്രീകരിയ്ക്കുമ്പോള് പറ്റുന്നതെന്താണെന്ന് നോക്കാം.
ഖ്യമ, ന്യമ എന്നിവയാണതിലെ പാഗോയ്ക്ക് ശരിയാക്കാന് പറ്റാതെ പോയ ഭാഗങ്ങള്. അവ എന്കോഡ് ചെയ്യുന്നത് ഖ+്+യ+മ ന+്+യ+മ എന്നായിട്ടാണ്. ഖ+യ+് ന+യ+് എന്നിങ്ങനെയാണ്. ഇനി അക്ഷരരൂപത്തിനനുസൃതമാക്കുന്നത് പാംഗോയുടെ ജോലിയാണ്, അവന് ആ ചന്ദ്രക്കല വലത്താട്ടൊന്ന് നീക്കും. ഇപ്പോള് അത് ഖ+യ+്+മ ന+യ+്+മ എന്നാകുകയും അക്ഷരരൂപത്തിനകത്ത് നിന്നും യ+് എന്നതിന് പകരം ്യ എന്ന് കൂട്ടിച്ചേര്ക്കുകയും ചെയ്യും. അപ്പോള് ഖ്യമ ന്യമ എന്നിവ കിട്ടിയില്ലേ എന്ന് നിങ്ങള് ചോദിയ്ക്കും. പാഗോ ഒന്നുകൂടി നോക്കുമ്പോള് യ+്+മ എന്നതിന് യ്മ എന്ന കൂട്ടക്ഷരമുള്ളതായി കാണുന്നു. അപ്പോള് ഇതിന്റെ അവസാന ഫലം മുഖയ്മന്ത്രി, ഉപയോഗശൂനയ്മാണ് എന്നിങ്ങനെയാകും. ഇനി സുരേഷ് സുറുമയില് ചെയ്തതെന്താണെന്ന് നോക്കാം.
്യ എന്നത് ്+യ എന്ന് തന്നെ അക്ഷരരൂപത്തില് വയ്ക്കുകയും ചന്ദ്രക്കല നീക്കുന്ന സര്ക്കസ് ഒഴിവാക്കുകയും ചെയ്തു. സുറുമയിട്ട പാംഗോയില് ശരിയായി കാണണമെങ്കില് ഈ മാറ്റങ്ങള് അക്ഷരരൂപങ്ങളിലും വരുത്തണമെന്നാണ്. സുരേഷ് തന്നെ സുറുമ എന്ന പേരില് ഈ രീതിയിലുള്ള ഒരു അക്ഷരരൂപം suruma.sarovar.org ല് വച്ചിട്ടുണ്ട് രചന, ഫ്രീസെരിഫ് തുടങ്ങിയ അക്ഷരരൂപങ്ങളും സുറുമയിട്ട പാംഗോയോടൊത്ത് പ്രവര്ത്തിയ്ക്കുന്ന രീതിയില് അതേ സൈറ്റില് ലഭ്യമാണ്. എല്ലാ സ്വതന്ത്ര അക്ഷരരൂപങ്ങളും ഈ രീതിയില് എളുപ്പത്തില് മാറ്റാവുന്നതാണ് (ഇങ്ങനെ മാറ്റം വരുത്തുന്ന അക്ഷരങ്ങള് എല്ലാ ലിനക്സ് ചേര്ത്ത ഗ്നു വിതരണങ്ങളിലും ഉള്പ്പെടുത്താവുന്നതും സഹജമായ വിലയായി നല്കാവുന്നതുമാണ്). ഇതിനെതിരായുയര്ത്തുന്നൊരു വാദം സ്വതന്ത്രമല്ലാത്ത അക്ഷരരൂപങ്ങളെങ്ങനെ പ്രവര്ത്തിയ്ക്കുമെന്നതാണ്. ഇങ്ങനെ തന്നെയേ ഇത് ശരിയാക്കാവൂ എന്ന് ഞങ്ങള്ക്ക് വാശിയൊന്നുമില്ല. ഈ രീതിയില് ശരിയാക്കണമെന്ന് താത്പര്യമുള്ള ആര്ക്കും ഇത് ശരിയാക്കാന് മുന്നോട്ട് വരാം. മലയാളത്തിലെ ചിത്രീകരണ പ്രശ്നങ്ങളെങ്ങനെ പൂര്ണ്ണമായും പരിഹരിയ്ക്കാമെന്നു മാത്രമേ ഞങ്ങള്ക്കുത്കണ്ഠയുള്ളൂ.
ക്യൂട്ടിയില് ഈ പ്രശ്നമില്ലാത്തതിന് കാരണം അതില് രണ്ടിലധികം അടിസ്ഥാനാക്ഷരങ്ങള് ചേര്ന്ന കൂട്ടക്ഷരങ്ങളെ പിന്തുണയ്ക്കുന്നില്ല എന്നതിനാലാണ്.