സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങ്/സുറുമയിട്ട പാംഗോയും ചില സംശയങ്ങളും: Difference between revisions
സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങ്/സുറുമയിട്ട പാംഗോയും ചില സംശയങ്ങളും moved to Main Memory Database Systems: Heading is junk |
No edit summary |
||
| (One intermediate revision by the same user not shown) | |||
| Line 1: | Line 1: | ||
==സുറുമയിട്ട പാംഗോയും ചില സംശയങ്ങളും== | |||
സുറുമയ്ക്ക് മലയാളം എന്കോഡിങ്ങുമായി യാതൊരു ബന്ധവുമില്ല. സുറുമ പാംഗോ ചിത്രീകരണ എഞ്ചിനിലാണ് മാറ്റം വരുത്തുന്നത്. നേരത്തെ എന്കോഡ് ചെയ്ത ടെക്സ്റ്റ് ചിത്രീകരിയ്ക്കുക എന്നത് മാത്രമാണ് പാംഗോ ചെയ്യുന്നത്. സുറുമയിട്ടാലും ഇല്ലെങ്കിലും ടെക്സ്റ്റ് എന്കോഡിങ്ങിലൊരു മാറ്റവുമുണ്ടാകില്ല. മൈക്രോസോഫ്റ്റിന്റെ അക്ഷരരൂപ സ്റ്റാന്ഡേൈര്ഡില് '്യ, ്ര, ്വ' എന്നിവ വ്യഞ്ജനാക്ഷരങ്ങളോട് ചേരുമ്പോള് കിട്ടുന്ന കൂട്ടക്ഷരങ്ങളെ അക്ഷരരൂപത്തിനകത്ത് തെറ്റായി സൂക്ഷിയ്ക്കുകയും, ചിത്രീകരണ എഞ്ചിന് യൂണികോഡ് എന്കോഡ് ചെയ്ത ടെക്സ്റ്റിനെ അക്ഷരൂപത്തിനനുസൃതമായി മാറ്റുകയും ചെയ്യുമ്പോഴാണ് ശരിയായ ചിത്രീകരണം കിട്ടുന്നത്. ഇത് മനസ്സിലാക്കാനായി ലളിതമായ ഒരു ഉദാഹരണം എടുക്കാം - ക്യ | |||
ക്യ എന്നത് ടൈപ് ചെയ്യുന്നതും സൂക്ഷിയ്ക്കുന്നതും ക+്+യ എന്നായിട്ടാണ്. ഇനി മൈക്രോസോഫ്റ്റ് പിന്തുടരുന്ന രീതി നോക്കാം. അക്ഷരരൂപത്തിനകത്ത് ഇത് ക+യ+് (ചന്ദ്രക്കലയുടെ സ്ഥാനം മാറ്റിയത് ശ്രദ്ധിയ്ക്കുക) എന്നായിട്ടാണ് സൂക്ഷിയ്ക്കുന്നത് (ശരിയ്ക്കും യ+് എന്നത് ്യ എന്ന ചിഹ്നമാണെന്ന് മാത്രമാണ് അക്ഷരരൂപത്തിനകത്ത് നല്കുന്ന വിവരം). ഇനി ചിത്രീകരണ എഞ്ചിനുകള് (മൈക്രോസോഫ്റ്റ് ചിത്രീകരണ എഞ്ചിനായ യൂണിസ്ക്രൈബ് തുടങ്ങി വച്ച ഈ രീതി മറ്റുള്ളവയും പിന്തുടരുന്നു) ക+്+യ എന്ന് എന്കോഡ് ചെയ്ത ടെക്സ്റ്റിനെ അക്ഷരരൂപത്തിനനുസൃതമായി ക+യ+് എന്നായി മാറ്റുന്നു. ഇത് യൂണിസ്ക്രൈബില് ശരിയ്ക്കും ചെയ്തിട്ടുണ്ട്. ഇനി പാംഗോയില് വരുമ്പോള് അവരും ഇത് പോലെ ചെയ്യാന് നോക്കി പക്ഷേ പൂര്ണ്ണമായും ശരിയായില്ല. പാംഗോയ്ക്ക് പിഴച്ചതെവിടെയാണെന്ന് നോക്കാം. മുഖ്യമന്ത്രി, ഉപയോഗശൂന്യമാണ് (കോമ ശ്രദ്ധിയ്ക്കുക :-) ) എന്നിവ ചിത്രീകരിയ്ക്കുമ്പോള് പറ്റുന്നതെന്താണെന്ന് നോക്കാം. | |||
ഖ്യമ, ന്യമ എന്നിവയാണതിലെ പാഗോയ്ക്ക് ശരിയാക്കാന് പറ്റാതെ പോയ ഭാഗങ്ങള്. അവ എന്കോഡ് ചെയ്യുന്നത് ഖ+്+യ+മ ന+്+യ+മ എന്നായിട്ടാണ്. ഖ+യ+് ന+യ+് എന്നിങ്ങനെയാണ്. ഇനി അക്ഷരരൂപത്തിനനുസൃതമാക്കുന്നത് പാംഗോയുടെ ജോലിയാണ്, അവന് ആ ചന്ദ്രക്കല വലത്താട്ടൊന്ന് നീക്കും. ഇപ്പോള് അത് ഖ+യ+്+മ ന+യ+്+മ എന്നാകുകയും അക്ഷരരൂപത്തിനകത്ത് നിന്നും യ+് എന്നതിന് പകരം ്യ എന്ന് കൂട്ടിച്ചേര്ക്കുകയും ചെയ്യും. അപ്പോള് ഖ്യമ ന്യമ എന്നിവ കിട്ടിയില്ലേ എന്ന് നിങ്ങള് ചോദിയ്ക്കും. പാഗോ ഒന്നുകൂടി നോക്കുമ്പോള് യ+്+മ എന്നതിന് യ്മ എന്ന കൂട്ടക്ഷരമുള്ളതായി കാണുന്നു. അപ്പോള് ഇതിന്റെ അവസാന ഫലം മുഖയ്മന്ത്രി, ഉപയോഗശൂനയ്മാണ് എന്നിങ്ങനെയാകും. ഇനി സുരേഷ് സുറുമയില് ചെയ്തതെന്താണെന്ന് നോക്കാം. | |||
്യ എന്നത് ്+യ എന്ന് തന്നെ അക്ഷരരൂപത്തില് വയ്ക്കുകയും ചന്ദ്രക്കല നീക്കുന്ന സര്ക്കസ് ഒഴിവാക്കുകയും ചെയ്തു. സുറുമയിട്ട പാംഗോയില് ശരിയായി കാണണമെങ്കില് ഈ മാറ്റങ്ങള് അക്ഷരരൂപങ്ങളിലും വരുത്തണമെന്നാണ്. സുരേഷ് തന്നെ സുറുമ എന്ന പേരില് ഈ രീതിയിലുള്ള ഒരു അക്ഷരരൂപം [http://suruma.sarovar.org suruma.sarovar.org] ല് വച്ചിട്ടുണ്ട് രചന, ഫ്രീസെരിഫ് തുടങ്ങിയ അക്ഷരരൂപങ്ങളും സുറുമയിട്ട പാംഗോയോടൊത്ത് പ്രവര്ത്തിയ്ക്കുന്ന രീതിയില് അതേ സൈറ്റില് ലഭ്യമാണ്. എല്ലാ സ്വതന്ത്ര അക്ഷരരൂപങ്ങളും ഈ രീതിയില് എളുപ്പത്തില് മാറ്റാവുന്നതാണ് (ഇങ്ങനെ മാറ്റം വരുത്തുന്ന അക്ഷരങ്ങള് എല്ലാ ലിനക്സ് ചേര്ത്ത ഗ്നു വിതരണങ്ങളിലും ഉള്പ്പെടുത്താവുന്നതും സഹജമായ വിലയായി നല്കാവുന്നതുമാണ്). ഇതിനെതിരായുയര്ത്തുന്നൊരു വാദം സ്വതന്ത്രമല്ലാത്ത അക്ഷരരൂപങ്ങളെങ്ങനെ പ്രവര്ത്തിയ്ക്കുമെന്നതാണ്. ഇങ്ങനെ തന്നെയേ ഇത് ശരിയാക്കാവൂ എന്ന് ഞങ്ങള്ക്ക് വാശിയൊന്നുമില്ല. ഈ രീതിയില് ശരിയാക്കണമെന്ന് താത്പര്യമുള്ള ആര്ക്കും ഇത് ശരിയാക്കാന് മുന്നോട്ട് വരാം. മലയാളത്തിലെ ചിത്രീകരണ പ്രശ്നങ്ങളെങ്ങനെ പൂര്ണ്ണമായും പരിഹരിയ്ക്കാമെന്നു മാത്രമേ ഞങ്ങള്ക്കുത്കണ്ഠയുള്ളൂ. | |||
ക്യൂട്ടിയില് ഈ പ്രശ്നമില്ലാത്തതിന് കാരണം അതില് രണ്ടിലധികം അടിസ്ഥാനാക്ഷരങ്ങള് ചേര്ന്ന കൂട്ടക്ഷരങ്ങളെ പിന്തുണയ്ക്കുന്നില്ല എന്നതിനാലാണ്. | |||