റ്റ - ഭാഷ, യുണിക്കോഡ്, ചിത്രീകരണം
മലയാളം ഫോണ്ടുകളും ചിത്രീകരണവും - ലേഖന പരമ്പരയിലെ പുതിയ ലേഖനം
സന്തോഷ് തോട്ടിങ്ങല്
മലയാളത്തിലെ റ്റ എന്ന കൂട്ടക്ഷരത്തിന്റെ ചിത്രീകരണത്തെപ്പറ്റിയാണു് ഈ ലേഖനത്തില് വിശദീകരിയ്ക്കുന്നതു്. ഫോണ്ടുകളില് 'റ്റ' എന്ന കൂട്ടക്ഷരം എങ്ങനെ ചിത്രീകരിച്ചിരിയ്ക്കുന്നുവെന്നു പറയുന്നതിനുമുമ്പ് റ്റ എന്ന കൂട്ടക്ഷരത്തിന്റെ സവിശേഷതകള് അല്പം മനസ്സിലാക്കേണ്ടതുണ്ടു്.
അക്ഷരമാലയിൽ നമ്മൾ കാണില്ലെങ്കിലും റ്റ നമ്മൾ എപ്പോഴും ഉപയോഗിക്കുന്നതാണ്. കൂട്ടക്ഷരമായതുകൊണ്ടാണ് അക്ഷരമാലയിൽ ഇല്ലാത്തതെന്ന് എല്ലാർക്കുമറിയാം. എങ്കിൽ എന്തൊക്കെച്ചേർന്നാണ് ഈ കൂട്ടക്ഷരമുണ്ടായതെന്നു ചോദിച്ചാൽ ബുദ്ധിമുട്ടും. രണ്ടു റ-കൾ ചേർത്തതാണ് രൂപമെങ്കിലും റ ഇരട്ടിപ്പിച്ച് ഉച്ചരിച്ചാൽ റ്റ-യുടെ ഉച്ചാരണം ആവില്ല.
ക, ച, ട, ത, പ വർഗ്ഗങ്ങൾ കൂടാതെ ട
വർഗ്ഗത്തിനും ത
വർഗ്ഗത്തിനും ഇടയിലായി മലയാളത്തിൽ ഒരു ta-വർഗ്ഗം ഉണ്ടായിരുന്നു. അതിന്റെ അനുനാസികമാണു്, നനയുക എന്ന വാക്കിലെ രണ്ടാമത്തെ നയുടെ ഉച്ചാരണമായി വരുന്ന ലിപിരൂപമില്ലാത്ത സ്വനിമയെന്നും ഒരു വാദമുണ്ടു്. അറ്റം, കുറ്റം, മുറ്റം, പറ്റം എന്നൊക്കെയുള്ള വാക്കുകളിലെ റ്റയുടെ അർദ്ധരൂപമാണു്, ta. ഗണിതഭാഷയിൽ റ്റ/2
എന്നു വേണമെങ്കില് പറയാം. കേരളപാണിനീയത്തിൽ റ്റ/2 എന്ന അക്ഷരത്തെ കുറിക്കാൻ ഺ
എന്ന അക്ഷരചിത്രമാണു് ഉപയോഗിക്കുന്നതു്. na-കാരത്തിനു് ഩ
എന്ന അക്ഷരരൂപവും ഉപയോഗിക്കുന്നു. ഈ അക്ഷരങ്ങള് പ്രത്യേകം യുണിക്കോഡില് എന്കോഡ് ചെയ്യപ്പെട്ടിട്ടുണ്ടെങ്കിലും വ്യാകരണചര്ച്ചകള്ക്കല്ലാതെ ഇന്നു നമ്മള് ഉപയോഗിക്കാറില്ല.
ഈ ഩ
യും ഺ
യും ചേർന്ന് ന്റ
ഉണ്ടായതിനെപ്പറ്റി വിശദമായി നമ്മൾ കഴിഞ്ഞ അധ്യായത്തിൽ ചർച്ച ചെയ്തു. ന്റ എന്ന ഇന്നത്തെ രൂപത്തിൽ ഺ
യ്ക്ക് പകരം റ
ആണ് ഉപയോഗിക്കുന്നതെന്നും നമ്മൾ കണ്ടു. ഺ
ക്ക് ഒരു ഇരട്ടിപ്പുണ്ടെങ്കിൽ അതാണ് റ്റ
. ന്റയിൽ റ
ഺ
യ്ക്ക് പകരം വന്നെങ്കിൽ ഇവിടെയും റ
രണ്ടുതവണ വന്ന് റ്റ
യുടെ ചിത്രീകരണമായി. റ + ് + റ
എന്നു ടൈപ്പു ചെയ്താൽ റ്റ കിട്ടുകയും ചെയ്യും. അങ്ങനെയാണ് നമ്മുടെ ഫോണ്ടുകളിലെല്ലാം റ്റ
യെ കണക്കാക്കുന്നതു്.
പക്ഷേ അത്ര എളുപ്പമല്ല കാര്യങ്ങൾ. റ
യുടെ ഇരട്ടിപ്പ് രണ്ട് രീതിയിലാണ് മലയാളത്തിൽ ഉണ്ടായതു്. രണ്ട് റകൾ നിരത്തിയെഴുതുന്ന ററ
യും അടുക്കിയെഴുതുന്ന റ്റ
യും. ഇതിൽ ഒന്നു ശരി, മറ്റേത് തെറ്റ് എന്നൊന്നുമില്ല. പല കാലഘട്ടങ്ങളിലുള്ള അച്ചടിയിലും എഴുത്തിലും രണ്ടു ശൈലിയും മാറിമാറി ഉപയോഗിക്കുന്നുണ്ട്. ചില ഉദാഹരണങ്ങൾ താഴെക്കൊടുക്കുന്നു.
അതിന്റെ, എന്റെ എന്നീവാക്കുകൾ നിരത്തിയെഴുതിയ രണ്ട് റ കൊണ്ട് സൂചിപ്പിച്ചിരിക്കുന്നു. ഹൊർത്തുസ് മലബാറിക്കസ് കൊല്ലം 1678
റ്റ എന്ന് നിരത്തിയെഴുതുന്ന യുണിക്കോഡ് ഫോണ്ടുകൾ മലയാളത്തിൽ ഇതുവരെ ഇല്ല. എല്ലാ ഫോണ്ടുകളും റ്റ എന്നു അടുക്കിയെഴുതുന്നു.
അക്ഷരങ്ങൾ അടുക്കിയെഴുതി കൂട്ടക്ഷരങ്ങൾ കാണിക്കുന്ന "പഴയലിപി"യുടെ സ്വഭാവത്തിനു നേരെ വിപരീതമാണ് റ്റ-യുടെ കാര്യം. പഴയകാലത്ത് നിരത്തിയെഴുതിയ റകൾ ആണെങ്കിൽ "പുതിയ" കാലത്തു് ലിപിഭേദമില്ലാതെ പഴയലിപിയും പുതിയലിപിയും പൊതുവിൽ അടുക്കിയെഴുതിയ റ്റ പിന്തുടരുന്നു. കൃത്യമായി എന്നാണ് അടുക്കിയെഴുതുന്ന റ്റ എഴുത്തിൽ കാണാൻ തുടങ്ങിയെന്നെനിക്കറിയില്ല.
അടുക്കിയെഴുതിയ റ്റ കൂടുതൽ പ്രചാരത്തിലാവാനുള്ള കാരണങ്ങളിലൊരുപക്ഷേ നിരത്തിയെഴുതിയ ററ ഉണ്ടാക്കുന്ന ആശയക്കുഴപ്പങ്ങൾ ഒഴിവാക്കാൻ കഴിയുന്നതായിരിക്കണം. നിരത്തിയെഴുതുമ്പോൾ \ta\ എന്ന ഉച്ചാരണത്തിനുപുറമേ \RaRa\എന്ന ഉച്ചാരണവും സാധ്യമാണല്ലോ ററ
യ്ക്ക് . മീറററിൽ
എന്നെഴുതിയാൽ അത് Meerut/മീററ്റ് എന്ന പട്ടണത്തിന്റെ പേരായാണോ meter/മീറ്റർ എന്നാണോ വായിക്കേണ്ടതെന്നറിയാൻ വാക്യത്തിന്റെ സന്ദർഭത്തെ കൂട്ടുപിടിക്കേണ്ടിവരും. സൂറററ്, ടെംപററി, റൈററർ എന്നൊക്കെ വലിയ ആശയക്കുഴപ്പമാണുണ്ടാക്കുക. അററകുററപ്പണി എന്നെഴുതിയിരുന്ന പത്രം അ-റ-റ-കു-റ-റ എന്ന് വായിച്ച ഒരു മിമിക്സ് പരേഡ് പണ്ട് കണ്ടതോർക്കുന്നു. ചിഹ്നങ്ങളൊക്കെ വരുമ്പോൾ ഇത് വീണ്ടും സങ്കീർണ്ണമാകുന്നു. ലാറററൈററ് മണ്ണ് എന്ന ഉദാഹരണം നോക്കൂ.
ആശയങ്ങളോ വാക്കുകളോ ഒന്നു മറ്റൊന്നാണെന്നു സംശയിക്കാനിടവരുന്നത് മനുഷ്യർക്ക് പ്രശ്നമാകുമ്പോൾ അതിലേറെ പ്രശ്നമാണ് ഇവ പ്രൊസസ്സ് ചെയ്യുന്ന കമ്പ്യൂട്ടർ പ്രോഗ്രാമുകൾക്ക്. ന്റ യുടെ ചിത്രീകരണം ചർച്ചചെയ്തപ്പോഴും ഈ പ്രശ്നം നമ്മൾ കണ്ടിരുന്നു. ള്ള
എന്ന കൂട്ടക്ഷരത്തിനും റ്റ
യ്ക്ക് സമാനമായ പ്രശ്നമുണ്ട് ള-ള എന്നു വായിക്കാം വേണമെങ്കിൽ. പക്ഷേ ള-ള എന്ന് എഴുതേണ്ടിവരുന്ന സന്ദർഭങ്ങൾ ഇതുവരെ കുറവായതിനാലും രണ്ടും ളകളെയും വളരെ അടുപ്പിച്ചാണു് ഫോണ്ടുകളിൽ വരച്ചിട്ടുള്ളതെന്നതുകൊണ്ടും കാര്യമായ പ്രശ്നം ഉണ്ടാകുന്നില്ല.
യുണിക്കോഡിലെ റ്റ
മേൽപറഞ്ഞ ആശയക്കുഴപ്പങ്ങൾ നിലനിൽക്കുന്നതുകൊണ്ട് യുണിക്കോഡ് സ്റ്റാൻഡേഡിൽ മലയാളത്തിന്റെ വിശദാംശങ്ങൾക്കൊപ്പം പ്രത്യേകമായി റ്റയുടെ കാര്യം പറയുന്നുണ്ട്.
ഈ ടേബിളിൽ കുറച്ച് തെറ്റുകൾ ഉണ്ട്. നാലാമത്തെ വരിയിൽ മാറ്റെലി എന്നതിലെ അക്ഷരപ്പിശക് ശ്രദ്ധിക്കുക. മാറ്റൊലി എന്നതിനുപകരം മാറ്റെലി ആണ് കൊടുത്തിരിക്കുന്നതു്.
പിന്നെ, മാറ്റൊലി
എന്ന വാക്കിന്റെ യുണിക്കോഡ് ശ്രേണി
മ + ാ + റ + ് + റ + ൊ + ല + ി
അല്ലെങ്കിൽ
0D2E 0D3E 0D31 0D4D 0D31 0D4A 0D32 0D3F
എന്നാണ്. ടേബിളിൽ ഇതു് തെറ്റിക്കൊടുത്തിരിക്കുന്നത് ശ്രദ്ധിക്കുക(നാലാംവരിയിൽ).
ഇനി അഥവാ മാറെറാലി എന്ന് കാഴ്ചയിൽ(മാത്രം) വരുന്ന വിധം എഴുതണെമെങ്കിൽ
മ + ാ + റ + െ + റ + ാ + ല + ി
അല്ലെങ്കിൽ
0D2E 0D3E 0D31 0D46 0D31 0D3E 0D32 0D3F
ടേബിളിൽ ഇതു് ശരിയായിട്ടു തന്നെ കൊടുത്തിട്ടുണ്ട് (മൂന്നാം വരിയിൽ). എന്നിരിക്കിലും ഇതു് മാറെ-റാലി എന്നേ വായിക്കാൻ കഴിയൂ.
ആശയക്കുഴപ്പം ഒഴിവാക്കാൻ കൊണ്ടുവന്ന വിശദീകരണത്തിൽ പിശകുകൾ വന്നാൽ വീണ്ടും ആശയക്കുഴപ്പം ആവും. നിരത്തിയെഴുതിയ റ്റ കളിൽ വേണ്ട രീതിയിൽ സ്വരചിഹ്നങ്ങൾ ചേർത്ത് വേണ്ട രീതിയിലുള്ള ചിത്രീകരണം സാധ്യമാവും എന്നാണ് ടേബിൾ കാണിക്കാൻ ശ്രമിക്കുന്നതു്. ഉച്ചാരണത്തിലുള്ള ആശയക്കുഴപ്പം പക്ഷേ യുണിക്കോഡിന്റെ തലവേദന അല്ല.
ഒരു പുതിയ ഫോണ്ട് ഡിസൈൻ ചെയ്യുമ്പോൾ നിരത്തിയെഴുതിയ ററ ശൈലി പിന്തുടരാൻ ആരെങ്കിലും തീരുമാനിച്ചാൽ മുകളിലെ ടേബിൾ റെഫർ ചെയ്യാവുന്നതാണ്. എങ്കിലും വായനയിലെ ആശയക്കുഴപ്പം ഒഴിവാക്കാൻ ആവില്ല.
ഇക്കാരണം കൊണ്ടാവണം ആരും അത്തരം ഒരു ഡിസൈനിനു മുതിരാത്തതു്. ലിപ്യന്തരണം വഴി ഇംഗ്ലീഷിലെയും മറ്റൂം പല വാക്കുകളും മലയാളത്തിലെഴുതുമ്പോൾ റ്റ ധാരാളമായി ഭാഷയിലേക്ക് വരുന്നുണ്ട്.
റ + ചന്ദ്രക്കല + റ
എന്നെഴുതുകയും റ്റ
എന്നു് അടുക്കു എഴുതുകയും ചെയ്താൽ വായനയിലോ ചിത്രീകരണത്തിലോ ബുദ്ധിമുട്ടുകളൊന്നുമില്ലാതാക്കാം.
ഫോണ്ടുകളിൽ റ്റ
നേരത്തെ പറഞ്ഞപോലെ യുണിക്കോഡ് ഫോണ്ടുകളിലൊക്കെയും അടുക്കിയെഴുതിയ റ്റ ആണ് വരച്ചിട്ടുള്ളതു്.
റ+ ് + റ
എന്ന കൂട്ടക്ഷരമുണ്ടാക്കുന്ന ശ്രേണി akhand ഓപ്പൺടൈപ്പ് ഫീച്ചറുപയോഗിച്ച് ചെയ്തിരിക്കുന്നു:
lookup akhn_conjuncts {
lookupflag 0;
sub rh xx rh by rhrh;
} akhn_conjuncts;