ന്റ - ഭാഷ, യുണിക്കോഡ്, ചിത്രീകരണം
മലയാളം ഫോണ്ടുകളും ചിത്രീകരണവും - ലേഖന പരമ്പരയിലെ പുതിയ ലേഖനം
സന്തോഷ് തോട്ടിങ്ങല്
മലയാളത്തിലെ ന്റ എന്ന കൂട്ടക്ഷരത്തിന്റെ ചിത്രീകരണത്തെപ്പറ്റിയാണു് ഈ ലേഖനത്തില് വിശദീകരിയ്ക്കുന്നതു്. ഫോണ്ടുകളില് 'ന്റ' എന്ന കൂട്ടക്ഷരം എങ്ങനെ ചിത്രീകരിച്ചിരിയ്ക്കുന്നുവെന്നു പറയുന്നതിനുമുമ്പ് ന്റ എന്ന കൂട്ടക്ഷരത്തിന്റെ സവിശേഷതകള് അല്പം മനസ്സിലാക്കേണ്ടതുണ്ടു്.
ഖരം - അതിഖരം - മൃദു - ഘോഷം - അനുനാസികം എന്ന ക്രമത്തിലാണല്ലോ, മലയാളം അക്ഷരമാലയിൽ ഓരോ വർഗ്ഗത്തിലും പെടുന്ന വ്യഞ്ജനാക്ഷരങ്ങൾ അടുക്കിയിരിക്കുന്നതു്. കവര്ഗ്ഗത്തിനു ക, ഖ, ഗ, ഘ, ങ എന്നിങ്ങനെ. ഇവയിലെ അനുനാസികവും ഖരവും ചേര്ന്നുണ്ടാക്കുന്ന കൂട്ടക്ഷരങ്ങളെ ഒന്നു ശ്രദ്ധിച്ചു നോക്കൂ:
- ങ + ക = ങ്ക (കൊങ്ക, മങ്ക, അങ്കം, പങ്കം, തങ്കം)
- ഞ + ച = ഞ്ച (കൊഞ്ചു്, കൊഞ്ചൽ, അഞ്ചു്, അഞ്ചൽ, തഞ്ചം)
- ണ + ട = ണ്ട (മണ്ട, ചെണ്ട, തണ്ടു്, ചെണ്ടു്, മുണ്ടു്)
- ന + ത = ന്ത (കൊന്ത, തന്ത, മൊന്ത, മോന്ത, സ്വന്തം)
- മ + പ = മ്പ (അമ്പു്, തുമ്പു്, ചെമ്പു്, കമ്പു്, മുമ്പു്)
ഈ അഞ്ചുതരം ഖരാക്ഷരങ്ങള് കൂടാതെ ട
വർഗ്ഗത്തിനും ത
വർഗ്ഗത്തിനും ഇടയിലായി മലയാളത്തിൽ ഒരു ta-വർഗ്ഗം ഉണ്ടായിരുന്നു. അതിന്റെ അനുനാസികമാണു്, നനയുക
എന്ന വാക്കിലെ രണ്ടാമത്തെ നയുടെ ഉച്ചാരണമായി വരുന്ന ലിപിരൂപമില്ലാത്ത സ്വനിമയെന്നും ഒരു വാദമുണ്ടു്. അറ്റം, കുറ്റം, മുറ്റം, പറ്റം എന്നൊക്കെയുള്ള വാക്കുകളിലെ റ്റയുടെ അർദ്ധരൂപമാണു്, ta. ഗണിതഭാഷയിൽ റ്റ/2
എന്നു വേണമെങ്കില് പറയാം.
കേരളപാണിനീയത്തിൽ റ്റ/2 എന്ന അക്ഷരത്തെ കുറിക്കാൻ ഺ
എന്ന അക്ഷരചിത്രമാണു് ഉപയോഗിക്കുന്നതു്. naകാരത്തിനു് ഩ
എന്ന അക്ഷരരൂപവും ഉപയോഗിക്കുന്നു. ഈ അക്ഷരങ്ങള് പ്രത്യേകം യുണിക്കോഡില് എന്കോഡ് ചെയ്യപ്പെട്ടിട്ടുണ്ടെങ്കിലും വ്യാകരണചര്ച്ചകള്ക്കല്ലാതെ ഇന്നു നമ്മള് ഉപയോഗിക്കാറില്ല.
അങ്ങനെ ഒരു ഺ
വര്ഗ്ഗം ഉണ്ടായിരുന്നെങ്കില് മേല്പ്പറഞ്ഞപോലെ അനുനാസികവും ഖരവും ചേര്ന്നു് ഒരു കൂട്ടക്ഷരം ഉണ്ടായിരിക്കണമല്ലോ. ഩ + ഺ = ഩ്ഺ എന്ന കൂട്ടക്ഷരം. പക്ഷേ ഈ അക്ഷരങ്ങള് പ്രചാരത്തില്ലെങ്കിലും ഈ കൂട്ടക്ഷരത്തിന്റെ ഉച്ചാരണമായ ന്റ
നമ്മള് ധാരാളമായി ഉപയോഗിക്കുന്നുണ്ടു്. ഺ = റ്റ യുടെ പാതി എന്ന യുക്തിയില് റ
യും, ഩ
എന്ന ഉച്ചാരണത്തിനു പകരം ന
യും ഉപയോഗിച്ചാല് ന+്+ റ
എന്നാവും ന്റയുടെ പിരിച്ചെഴുത്തു്. ആ വിധമാണു് ഇന്സ്ക്രിപ്റ്റ് അടക്കമുള്ള മിക്ക മലയാളം ഇന്പുട്ട് മെത്തേഡുകളിലും ഫോണ്ടുകളിലും ന്റ
എഴുതിക്കൊണ്ടിരുന്നതു്
ന്റ = ന + ് + റ
കാഴ്ച മാത്രം ശരിയാവേണ്ട അച്ചടിയില്(വിവരസംസ്കരണം അച്ചടിയിലില്ല, കമ്പ്യൂട്ടറിലേ ഉള്ളൂ), ന്റ
എന്നു നിരത്തി എഴുതുന്ന ശൈലി വ്യാപകമായിരുന്നു. ന്റെ
എന്നെഴുതേണ്ടിവരുമ്പോള് ന്െറ
എന്നും എഴുതുമായിരുന്നു. െ
ചിഹ്നം ന്റ
യുടെ ഇടതുവശത്താണെന്നു ശ്രദ്ധിക്കുക. ന്റൊ നിരത്തിയെഴുതുന്ന ശൈലിയില് ന്െറാ
എന്നും ആവും.
പക്ഷേ ഇങ്ങനെ നിരത്തിയുള്ള ന്റ
ആശയക്കുഴപ്പമുണ്ടാക്കും. ഉദാഹരണത്തിനു് ഹെന്റി
എന്നെഴുതിയാല് വായിക്കേണ്ടതു് ന്റയുടെ ഉച്ചാരണമല്ല, ഇംഗ്ലീഷില് nr
എന്നതിനോടടുത്തുവരുന്ന ഒരുച്ചാരമാണതു്. പരിചയമില്ലാത്ത വാക്കുകള് വരുമ്പോള് എങ്ങനെ വായിക്കണമെന്നറിയാതെ കുഴങ്ങും. എന്റിക്കലെക്സി
എന്ന കപ്പല് വാര്ത്തകളില് ഉണ്ടായിരുന്നപ്പോള് ആളുകള് Entica എന്ന രീതിയിലും Enrica എന്ന രീതിയിലും അതു വായിച്ചിരുന്നു.
മാതൃഭൂമി പത്രമൊക്കെ നിരത്തിയുള്ള എഴുത്താണു് ന്റയ്ക്ക് ഉപയോഗിക്കുന്നതു്. അതു് ആശയക്കുഴപ്പമുണ്ടാക്കിക്കൊണ്ടിരിക്കുകയും ചെയ്യുന്നു. പക്ഷേ ന് മുകളിലും റ താഴെയുമായി എഴുതുന്ന യുണികോഡ് ഫോണ്ടുകളേ ഞാന് കണ്ടിട്ടുള്ളൂ. അവ ആശയക്കുഴപ്പമില്ലാത്ത രീതിയില് 'nta' എന്ന ഉച്ചാരണത്തിനു ന്റ
എന്നും nra
എന്ന ഉച്ചാരണത്തിനു ന്റ
എന്നു ഉപയോഗിച്ചുവരുന്നു. ഈയൊരു വ്യവസ്ഥ എല്ലാ ഫോണ്ടുകളും പിന്തുടരുന്നതു് വളരെ നല്ല കാര്യമാണു്.
കാര്ത്തികയുടെ ന്റ
കാഴ്ചയിലെ വ്യവസ്ഥ പക്ഷേ ഫോണ്ടുകളുടെ ഉള്ളിലില്ല എന്നതാണു് സങ്കടം. മൈക്രോസോഫ്റ്റിന്റെ ഫോണ്ടുകളില്(കാര്ത്തിക, നിര്മല), ന്റ എന്ന അടുക്കിയ രീതി ന്+റ എന്ന കൂട്ടത്തിനാണു് കൊടുത്തിരിക്കുന്നതു്. ബാക്കി എല്ലാ ഫോണ്ടുകളിലും(മീര, രചന, അഞ്ജലി, രഘുമലയാളം...) അതു് ന്റ = ന് + റ ആവുമ്പോള് മൈക്രോസോഫ്റ്റ് ഫോണ്ടുകളില് അതു് ന് റ
എന്നേ ചിത്രീകരിക്കൂ.
അതുകൊണ്ടുതന്നെ മീര, രചന തുടങ്ങിയ ഫോണ്ടുകളില് വൃത്തിയായി കണ്ടിരുന്ന ന്റ, മൈക്രോസോഫ്റ്റ് ഫോണ്ടുകള് ഉപയോഗിച്ചുകാണുമ്പോള് തെറ്റായി കാണും. ഇനി മൈക്രോസോഫ്റ്റ് ഫോണ്ടുകള് ഉപയോഗിച്ചു ശരിയായി കാണാന് വേണ്ടി എന്റെ
എന്നതിനെ എന്റെ
എന്നെഴുതുന്ന വിന്ഡോസ് ഉപയോക്താക്കളുണ്ടു്. അവരെഴുതിയതു് മറ്റു ഫോണ്ടുകള് ഉപയോഗിക്കുന്നവര് വായിക്കുന്നതു് 'enre' എന്നുമാണു്.
ശരിക്കും ആരാണു് ന്റ എങ്ങനെ എഴുതണം എന്നു തീരുമാനിക്കേണ്ടതു്? ക +് + ക = ക്ക എന്നാണെന്നു ആരെങ്കിലും പ്രത്യേകിച്ചു തീരുമാനിച്ചതാണോ? അതുപോലെ തന്നെയാണെന്നു് തോന്നുന്നു ന്റയുടെ കാര്യവും. ഈ ലേഖനത്തിന്റെ ആദ്യഭാഗത്തു സൂചിപ്പിച്ച കേരള പാണിനീയത്തിലെ ഩ, ഺ എന്നീ അക്ഷരങ്ങളുടെ കാര്യവും, കൂടാതെ ഹെന്റി എന്നൊക്കെ എഴുതാന് വേണ്ട ചില്ലക്ഷരം+റ യുടെ കാര്യവും ഒക്കെ ചേര്ത്തുവെച്ചാല്, വര്ഷങ്ങള്ക്കു മുന്നേ ഫോണ്ടുകളും ഇന്പുട്ട് മെത്തേഡുകളും തുടങ്ങിവെച്ച കുറേയൊക്കെ ഭാഷായുക്തിക്കനുസരിച്ച ഒരു പിരിച്ചെഴുത്തു് ന്+റ എന്നാണെന്നു വരുന്നു. പക്ഷേ മൈക്രോസോഫ്റ്റ് കാര്ത്തിക, നിര്മല ഫോണ്ടുകള് ഈ വ്യവസ്ഥ പിന്തുടരാത്തതുകൊണ്ടു് ആകെ പ്രശ്നമാവുകയും ചെയ്തു.വിന്ഡോസില് സ്വതേ വരുന്ന ഫോണ്ടുകളായതിനാല് വളരെയധികം ആളുകള് അതുപയോഗിക്കുന്നുമുണ്ടു്.
വാസ്തവത്തില് ഈ പ്രശ്നം മൈക്രോസോഫ്റ്റ് പരിഹരിച്ചാല് എല്ലാ കുഴപ്പവും തീര്ന്നേനെ. മൈക്രോസോഫ്റ്റ് അവരുടെ രീതിയില് പ്രശ്നം പരിഹരിക്കുക തന്നെ ചെയ്തു. അവരുടെ രീതി ബഗ്ഗുകള്ക്കു പകരം സ്റ്റാന്ഡേഡ് തിരുത്തുകയാണു്. യുണിക്കോഡ് പക്ഷേ, അക്ഷരങ്ങളെയല്ലേ എന്കോഡ് ചെയ്യുന്നതു്, കൂട്ടക്ഷരങ്ങളെ എന്കോഡ് ചെയ്യാറില്ലല്ലോ എന്ന ചോദ്യം ന്യായമാണു്. ന്റയുടെ ചിത്രീകരണത്തെപ്പറ്റി യുണിക്കോഡ് സ്റ്റാന്ഡേഡിന്റെ മലയാളത്തിന്റെ അദ്ധ്യായത്തില് വിശദീകരികുന്നതിനിടയില് ആണു് ന്റ എങ്ങനെ വേണമെന്നു പരാമര്ശിക്കുന്നതു്.
അതുപ്രകാരം ന്റ എന്നെഴുതേണ്ടതു് ന്+റ
അല്ല, ന്+റ
യും അല്ല. ന്+്+ റ
എന്നാണു്. ചില്ലക്ഷരത്തിനു മലയാളത്തിലാരും ചന്ദ്രക്കല ഇടാറില്ല എന്നോര്ക്കണം. വ്യഞ്ജനങ്ങളുടെ സ്വരം ചേരാത്തരൂപം സൂചിപ്പിക്കാനാണു് ചില്ലുകള് ഉള്ളത്. ചില്ലില്ലാത്ത വ്യഞ്ജനങ്ങള് അതു് ചന്ദ്രക്കലയിട്ടും എഴുതും, ന്, പ് എന്നൊക്കെ.
'ന്റ'യുടെ യുക്തി വിവരിക്കാൻ എനിക്ക് സാധിക്കുമെന്നു തോന്നുന്നില്ല. എന്നാലും നടന്നതെന്തെന്നു പറയാം. ന്റ എന്നതു നിജപ്പെടുത്തണം (പറ്റുമെങ്കിൽ < na, virama, rra > എന്നതിലേയ്ക്ക്) എന്ന പ്രപ്പോസലുമായാണ് ഞാൻ utc-യെ സമീപിച്ചത്. എന്നാൽ ആ സീക്വൻസ് 'ന്റ'യ്ക്ക് വേണ്ടി മൈക്രോസോഫ്റ്റ് ഉപയോഗിച്ചിരുന്നതുകൊണ്ട് അവർക്കതു സ്വീകാര്യമായില്ല. zwj ഇല്ലാത്ത ഏതെങ്കിലും സീക്വൻസ് ആണ് വേണ്ടിയിരുന്നത്. ഒരു റെൻഡറിംഗ് പോയിന്റ് ഓഫ് വ്യൂവിൽ 'ന്റ' എന്നതിനെ ചില്ലിന്റെ ഒരു conjunct ആയി കാണാവുന്നതുകൊണ്ട്, അടുത്ത ബെസ്റ്റ് ഓപ്ഷനായി അത് സ്വീകരിക്കപ്പെട്ടു. 'റ' എന്നതിന്റെ സബ്സ്ക്രിപ്റ്റ് <virama, rra> എന്നാണല്ലോ ഉണ്ടാക്കുക.- സിബു സി.ജെ - സെപ്റ്റംബര് 2009 - എസ്.എം.സി മെയിലിങ്ങ് ലിസ്റ്റ്
അങ്ങനെ രണ്ടുതരം ന്റ എഴുത്തു് പരിഹരിക്കാന് അതു് മൂന്നില്പരമാക്കി യുണിക്കോഡ് സ്റ്റാന്ഡേഡ് മാതൃകയായി. അതോടൊപ്പം ചില്ലക്ഷരം ന്, അറ്റോമിക് ആയും അല്ലാതെയും എഴുതാമെന്നും അതേ സ്റ്റാന്ഡേഡില് പറയുന്നുണ്ടു്. മൊത്തം എത്ര രീതിയില് ന്റ എഴുതാമെന്നുള്ള ചോദ്യം വായനക്കാര്ക്കു വിട്ടുതരുന്നു.
തീര്ച്ചയായും ഇതു് ഫോണ്ടിലെ ന്റ-യ്ക്ക് വേണ്ട നിയമങ്ങളെ സങ്കീര്ണ്ണമാക്കും. സ്വതന്ത്ര ഫോണ്ടുകളില് എങ്ങനെ ന്റ എന്ന അക്ഷരം എങ്ങനെ ചിത്രീകരിയ്ക്കുന്നു എന്നു നമുക്ക് ഓരോന്നായി പരിശോധിക്കാം.
ഫോണ്ടുകളിലെ ന്റ
മീര, രചന തുടങ്ങി സ്വതന്ത മലയാളം കമ്പ്യൂട്ടിങ്ങ് മെയിന്റെയിന് ചെയ്യുന്ന എല്ലാ ഫോണ്ടുകളിലും ന്റയെ സംബന്ധിച്ച് ന്+റ എന്ന ഒരു രീതി മാത്രമേ പിന്തുണയ്ക്കുന്നുള്ളൂ. വ്യവസ്ഥയില്ലാത്ത എഴുത്തു് ഒട്ടും പ്രോത്സാഹിപ്പിക്കപ്പെടേണ്ട പ്രവണതയല്ല എന്ന ചിന്തയാണു് ഇതിനു പിറകില്. കൂടാതെ ഹെന്റി എന്നു ചില്ലക്ഷരമൊക്കെ ഇട്ടെഴുതിയ വാക്ക് ഹെന്റി എന്നു ചിത്രീകരിക്കുന്നതു് ശരിയല്ലല്ലോ. ചില്ലിനു ചന്ദ്രക്കലയിടുന്ന രീതിയും പിന്തുണയ്ക്കുന്നില്ല.
akhnd ഫീച്ചര് ഉപയോഗിച്ചുള്ള ന + ് + റ എന്ന ലുക്കപ്പ് മലയാളത്തിന്റെ രണ്ടു് സ്ക്രിപ്റ്റ് ടാഗിനും കൊടുത്തിരിക്കുന്നു.
ഇനി,ഗൂഗിളിന്റെ നോട്ടോ സാന്സ് മലയാളം ഫോണ്ടിലെ റെന്ഡറിങ്ങ് നിയമങ്ങള് നോക്കൂ.
യുണിക്കോഡ് സ്റ്റാന്ഡേഡും കാര്ത്തിക/നിര്മല ഫോണ്ടുകളിലെ ബഗ്ഗും, ന്+റ എന്ന രീതിയും എല്ലാം കൂടി പിന്തുണയ്ക്കുന്ന ഈ ഫോണ്ടില് മുകളില് കാണിച്ചപോലെ 5 തരത്തില് ന്റ ഉണ്ടാക്കാനുള്ള നിയമങ്ങളാണുള്ളത് (ഒന്നു ഡൂപ്ലിക്കേറ്റ് ആണ്). യുണിക്കോഡ് എന്ന സ്റ്റാന്ഡേഡിന്റെ ഉദ്ദേശത്തെ തന്നെ ചോദ്യം ചെയ്യുന്നതാണു്. യുണിക്കോഡ് മാനകവും ഭാഷാനിയമങ്ങളും രണ്ടുവഴിക്കു പിരിയുന്ന ചുരുക്കം ചില സന്ദര്ഭങ്ങളിലൊന്നാണിതു്.
യുണിക്കോഡിന്റെ ന്റ യും കുഴപ്പങ്ങളും
2008 ല് പുറത്തിറങ്ങിയ യുണിക്കോഡ് 5.1 പതിപ്പിലാണു് ന്റയെ സംബന്ധിച്ച കാര്യങ്ങള് യൂണിക്കോഡ് പറയുന്നതു്.
ഇതനുസരിച്ചു്, നിരത്തിയെഴുതിയ ന്റ, 'nta' എന്നോ 'nra' എന്നോ വായിക്കാമെന്നു പറയുന്നു. അതു് ശരിയാണു്. വായനയില് ഇതു് ആശയക്കുഴപ്പമുണ്ടാക്കുന്നതാണു്.ചില്ലക്ഷരവും റയുടെ ചേര്ത്തെഴുതിയാല് അതു് നിരത്തിത്തന്നെ കാണിക്കണമെന്നും, എങ്ങനെ വേണമെങ്കിലും വായിക്കാമെന്നും പറയുന്നു. ഇനി ന് -ന്റെ താഴെ റ അടുക്കി എഴുതുന്ന ന്റ വേണമെങ്കില് ൻ + ് + റ
എന്നുപയോഗിക്കണം. അതുപ്രകാരം 'ആന്റോ' എന്നു നിരത്തിയ ന്റ വെച്ച് എഴുതുന്നത് :
ആ + ൻ + േ + റ + ാ
എന്നാണു്. എന്നിട്ടതു് 'anto' എന്നു വായിക്കാം!
ഇനി ആന്റോ എന്നു ന്റ അടുക്കിയ രീതിയിലാണെങ്കിലോ,
ആ + ൻ + ് + റ + േ + ാ
എന്നാണു്. എന്നിട്ടതും 'anto' എന്നു വായിക്കാം.
Enroll എന്നു മലയാളത്തിലെഴുതാന്
എ + ൻ + റ + േ + ാ + ൾ
ഇതില് ആദ്യം പറഞ്ഞ ആ + ൻ + േ + റ + ാ
ശ്രേണിയില് േ
ചിഹ്നം ഇടുന്നതു് ൻ
ചില്ലക്ഷരത്തിനാണു്. ചില്ലക്ഷരത്തിനു സ്വരചിഹ്നം ഇടുന്ന മലയാളം നമുക്ക് അപരിചിതമാണു്. ചില്ലിന്റെ നിര്വചനം തന്നെ സ്വരം ചേരാത്ത വ്യഞ്ജനം എന്നാണല്ലോ.
യുണിക്കോഡിന്റെ ഈ പരാമര്ശം 2008 ല് വരുന്നതിനു മുമ്പും അതിനു ശേഷവും എല്ലാവരും എഴുതിയിരുന്ന ന്+റ
എന്ന ന്റയെക്കുറിച്ചിതില് ഒന്നും പറയുന്നില്ല.
"The sequence <0D7B, 0D31> is rendered as ൻറ regardless of the reading of that text." എന്നു പറഞ്ഞിരിക്കുന്നതുകൊണ്ട് എ + ൻ + റ + േ + ാ + ൾ
എന്നതിന്റെ പട്ടികയില് കാണിച്ചിരിക്കുന്ന Enroll എന്ന രീതിയിലല്ലാതെ 'Entoll' എന്നു വായിച്ചാലും തെറ്റുപറയാന് പറ്റില്ല.
പോരാതെ, ആ + ൻ + േ + റ + ാ
എന്ന ശ്രേണിയില് വേറൊരു ഭാഷാ പ്രശ്നം കൂടിയുണ്ടു്. 'anto' എന്ന ഉച്ചാരണത്തില് 2 ഘടകങ്ങള് ഉണ്ടു് - ആ, ന്റോ . സില്ലബിള്സ് എന്നും പറയാം. മലയാളത്തിലെ സില്ലബിള് തനിയെ നില്ക്കുന്ന അക്ഷരങ്ങള്, സ്വരചിഹ്നങ്ങളോടുകൂടിയ അക്ഷരങ്ങള്, ചന്ദ്രക്കലയിട്ടു ഘടിപ്പിച്ചു കൂട്ടക്ഷരങ്ങള്, സ്വരചിഹ്നങ്ങളോടു കൂടിയ കൂട്ടക്ഷരങ്ങള് എന്നിവയാണു്. ഇതിലെ ൻ + േ + റ + ാ
ഈ വകുപ്പിലൊന്നും വരില്ല. ചിത്രീകരണത്തിനപ്പുറത്തു് ഭാഷ പ്രൊസസ്സ് ചെയ്യേണ്ട അവസ്ഥയില് ഇതെല്ലാം സങ്കീര്ണ്ണമാക്കുകയാണു്. എന്തിന്? എന്തുപ്രശ്നമാണു് യുണിക്കോഡ് പരിഹരിക്കാന് ശ്രമിച്ചതു് എന്ന ചോദ്യങ്ങളെല്ലാം ബാക്കി നില്ക്കുന്നു.
ആന്റോയുടെ പേരെങ്ങനെ എഴുതും?
Anto എന്നു് പേരുള്ള ഒരാള്ക്കു് തന്റെ പേരു് മലയാളത്തിലെഴുതണമെന്നു തോന്നിയാല് കുടുങ്ങിയതു തന്നെ. താഴെപ്പറയുന്നതില് ഏതാണു് അദ്ദേഹത്തിനു ടൈപ്പു ചെയ്യേണ്ടിവരിക?
- ആ + ൻ + േ + റ + ാ (നിരത്തിയെഴുതിയ ന്റ, യുണിക്കോഡ് മാനകമനുസരിച്ചു്)
- ആ + ൻ + ് + റ + േ + ാ ( അടുക്കിയെഴുതിയ ന്റ കിട്ടാന്, യുണിക്കോഡ് മാനകമനുസരിച്ചു്)
- ആ + ൻ + റ + േ + ാ (ഇതു് Anro എന്നും Anto എന്നും വായിക്കാമെന്നു യുണിക്കോഡ് പറഞ്ഞു. കാര്ത്തിക/നിര്മല ഫോണ്ടുകളില് ഇതു് അടുക്കിയെഴുതിയ ന്റ കാണിക്കും. മീര, രചന എന്നിവയില് നിരത്തിയെഴുതിയതും)
- ആ + ന + ് + റ + ോ (മീര, രചന, അഞ്ജലി തുടങ്ങിയ ഫോണ്ടുകള് അടുക്കിയെഴുതിയ ന്റ കാണിക്കും. യുണിക്കോഡ് ന്റയെപ്പറ്റി പറയുന്നതിനു മുന്നേ ഇങ്ങനെയാണെഴുതിയിരുന്നതു്. സ്കൂളുകളില് മലയാളം ടൈപ്പിങ്ങില് പഠിപ്പിക്കുന്നതും ഇതാണു്. യുണിക്കോഡ് ഇതിനെപ്പറ്റി ഒന്നും പറയുന്നില്ല)
- ആ + ന + ് + ZWJ + റ + േ + ാ (ZWJ ഉപയോഗിച്ചുള്ള ന്. കാര്ത്തിക/നിര്മല ഫോണ്ടുകളില് ഇതു് അടുക്കിയെഴുതിയ ന്റ കാണിക്കും. മീര, രചന എന്നിവയില് നിരത്തിയെഴുതിയതും)
പേരുകളൊക്കെ സെര്ച്ച്, സോര്ട്ട് ചെയ്യേണ്ടിവരുന്ന സോഫ്റ്റ്വെയറുകള് ഇവയെല്ലാം നമ്മുടെ ആന്റോ ആണെന്നു മനസ്സിലാക്കുമോ? മനസ്സിലാക്കിയില്ലെങ്കില് ആന്റോയ്ക്ക് സോഫ്റ്റ്വെയറുള് പണി കൊടുത്തുകൊണ്ടേ ഇരിക്കുമോ? മലയാളികള് മക്കള്ക്കു പേരിടുന്നതിനുമുമ്പേ ഇതൊക്കെ ആലോചിക്കുന്നതു് നല്ലതായിരിക്കും.
പ്രശ്നം ഇതിലും നില്ക്കില്ല . മലയാളത്തില് വളരെ സാധാരണയായി ഉപയോഗിക്കുന്ന വാക്കാണ് "എന്റെ". എന്നതും അതിന്റെ രൂപങ്ങളും. മലയാളത്തിന്റെ കമ്പ്യൂട്ടേഷണല് ലിംഗ്വിസ്റ്റിക്സിലേയ്ക്കും നാച്വറല് ലാംഗേജ് പ്രൊസസിങ്ങിലേയ്ക്കും നോക്കുകയായാലും ന്റ
എന്ന അക്ഷരം സെന്റിമെന്റ്സ് അനലൈസിങ്ങില് സുപ്രധാന സ്ഥാനമുള്ളതാണു്.
ഈ വക പ്രശ്നങ്ങള്ക്കു തലവെച്ചുകൊടുക്കാതിരിക്കാനും ഡേറ്റയില് പലവിധമായതിനെ കാഴ്ചയില് ഒന്നായിക്കാണിച്ചു പറ്റിക്കാതിരിക്കാനും ആണു് സ്വതന്ത്രമലയാളം കമ്പ്യൂട്ടിങ്ങിന്റെ ഫോണ്ടുകളില് ന്റ എഴുതാനായി ഒരേ ഒരു നിയമം ഉള്ളതു്. അത് ഭാഷയെ പിന്പറ്റുന്നതാണു താനും.
ന്റ യുടെ ചിത്രീകരണം വിവിധ ഫോണ്ടുകളിലെങ്ങനെയെന്നും യുണിക്കോഡില് പുതിയ സീക്വന്സ് എങ്ങനെ വന്നു എന്നും വിശദമാക്കുന്ന റിപ്പോര്ട്ട് : http://thottingal.in/documents/Malayalam-NTA.pdf
ന്റ യെപ്പോലെത്തന്നെ കുഴപ്പക്കാരനാണു് റ്റ-യും. അതിനെപ്പറ്റി വേറൊരു ലേഖനത്തില് എഴുതാം.