SMC Monthly Newsletter: March 2024
ReleasesIntroducing Indic SubtitlerIndic subtitler landing pageIndic subtitler is an open source subtitle generator for Indic
മലയാളം ഫോണ്ടുകളും ചിത്രീകരണവും - ലേഖന പരമ്പരയിലെ പുതിയ ലേഖനം
സന്തോഷ് തോട്ടിങ്ങല്
മലയാളത്തിലെ ന്റ എന്ന കൂട്ടക്ഷരത്തിന്റെ ചിത്രീകരണത്തെപ്പറ്റിയാണു് ഈ ലേഖനത്തില് വിശദീകരിയ്ക്കുന്നതു്. ഫോണ്ടുകളില് 'ന്റ' എന്ന കൂട്ടക്ഷരം എങ്ങനെ ചിത്രീകരിച്ചിരിയ്ക്കുന്നുവെന്നു പറയുന്നതിനുമുമ്പ് ന്റ എന്ന കൂട്ടക്ഷരത്തിന്റെ സവിശേഷതകള് അല്പം മനസ്സിലാക്കേണ്ടതുണ്ടു്.
ഖരം - അതിഖരം - മൃദു - ഘോഷം - അനുനാസികം എന്ന ക്രമത്തിലാണല്ലോ, മലയാളം അക്ഷരമാലയിൽ ഓരോ വർഗ്ഗത്തിലും പെടുന്ന വ്യഞ്ജനാക്ഷരങ്ങൾ അടുക്കിയിരിക്കുന്നതു്. കവര്ഗ്ഗത്തിനു ക, ഖ, ഗ, ഘ, ങ എന്നിങ്ങനെ. ഇവയിലെ അനുനാസികവും ഖരവും ചേര്ന്നുണ്ടാക്കുന്ന കൂട്ടക്ഷരങ്ങളെ ഒന്നു ശ്രദ്ധിച്ചു നോക്കൂ:
ഈ അഞ്ചുതരം ഖരാക്ഷരങ്ങള് കൂടാതെ ട
വർഗ്ഗത്തിനും ത
വർഗ്ഗത്തിനും ഇടയിലായി മലയാളത്തിൽ ഒരു ta-വർഗ്ഗം ഉണ്ടായിരുന്നു. അതിന്റെ അനുനാസികമാണു്, നനയുക
എന്ന വാക്കിലെ രണ്ടാമത്തെ നയുടെ ഉച്ചാരണമായി വരുന്ന ലിപിരൂപമില്ലാത്ത സ്വനിമയെന്നും ഒരു വാദമുണ്ടു്. അറ്റം, കുറ്റം, മുറ്റം, പറ്റം എന്നൊക്കെയുള്ള വാക്കുകളിലെ റ്റയുടെ അർദ്ധരൂപമാണു്, ta. ഗണിതഭാഷയിൽ റ്റ/2
എന്നു വേണമെങ്കില് പറയാം.
കേരളപാണിനീയത്തിൽ റ്റ/2 എന്ന അക്ഷരത്തെ കുറിക്കാൻ ഺ
എന്ന അക്ഷരചിത്രമാണു് ഉപയോഗിക്കുന്നതു്. naകാരത്തിനു് ഩ
എന്ന അക്ഷരരൂപവും ഉപയോഗിക്കുന്നു. ഈ അക്ഷരങ്ങള് പ്രത്യേകം യുണിക്കോഡില് എന്കോഡ് ചെയ്യപ്പെട്ടിട്ടുണ്ടെങ്കിലും വ്യാകരണചര്ച്ചകള്ക്കല്ലാതെ ഇന്നു നമ്മള് ഉപയോഗിക്കാറില്ല.
അങ്ങനെ ഒരു ഺ
വര്ഗ്ഗം ഉണ്ടായിരുന്നെങ്കില് മേല്പ്പറഞ്ഞപോലെ അനുനാസികവും ഖരവും ചേര്ന്നു് ഒരു കൂട്ടക്ഷരം ഉണ്ടായിരിക്കണമല്ലോ. ഩ + ഺ = ഩ്ഺ എന്ന കൂട്ടക്ഷരം. പക്ഷേ ഈ അക്ഷരങ്ങള് പ്രചാരത്തില്ലെങ്കിലും ഈ കൂട്ടക്ഷരത്തിന്റെ ഉച്ചാരണമായ ന്റ
നമ്മള് ധാരാളമായി ഉപയോഗിക്കുന്നുണ്ടു്. ഺ = റ്റ യുടെ പാതി എന്ന യുക്തിയില് റ
യും, ഩ
എന്ന ഉച്ചാരണത്തിനു പകരം ന
യും ഉപയോഗിച്ചാല് ന+്+ റ
എന്നാവും ന്റയുടെ പിരിച്ചെഴുത്തു്. ആ വിധമാണു് ഇന്സ്ക്രിപ്റ്റ് അടക്കമുള്ള മിക്ക മലയാളം ഇന്പുട്ട് മെത്തേഡുകളിലും ഫോണ്ടുകളിലും ന്റ
എഴുതിക്കൊണ്ടിരുന്നതു്
ന്റ = ന + ് + റ
കാഴ്ച മാത്രം ശരിയാവേണ്ട അച്ചടിയില്(വിവരസംസ്കരണം അച്ചടിയിലില്ല, കമ്പ്യൂട്ടറിലേ ഉള്ളൂ), ന്റ
എന്നു നിരത്തി എഴുതുന്ന ശൈലി വ്യാപകമായിരുന്നു. ന്റെ
എന്നെഴുതേണ്ടിവരുമ്പോള് ന്െറ
എന്നും എഴുതുമായിരുന്നു. െ
ചിഹ്നം ന്റ
യുടെ ഇടതുവശത്താണെന്നു ശ്രദ്ധിക്കുക. ന്റൊ നിരത്തിയെഴുതുന്ന ശൈലിയില് ന്െറാ
എന്നും ആവും.
പക്ഷേ ഇങ്ങനെ നിരത്തിയുള്ള ന്റ
ആശയക്കുഴപ്പമുണ്ടാക്കും. ഉദാഹരണത്തിനു് ഹെന്റി
എന്നെഴുതിയാല് വായിക്കേണ്ടതു് ന്റയുടെ ഉച്ചാരണമല്ല, ഇംഗ്ലീഷില് nr
എന്നതിനോടടുത്തുവരുന്ന ഒരുച്ചാരമാണതു്. പരിചയമില്ലാത്ത വാക്കുകള് വരുമ്പോള് എങ്ങനെ വായിക്കണമെന്നറിയാതെ കുഴങ്ങും. എന്റിക്കലെക്സി
എന്ന കപ്പല് വാര്ത്തകളില് ഉണ്ടായിരുന്നപ്പോള് ആളുകള് Entica എന്ന രീതിയിലും Enrica എന്ന രീതിയിലും അതു വായിച്ചിരുന്നു.
മാതൃഭൂമി പത്രമൊക്കെ നിരത്തിയുള്ള എഴുത്താണു് ന്റയ്ക്ക് ഉപയോഗിക്കുന്നതു്. അതു് ആശയക്കുഴപ്പമുണ്ടാക്കിക്കൊണ്ടിരിക്കുകയും ചെയ്യുന്നു. പക്ഷേ ന് മുകളിലും റ താഴെയുമായി എഴുതുന്ന യുണികോഡ് ഫോണ്ടുകളേ ഞാന് കണ്ടിട്ടുള്ളൂ. അവ ആശയക്കുഴപ്പമില്ലാത്ത രീതിയില് 'nta' എന്ന ഉച്ചാരണത്തിനു ന്റ
എന്നും nra
എന്ന ഉച്ചാരണത്തിനു ന്റ
എന്നു ഉപയോഗിച്ചുവരുന്നു. ഈയൊരു വ്യവസ്ഥ എല്ലാ ഫോണ്ടുകളും പിന്തുടരുന്നതു് വളരെ നല്ല കാര്യമാണു്.
കാഴ്ചയിലെ വ്യവസ്ഥ പക്ഷേ ഫോണ്ടുകളുടെ ഉള്ളിലില്ല എന്നതാണു് സങ്കടം. മൈക്രോസോഫ്റ്റിന്റെ ഫോണ്ടുകളില്(കാര്ത്തിക, നിര്മല), ന്റ എന്ന അടുക്കിയ രീതി ന്+റ എന്ന കൂട്ടത്തിനാണു് കൊടുത്തിരിക്കുന്നതു്. ബാക്കി എല്ലാ ഫോണ്ടുകളിലും(മീര, രചന, അഞ്ജലി, രഘുമലയാളം...) അതു് ന്റ = ന് + റ ആവുമ്പോള് മൈക്രോസോഫ്റ്റ് ഫോണ്ടുകളില് അതു് ന് റ
എന്നേ ചിത്രീകരിക്കൂ.
അതുകൊണ്ടുതന്നെ മീര, രചന തുടങ്ങിയ ഫോണ്ടുകളില് വൃത്തിയായി കണ്ടിരുന്ന ന്റ, മൈക്രോസോഫ്റ്റ് ഫോണ്ടുകള് ഉപയോഗിച്ചുകാണുമ്പോള് തെറ്റായി കാണും. ഇനി മൈക്രോസോഫ്റ്റ് ഫോണ്ടുകള് ഉപയോഗിച്ചു ശരിയായി കാണാന് വേണ്ടി എന്റെ
എന്നതിനെ എന്റെ
എന്നെഴുതുന്ന വിന്ഡോസ് ഉപയോക്താക്കളുണ്ടു്. അവരെഴുതിയതു് മറ്റു ഫോണ്ടുകള് ഉപയോഗിക്കുന്നവര് വായിക്കുന്നതു് 'enre' എന്നുമാണു്.
ശരിക്കും ആരാണു് ന്റ എങ്ങനെ എഴുതണം എന്നു തീരുമാനിക്കേണ്ടതു്? ക +് + ക = ക്ക എന്നാണെന്നു ആരെങ്കിലും പ്രത്യേകിച്ചു തീരുമാനിച്ചതാണോ? അതുപോലെ തന്നെയാണെന്നു് തോന്നുന്നു ന്റയുടെ കാര്യവും. ഈ ലേഖനത്തിന്റെ ആദ്യഭാഗത്തു സൂചിപ്പിച്ച കേരള പാണിനീയത്തിലെ ഩ, ഺ എന്നീ അക്ഷരങ്ങളുടെ കാര്യവും, കൂടാതെ ഹെന്റി എന്നൊക്കെ എഴുതാന് വേണ്ട ചില്ലക്ഷരം+റ യുടെ കാര്യവും ഒക്കെ ചേര്ത്തുവെച്ചാല്, വര്ഷങ്ങള്ക്കു മുന്നേ ഫോണ്ടുകളും ഇന്പുട്ട് മെത്തേഡുകളും തുടങ്ങിവെച്ച കുറേയൊക്കെ ഭാഷായുക്തിക്കനുസരിച്ച ഒരു പിരിച്ചെഴുത്തു് ന്+റ എന്നാണെന്നു വരുന്നു. പക്ഷേ മൈക്രോസോഫ്റ്റ് കാര്ത്തിക, നിര്മല ഫോണ്ടുകള് ഈ വ്യവസ്ഥ പിന്തുടരാത്തതുകൊണ്ടു് ആകെ പ്രശ്നമാവുകയും ചെയ്തു.വിന്ഡോസില് സ്വതേ വരുന്ന ഫോണ്ടുകളായതിനാല് വളരെയധികം ആളുകള് അതുപയോഗിക്കുന്നുമുണ്ടു്.
വാസ്തവത്തില് ഈ പ്രശ്നം മൈക്രോസോഫ്റ്റ് പരിഹരിച്ചാല് എല്ലാ കുഴപ്പവും തീര്ന്നേനെ. മൈക്രോസോഫ്റ്റ് അവരുടെ രീതിയില് പ്രശ്നം പരിഹരിക്കുക തന്നെ ചെയ്തു. അവരുടെ രീതി ബഗ്ഗുകള്ക്കു പകരം സ്റ്റാന്ഡേഡ് തിരുത്തുകയാണു്. യുണിക്കോഡ് പക്ഷേ, അക്ഷരങ്ങളെയല്ലേ എന്കോഡ് ചെയ്യുന്നതു്, കൂട്ടക്ഷരങ്ങളെ എന്കോഡ് ചെയ്യാറില്ലല്ലോ എന്ന ചോദ്യം ന്യായമാണു്. ന്റയുടെ ചിത്രീകരണത്തെപ്പറ്റി യുണിക്കോഡ് സ്റ്റാന്ഡേഡിന്റെ മലയാളത്തിന്റെ അദ്ധ്യായത്തില് വിശദീകരികുന്നതിനിടയില് ആണു് ന്റ എങ്ങനെ വേണമെന്നു പരാമര്ശിക്കുന്നതു്.
അതുപ്രകാരം ന്റ എന്നെഴുതേണ്ടതു് ന്+റ
അല്ല, ന്+റ
യും അല്ല. ന്+്+ റ
എന്നാണു്. ചില്ലക്ഷരത്തിനു മലയാളത്തിലാരും ചന്ദ്രക്കല ഇടാറില്ല എന്നോര്ക്കണം. വ്യഞ്ജനങ്ങളുടെ സ്വരം ചേരാത്തരൂപം സൂചിപ്പിക്കാനാണു് ചില്ലുകള് ഉള്ളത്. ചില്ലില്ലാത്ത വ്യഞ്ജനങ്ങള് അതു് ചന്ദ്രക്കലയിട്ടും എഴുതും, ന്, പ് എന്നൊക്കെ.
'ന്റ'യുടെ യുക്തി വിവരിക്കാൻ എനിക്ക് സാധിക്കുമെന്നു തോന്നുന്നില്ല. എന്നാലും നടന്നതെന്തെന്നു പറയാം. ന്റ എന്നതു നിജപ്പെടുത്തണം (പറ്റുമെങ്കിൽ < na, virama, rra > എന്നതിലേയ്ക്ക്) എന്ന പ്രപ്പോസലുമായാണ് ഞാൻ utc-യെ സമീപിച്ചത്. എന്നാൽ ആ സീക്വൻസ് 'ന്റ'യ്ക്ക് വേണ്ടി മൈക്രോസോഫ്റ്റ് ഉപയോഗിച്ചിരുന്നതുകൊണ്ട് അവർക്കതു സ്വീകാര്യമായില്ല. zwj ഇല്ലാത്ത ഏതെങ്കിലും സീക്വൻസ് ആണ് വേണ്ടിയിരുന്നത്. ഒരു റെൻഡറിംഗ് പോയിന്റ് ഓഫ് വ്യൂവിൽ 'ന്റ' എന്നതിനെ ചില്ലിന്റെ ഒരു conjunct ആയി കാണാവുന്നതുകൊണ്ട്, അടുത്ത ബെസ്റ്റ് ഓപ്ഷനായി അത് സ്വീകരിക്കപ്പെട്ടു. 'റ' എന്നതിന്റെ സബ്സ്ക്രിപ്റ്റ് <virama, rra> എന്നാണല്ലോ ഉണ്ടാക്കുക.- സിബു സി.ജെ - സെപ്റ്റംബര് 2009 - എസ്.എം.സി മെയിലിങ്ങ് ലിസ്റ്റ്
അങ്ങനെ രണ്ടുതരം ന്റ എഴുത്തു് പരിഹരിക്കാന് അതു് മൂന്നില്പരമാക്കി യുണിക്കോഡ് സ്റ്റാന്ഡേഡ് മാതൃകയായി. അതോടൊപ്പം ചില്ലക്ഷരം ന്, അറ്റോമിക് ആയും അല്ലാതെയും എഴുതാമെന്നും അതേ സ്റ്റാന്ഡേഡില് പറയുന്നുണ്ടു്. മൊത്തം എത്ര രീതിയില് ന്റ എഴുതാമെന്നുള്ള ചോദ്യം വായനക്കാര്ക്കു വിട്ടുതരുന്നു.
തീര്ച്ചയായും ഇതു് ഫോണ്ടിലെ ന്റ-യ്ക്ക് വേണ്ട നിയമങ്ങളെ സങ്കീര്ണ്ണമാക്കും. സ്വതന്ത്ര ഫോണ്ടുകളില് എങ്ങനെ ന്റ എന്ന അക്ഷരം എങ്ങനെ ചിത്രീകരിയ്ക്കുന്നു എന്നു നമുക്ക് ഓരോന്നായി പരിശോധിക്കാം.
മീര, രചന തുടങ്ങി സ്വതന്ത മലയാളം കമ്പ്യൂട്ടിങ്ങ് മെയിന്റെയിന് ചെയ്യുന്ന എല്ലാ ഫോണ്ടുകളിലും ന്റയെ സംബന്ധിച്ച് ന്+റ എന്ന ഒരു രീതി മാത്രമേ പിന്തുണയ്ക്കുന്നുള്ളൂ. വ്യവസ്ഥയില്ലാത്ത എഴുത്തു് ഒട്ടും പ്രോത്സാഹിപ്പിക്കപ്പെടേണ്ട പ്രവണതയല്ല എന്ന ചിന്തയാണു് ഇതിനു പിറകില്. കൂടാതെ ഹെന്റി എന്നു ചില്ലക്ഷരമൊക്കെ ഇട്ടെഴുതിയ വാക്ക് ഹെന്റി എന്നു ചിത്രീകരിക്കുന്നതു് ശരിയല്ലല്ലോ. ചില്ലിനു ചന്ദ്രക്കലയിടുന്ന രീതിയും പിന്തുണയ്ക്കുന്നില്ല.
akhnd ഫീച്ചര് ഉപയോഗിച്ചുള്ള ന + ് + റ എന്ന ലുക്കപ്പ് മലയാളത്തിന്റെ രണ്ടു് സ്ക്രിപ്റ്റ് ടാഗിനും കൊടുത്തിരിക്കുന്നു.
ഇനി,ഗൂഗിളിന്റെ നോട്ടോ സാന്സ് മലയാളം ഫോണ്ടിലെ റെന്ഡറിങ്ങ് നിയമങ്ങള് നോക്കൂ.
യുണിക്കോഡ് സ്റ്റാന്ഡേഡും കാര്ത്തിക/നിര്മല ഫോണ്ടുകളിലെ ബഗ്ഗും, ന്+റ എന്ന രീതിയും എല്ലാം കൂടി പിന്തുണയ്ക്കുന്ന ഈ ഫോണ്ടില് മുകളില് കാണിച്ചപോലെ 5 തരത്തില് ന്റ ഉണ്ടാക്കാനുള്ള നിയമങ്ങളാണുള്ളത് (ഒന്നു ഡൂപ്ലിക്കേറ്റ് ആണ്). യുണിക്കോഡ് എന്ന സ്റ്റാന്ഡേഡിന്റെ ഉദ്ദേശത്തെ തന്നെ ചോദ്യം ചെയ്യുന്നതാണു്. യുണിക്കോഡ് മാനകവും ഭാഷാനിയമങ്ങളും രണ്ടുവഴിക്കു പിരിയുന്ന ചുരുക്കം ചില സന്ദര്ഭങ്ങളിലൊന്നാണിതു്.
2008 ല് പുറത്തിറങ്ങിയ യുണിക്കോഡ് 5.1 പതിപ്പിലാണു് ന്റയെ സംബന്ധിച്ച കാര്യങ്ങള് യൂണിക്കോഡ് പറയുന്നതു്.
ഇതനുസരിച്ചു്, നിരത്തിയെഴുതിയ ന്റ, 'nta' എന്നോ 'nra' എന്നോ വായിക്കാമെന്നു പറയുന്നു. അതു് ശരിയാണു്. വായനയില് ഇതു് ആശയക്കുഴപ്പമുണ്ടാക്കുന്നതാണു്.ചില്ലക്ഷരവും റയുടെ ചേര്ത്തെഴുതിയാല് അതു് നിരത്തിത്തന്നെ കാണിക്കണമെന്നും, എങ്ങനെ വേണമെങ്കിലും വായിക്കാമെന്നും പറയുന്നു. ഇനി ന് -ന്റെ താഴെ റ അടുക്കി എഴുതുന്ന ന്റ വേണമെങ്കില് ൻ + ് + റ
എന്നുപയോഗിക്കണം. അതുപ്രകാരം 'ആന്റോ' എന്നു നിരത്തിയ ന്റ വെച്ച് എഴുതുന്നത് :
ആ + ൻ + േ + റ + ാ
എന്നാണു്. എന്നിട്ടതു് 'anto' എന്നു വായിക്കാം!
ഇനി ആന്റോ എന്നു ന്റ അടുക്കിയ രീതിയിലാണെങ്കിലോ,
ആ + ൻ + ് + റ + േ + ാ
എന്നാണു്. എന്നിട്ടതും 'anto' എന്നു വായിക്കാം.
Enroll എന്നു മലയാളത്തിലെഴുതാന്
എ + ൻ + റ + േ + ാ + ൾ
ഇതില് ആദ്യം പറഞ്ഞ ആ + ൻ + േ + റ + ാ
ശ്രേണിയില് േ
ചിഹ്നം ഇടുന്നതു് ൻ
ചില്ലക്ഷരത്തിനാണു്. ചില്ലക്ഷരത്തിനു സ്വരചിഹ്നം ഇടുന്ന മലയാളം നമുക്ക് അപരിചിതമാണു്. ചില്ലിന്റെ നിര്വചനം തന്നെ സ്വരം ചേരാത്ത വ്യഞ്ജനം എന്നാണല്ലോ.
യുണിക്കോഡിന്റെ ഈ പരാമര്ശം 2008 ല് വരുന്നതിനു മുമ്പും അതിനു ശേഷവും എല്ലാവരും എഴുതിയിരുന്ന ന്+റ
എന്ന ന്റയെക്കുറിച്ചിതില് ഒന്നും പറയുന്നില്ല.
"The sequence <0D7B, 0D31> is rendered as ൻറ regardless of the reading of that text." എന്നു പറഞ്ഞിരിക്കുന്നതുകൊണ്ട് എ + ൻ + റ + േ + ാ + ൾ
എന്നതിന്റെ പട്ടികയില് കാണിച്ചിരിക്കുന്ന Enroll എന്ന രീതിയിലല്ലാതെ 'Entoll' എന്നു വായിച്ചാലും തെറ്റുപറയാന് പറ്റില്ല.
പോരാതെ, ആ + ൻ + േ + റ + ാ
എന്ന ശ്രേണിയില് വേറൊരു ഭാഷാ പ്രശ്നം കൂടിയുണ്ടു്. 'anto' എന്ന ഉച്ചാരണത്തില് 2 ഘടകങ്ങള് ഉണ്ടു് - ആ, ന്റോ . സില്ലബിള്സ് എന്നും പറയാം. മലയാളത്തിലെ സില്ലബിള് തനിയെ നില്ക്കുന്ന അക്ഷരങ്ങള്, സ്വരചിഹ്നങ്ങളോടുകൂടിയ അക്ഷരങ്ങള്, ചന്ദ്രക്കലയിട്ടു ഘടിപ്പിച്ചു കൂട്ടക്ഷരങ്ങള്, സ്വരചിഹ്നങ്ങളോടു കൂടിയ കൂട്ടക്ഷരങ്ങള് എന്നിവയാണു്. ഇതിലെ ൻ + േ + റ + ാ
ഈ വകുപ്പിലൊന്നും വരില്ല. ചിത്രീകരണത്തിനപ്പുറത്തു് ഭാഷ പ്രൊസസ്സ് ചെയ്യേണ്ട അവസ്ഥയില് ഇതെല്ലാം സങ്കീര്ണ്ണമാക്കുകയാണു്. എന്തിന്? എന്തുപ്രശ്നമാണു് യുണിക്കോഡ് പരിഹരിക്കാന് ശ്രമിച്ചതു് എന്ന ചോദ്യങ്ങളെല്ലാം ബാക്കി നില്ക്കുന്നു.
Anto എന്നു് പേരുള്ള ഒരാള്ക്കു് തന്റെ പേരു് മലയാളത്തിലെഴുതണമെന്നു തോന്നിയാല് കുടുങ്ങിയതു തന്നെ. താഴെപ്പറയുന്നതില് ഏതാണു് അദ്ദേഹത്തിനു ടൈപ്പു ചെയ്യേണ്ടിവരിക?
പേരുകളൊക്കെ സെര്ച്ച്, സോര്ട്ട് ചെയ്യേണ്ടിവരുന്ന സോഫ്റ്റ്വെയറുകള് ഇവയെല്ലാം നമ്മുടെ ആന്റോ ആണെന്നു മനസ്സിലാക്കുമോ? മനസ്സിലാക്കിയില്ലെങ്കില് ആന്റോയ്ക്ക് സോഫ്റ്റ്വെയറുള് പണി കൊടുത്തുകൊണ്ടേ ഇരിക്കുമോ? മലയാളികള് മക്കള്ക്കു പേരിടുന്നതിനുമുമ്പേ ഇതൊക്കെ ആലോചിക്കുന്നതു് നല്ലതായിരിക്കും.
പ്രശ്നം ഇതിലും നില്ക്കില്ല . മലയാളത്തില് വളരെ സാധാരണയായി ഉപയോഗിക്കുന്ന വാക്കാണ് "എന്റെ". എന്നതും അതിന്റെ രൂപങ്ങളും. മലയാളത്തിന്റെ കമ്പ്യൂട്ടേഷണല് ലിംഗ്വിസ്റ്റിക്സിലേയ്ക്കും നാച്വറല് ലാംഗേജ് പ്രൊസസിങ്ങിലേയ്ക്കും നോക്കുകയായാലും ന്റ
എന്ന അക്ഷരം സെന്റിമെന്റ്സ് അനലൈസിങ്ങില് സുപ്രധാന സ്ഥാനമുള്ളതാണു്.
ഈ വക പ്രശ്നങ്ങള്ക്കു തലവെച്ചുകൊടുക്കാതിരിക്കാനും ഡേറ്റയില് പലവിധമായതിനെ കാഴ്ചയില് ഒന്നായിക്കാണിച്ചു പറ്റിക്കാതിരിക്കാനും ആണു് സ്വതന്ത്രമലയാളം കമ്പ്യൂട്ടിങ്ങിന്റെ ഫോണ്ടുകളില് ന്റ എഴുതാനായി ഒരേ ഒരു നിയമം ഉള്ളതു്. അത് ഭാഷയെ പിന്പറ്റുന്നതാണു താനും.
ന്റ യുടെ ചിത്രീകരണം വിവിധ ഫോണ്ടുകളിലെങ്ങനെയെന്നും യുണിക്കോഡില് പുതിയ സീക്വന്സ് എങ്ങനെ വന്നു എന്നും വിശദമാക്കുന്ന റിപ്പോര്ട്ട് : http://thottingal.in/documents/Malayalam-NTA.pdf
ന്റ യെപ്പോലെത്തന്നെ കുഴപ്പക്കാരനാണു് റ്റ-യും. അതിനെപ്പറ്റി വേറൊരു ലേഖനത്തില് എഴുതാം.