August 31, 2015

ന്റ - ഭാഷ, യുണിക്കോഡ്, ചിത്രീകരണം

ന്റ - ഭാഷ, യുണിക്കോഡ്,  ചിത്രീകരണം

മലയാളം ഫോണ്ടുകളും ചിത്രീകരണവും - ലേഖന പരമ്പരയിലെ പുതിയ ലേഖനം

സന്തോഷ് തോട്ടിങ്ങല്‍

മലയാളത്തിലെ ന്റ എന്ന കൂട്ടക്ഷരത്തിന്റെ ചിത്രീകരണത്തെപ്പറ്റിയാണു് ഈ ലേഖനത്തില്‍ വിശദീകരിയ്ക്കുന്നതു്. ഫോണ്ടുകളില്‍ 'ന്റ' എന്ന കൂട്ടക്ഷരം എങ്ങനെ ചിത്രീകരിച്ചിരിയ്ക്കുന്നുവെന്നു പറയുന്നതിനുമുമ്പ് ന്റ എന്ന കൂട്ടക്ഷരത്തിന്റെ സവിശേഷതകള്‍ അല്പം മനസ്സിലാക്കേണ്ടതുണ്ടു്.

ഖരം - അതിഖരം - മൃദു - ഘോഷം - അനുനാസികം എന്ന ക്രമത്തിലാണല്ലോ, മലയാളം അക്ഷരമാലയിൽ ഓരോ വർഗ്ഗത്തിലും പെടുന്ന വ്യഞ്ജനാക്ഷരങ്ങൾ അടുക്കിയിരിക്കുന്നതു്. കവര്‍ഗ്ഗത്തിനു ക, ഖ, ഗ, ഘ, ങ എന്നിങ്ങനെ. ഇവയിലെ അനുനാസികവും ഖരവും ചേര്‍ന്നുണ്ടാക്കുന്ന കൂട്ടക്ഷരങ്ങളെ ഒന്നു ശ്രദ്ധിച്ചു നോക്കൂ:

  • ങ + ക = ങ്ക (കൊങ്ക, മങ്ക, അങ്കം, പങ്കം, തങ്കം)
  • ഞ + ച = ഞ്ച (കൊഞ്ചു്, കൊഞ്ചൽ, അഞ്ചു്, അഞ്ചൽ, തഞ്ചം)
  • ണ + ട = ണ്ട (മണ്ട, ചെണ്ട, തണ്ടു്, ചെണ്ടു്, മുണ്ടു്)
  • ന + ത = ന്ത (കൊന്ത, തന്ത, മൊന്ത, മോന്ത, സ്വന്തം)
  • മ + പ = മ്പ (അമ്പു്, തുമ്പു്, ചെമ്പു്, കമ്പു്, മുമ്പു്)

ഈ അഞ്ചുതരം ഖരാക്ഷരങ്ങള്‍ കൂടാതെ വർഗ്ഗത്തിനും വർഗ്ഗത്തിനും ഇടയിലായി മലയാളത്തിൽ ഒരു ta-വർഗ്ഗം ഉണ്ടായിരുന്നു. അതിന്റെ അനുനാസികമാണു്, നനയുക എന്ന വാക്കിലെ രണ്ടാമത്തെ നയുടെ ഉച്ചാരണമായി വരുന്ന ലിപിരൂപമില്ലാത്ത സ്വനിമയെന്നും ഒരു വാദമുണ്ടു്. അറ്റം, കുറ്റം, മുറ്റം, പറ്റം എന്നൊക്കെയുള്ള വാക്കുകളിലെ റ്റയുടെ അർദ്ധരൂപമാണു്, ta. ഗണിതഭാഷയിൽ റ്റ/2 എന്നു വേണമെങ്കില്‍ പറയാം.

കേരളപാണിനീയത്തിൽ റ്റ/2 എന്ന അക്ഷരത്തെ കുറിക്കാൻ എന്ന അക്ഷരചിത്രമാണു് ഉപയോഗിക്കുന്നതു്. naകാരത്തിനു് എന്ന അക്ഷരരൂപവും ഉപയോഗിക്കുന്നു. ഈ അക്ഷരങ്ങള്‍ പ്രത്യേകം യുണിക്കോഡില്‍ എന്‍കോഡ് ചെയ്യപ്പെട്ടിട്ടുണ്ടെങ്കിലും വ്യാകരണചര്‍ച്ചകള്‍ക്കല്ലാതെ ഇന്നു നമ്മള്‍ ഉപയോഗിക്കാറില്ല.

Keralapanineeyam page 31 - പീഠിക അദ്ധ്യായം

അങ്ങനെ ഒരു വര്‍ഗ്ഗം ഉണ്ടായിരുന്നെങ്കില്‍ മേല്‍പ്പറഞ്ഞപോലെ അനുനാസികവും ഖരവും ചേര്‍ന്നു് ഒരു കൂട്ടക്ഷരം ഉണ്ടായിരിക്കണമല്ലോ. ഩ + ഺ = ഩ്ഺ എന്ന കൂട്ടക്ഷരം. പക്ഷേ ഈ അക്ഷരങ്ങള്‍ പ്രചാരത്തില്ലെങ്കിലും ഈ കൂട്ടക്ഷരത്തിന്റെ ഉച്ചാരണമായ ന്റ നമ്മള്‍ ധാരാളമായി ഉപയോഗിക്കുന്നുണ്ടു്. ഺ = റ്റ യുടെ പാതി എന്ന യുക്തിയില്‍ യും, എന്ന ഉച്ചാരണത്തിനു പകരം യും ഉപയോഗിച്ചാല്‍ ന+്+ റ എന്നാവും ന്റയുടെ പിരിച്ചെഴുത്തു്. ആ വിധമാണു് ഇന്‍സ്ക്രിപ്റ്റ് അടക്കമുള്ള മിക്ക മലയാളം ഇന്‍പുട്ട് മെത്തേഡുകളിലും ഫോണ്ടുകളിലും ന്റ എഴുതിക്കൊണ്ടിരുന്നതു്

ന്റ = ന + ് + റ

കാഴ്ച മാത്രം ശരിയാവേണ്ട അച്ചടിയില്‍(വിവരസംസ്കരണം അച്ചടിയിലില്ല, കമ്പ്യൂട്ടറിലേ ഉള്ളൂ), ന്‍റ എന്നു നിരത്തി എഴുതുന്ന ശൈലി വ്യാപകമായിരുന്നു. ന്റെ എന്നെഴുതേണ്ടിവരുമ്പോള്‍ ന്‍െറ എന്നും എഴുതുമായിരുന്നു. ചിഹ്നം ന്‍റ യുടെ ഇടതുവശത്താണെന്നു ശ്രദ്ധിക്കുക. ന്റൊ നിരത്തിയെഴുതുന്ന ശൈലിയില്‍ ന്‍െറാ എന്നും ആവും.

പക്ഷേ ഇങ്ങനെ നിരത്തിയുള്ള ന്‍റ ആശയക്കുഴപ്പമുണ്ടാക്കും. ഉദാഹരണത്തിനു് ഹെന്‍റി എന്നെഴുതിയാല്‍ വായിക്കേണ്ടതു് ന്റയുടെ ഉച്ചാരണമല്ല, ഇംഗ്ലീഷില്‍ nr എന്നതിനോടടുത്തുവരുന്ന ഒരുച്ചാരമാണതു്. പരിചയമില്ലാത്ത വാക്കുകള്‍ വരുമ്പോള്‍ എങ്ങനെ വായിക്കണമെന്നറിയാതെ കുഴങ്ങും. എന്‍റിക്കലെക്സി എന്ന കപ്പല്‍ വാര്‍ത്തകളില്‍ ഉണ്ടായിരുന്നപ്പോള്‍ ആളുകള്‍ Entica എന്ന രീതിയിലും Enrica എന്ന രീതിയിലും അതു വായിച്ചിരുന്നു.

മാതൃഭൂമി പത്രമൊക്കെ നിരത്തിയുള്ള എഴുത്താണു് ന്റയ്ക്ക് ഉപയോഗിക്കുന്നതു്. അതു് ആശയക്കുഴപ്പമുണ്ടാക്കിക്കൊണ്ടിരിക്കുകയും ചെയ്യുന്നു. പക്ഷേ ന്‍ മുകളിലും റ താഴെയുമായി എഴുതുന്ന യുണികോഡ് ഫോണ്ടുകളേ ഞാന്‍ കണ്ടിട്ടുള്ളൂ. അവ ആശയക്കുഴപ്പമില്ലാത്ത രീതിയില്‍ 'nta' എന്ന ഉച്ചാരണത്തിനു ന്റ എന്നും nra എന്ന ഉച്ചാരണത്തിനു ന്‍റ എന്നു ഉപയോഗിച്ചുവരുന്നു. ഈയൊരു വ്യവസ്ഥ എല്ലാ ഫോണ്ടുകളും പിന്തുടരുന്നതു് വളരെ നല്ല കാര്യമാണു്.

കാര്‍ത്തികയുടെ ന്റ

കാഴ്ചയിലെ വ്യവസ്ഥ പക്ഷേ ഫോണ്ടുകളുടെ ഉള്ളിലില്ല എന്നതാണു് സങ്കടം. മൈക്രോസോഫ്റ്റിന്റെ ഫോണ്ടുകളില്‍(കാര്‍ത്തിക, നിര്‍മല), ന്റ എന്ന അടുക്കിയ രീതി ന്‍+റ എന്ന കൂട്ടത്തിനാണു് കൊടുത്തിരിക്കുന്നതു്. ബാക്കി എല്ലാ ഫോണ്ടുകളിലും(മീര, രചന, അഞ്ജലി, രഘുമലയാളം...) അതു് ന്റ = ന് + റ ആവുമ്പോള്‍ മൈക്രോസോഫ്റ്റ് ഫോണ്ടുകളില്‍ അതു് ന് റ എന്നേ ചിത്രീകരിക്കൂ.

വിന്‍ഡോസ് 7 ലെ കാര്‍ത്തിക ഫോണ്ടിന്റെ ചിത്രീകരണം

വിന്‍ഡോസ് 7 ലെ മീര ഫോണ്ടിന്റെ ചിത്രീകരണം

അതുകൊണ്ടുതന്നെ മീര, രചന തുടങ്ങിയ ഫോണ്ടുകളില്‍ വൃത്തിയായി കണ്ടിരുന്ന ന്റ, മൈക്രോസോഫ്റ്റ് ഫോണ്ടുകള്‍ ഉപയോഗിച്ചുകാണുമ്പോള്‍ തെറ്റായി കാണും. ഇനി മൈക്രോസോഫ്റ്റ് ഫോണ്ടുകള്‍ ഉപയോഗിച്ചു ശരിയായി കാണാന്‍ വേണ്ടി എന്റെ എന്നതിനെ എന്‍റെ എന്നെഴുതുന്ന വിന്‍ഡോസ് ഉപയോക്താക്കളുണ്ടു്. അവരെഴുതിയതു് മറ്റു ഫോണ്ടുകള്‍ ഉപയോഗിക്കുന്നവര്‍ വായിക്കുന്നതു് 'enre' എന്നുമാണു്.

![ICU ഫേസ്‌ബുക്ക് പേജില്‍ വന്ന പോസ്റ്റിന്റെ ഭാഗം. ന്റ തെറ്റായി മൈക്രോസോഫ്റ്റ് കാര്‍ത്തിക ഫോണ്ട് കാണിക്കുന്നതു് ശ്രദ്ധിക്കുക](/content/images/2015/08/snapshot2.png)

ശരിക്കും ആരാണു് ന്റ എങ്ങനെ എഴുതണം എന്നു തീരുമാനിക്കേണ്ടതു്? ക +് + ക = ക്ക എന്നാണെന്നു ആരെങ്കിലും പ്രത്യേകിച്ചു തീരുമാനിച്ചതാണോ? അതുപോലെ തന്നെയാണെന്നു് തോന്നുന്നു ന്റയുടെ കാര്യവും. ഈ ലേഖനത്തിന്റെ ആദ്യഭാഗത്തു സൂചിപ്പിച്ച കേരള പാണിനീയത്തിലെ ഩ, ഺ എന്നീ അക്ഷരങ്ങളുടെ കാര്യവും, കൂടാതെ ഹെന്‍റി എന്നൊക്കെ എഴുതാന്‍ വേണ്ട ചില്ലക്ഷരം+റ യുടെ കാര്യവും ഒക്കെ ചേര്‍ത്തുവെച്ചാല്‍, വര്‍ഷങ്ങള്‍ക്കു മുന്നേ ഫോണ്ടുകളും ഇന്‍പുട്ട് മെത്തേഡുകളും തുടങ്ങിവെച്ച കുറേയൊക്കെ ഭാഷായുക്തിക്കനുസരിച്ച ഒരു പിരിച്ചെഴുത്തു് ന്+റ എന്നാണെന്നു വരുന്നു. പക്ഷേ മൈക്രോസോഫ്റ്റ് കാര്‍ത്തിക, നിര്‍മല ഫോണ്ടുകള്‍ ഈ വ്യവസ്ഥ പിന്തുടരാത്തതുകൊണ്ടു് ആകെ പ്രശ്നമാവുകയും ചെയ്തു.വിന്‍ഡോസില്‍ സ്വതേ വരുന്ന ഫോണ്ടുകളായതിനാല്‍ വളരെയധികം ആളുകള്‍ അതുപയോഗിക്കുന്നുമുണ്ടു്.

വാസ്തവത്തില്‍ ഈ പ്രശ്നം മൈക്രോസോഫ്റ്റ് പരിഹരിച്ചാല്‍ എല്ലാ കുഴപ്പവും തീര്‍ന്നേനെ. മൈക്രോസോഫ്റ്റ് അവരുടെ രീതിയില്‍ പ്രശ്നം പരിഹരിക്കുക തന്നെ ചെയ്തു. അവരുടെ രീതി ബഗ്ഗുകള്‍ക്കു പകരം സ്റ്റാന്‍ഡേഡ് തിരുത്തുകയാണു്. യുണിക്കോഡ് പക്ഷേ, അക്ഷരങ്ങളെയല്ലേ എന്‍കോഡ് ചെയ്യുന്നതു്, കൂട്ടക്ഷരങ്ങളെ എന്‍കോഡ് ചെയ്യാറില്ലല്ലോ എന്ന ചോദ്യം ന്യായമാണു്. ന്റയുടെ ചിത്രീകരണത്തെപ്പറ്റി യുണിക്കോഡ് സ്റ്റാന്‍ഡേഡിന്റെ മലയാളത്തിന്റെ അദ്ധ്യായത്തില്‍ വിശദീകരികുന്നതിനിടയില്‍ ആണു് ന്റ എങ്ങനെ വേണമെന്നു പരാമര്‍ശിക്കുന്നതു്.

അതുപ്രകാരം ന്റ എന്നെഴുതേണ്ടതു് ന്+റ അല്ല, ന്‍+റ യും അല്ല. ന്‍+്+ റ എന്നാണു്. ചില്ലക്ഷരത്തിനു മലയാളത്തിലാരും ചന്ദ്രക്കല ഇടാറില്ല എന്നോര്‍ക്കണം. വ്യഞ്ജനങ്ങളുടെ സ്വരം ചേരാത്തരൂപം സൂചിപ്പിക്കാനാണു് ചില്ലുകള്‍ ഉള്ളത്. ചില്ലില്ലാത്ത വ്യഞ്ജനങ്ങള്‍ അതു് ചന്ദ്രക്കലയിട്ടും എഴുതും, ന്‍, പ് എന്നൊക്കെ.

'ന്റ'യുടെ യുക്തി വിവരിക്കാൻ എനിക്ക് സാധിക്കുമെന്നു തോന്നുന്നില്ല. എന്നാലും നടന്നതെന്തെന്നു പറയാം. ന്റ എന്നതു നിജപ്പെടുത്തണം (പറ്റുമെങ്കിൽ < na, virama, rra > എന്നതിലേയ്ക്ക്) എന്ന പ്രപ്പോസലുമായാണ്‌ ഞാൻ utc-യെ സമീപിച്ചത്. എന്നാൽ ആ സീക്വൻസ് 'ന്‌റ'യ്ക്ക് വേണ്ടി മൈക്രോസോഫ്റ്റ് ഉപയോഗിച്ചിരുന്നതുകൊണ്ട്‌ അവർക്കതു സ്വീകാര്യമായില്ല. zwj ഇല്ലാത്ത ഏതെങ്കിലും സീക്വൻസ് ആണ്‌ വേണ്ടിയിരുന്നത്. ഒരു റെൻഡറിംഗ് പോയിന്റ് ഓഫ് വ്യൂവിൽ 'ന്റ' എന്നതിനെ ചില്ലിന്റെ ഒരു conjunct ആയി കാണാവുന്നതുകൊണ്ട്, അടുത്ത ബെസ്റ്റ് ഓപ്ഷനായി അത് സ്വീകരിക്കപ്പെട്ടു. 'റ' എന്നതിന്റെ സബ്സ്ക്രിപ്റ്റ് <virama, rra> എന്നാണല്ലോ ഉണ്ടാക്കുക.- സിബു സി.ജെ - സെപ്റ്റംബര്‍ 2009 - എസ്.എം.സി മെയിലിങ്ങ് ലിസ്റ്റ്

അങ്ങനെ രണ്ടുതരം ന്റ എഴുത്തു് പരിഹരിക്കാന്‍ അതു് മൂന്നില്‍പരമാക്കി യുണിക്കോഡ് സ്റ്റാന്‍ഡേഡ് മാതൃകയായി. അതോടൊപ്പം ചില്ലക്ഷരം ന്‍, അറ്റോമിക് ആയും അല്ലാതെയും എഴുതാമെന്നും അതേ സ്റ്റാന്‍ഡേഡില്‍ പറയുന്നുണ്ടു്. മൊത്തം എത്ര രീതിയില്‍ ന്റ എഴുതാമെന്നുള്ള ചോദ്യം വായനക്കാര്‍ക്കു വിട്ടുതരുന്നു.

തീര്‍ച്ചയായും ഇതു് ഫോണ്ടിലെ ന്റ-യ്ക്ക് വേണ്ട നിയമങ്ങളെ സങ്കീര്‍ണ്ണമാക്കും. സ്വതന്ത്ര ഫോണ്ടുകളില്‍ എങ്ങനെ ന്റ എന്ന അക്ഷരം എങ്ങനെ ചിത്രീകരിയ്ക്കുന്നു എന്നു നമുക്ക് ഓരോന്നായി പരിശോധിക്കാം.

ഫോണ്ടുകളിലെ ന്റ

മീര, രചന തുടങ്ങി സ്വതന്ത മലയാളം കമ്പ്യൂട്ടിങ്ങ് മെയിന്റെയിന്‍ ചെയ്യുന്ന എല്ലാ ഫോണ്ടുകളിലും ന്റയെ സംബന്ധിച്ച് ന്+റ എന്ന ഒരു രീതി മാത്രമേ പിന്തുണയ്ക്കുന്നുള്ളൂ. വ്യവസ്ഥയില്ലാത്ത എഴുത്തു് ഒട്ടും പ്രോത്സാഹിപ്പിക്കപ്പെടേണ്ട പ്രവണതയല്ല എന്ന ചിന്തയാണു് ഇതിനു പിറകില്‍. കൂടാതെ ഹെന്‍റി എന്നു ചില്ലക്ഷരമൊക്കെ ഇട്ടെഴുതിയ വാക്ക് ഹെന്റി എന്നു ചിത്രീകരിക്കുന്നതു് ശരിയല്ലല്ലോ. ചില്ലിനു ചന്ദ്രക്കലയിടുന്ന രീതിയും പിന്തുണയ്ക്കുന്നില്ല.

akhnd ഫീച്ചര്‍ ഉപയോഗിച്ചുള്ള ന + ് + റ എന്ന ലുക്കപ്പ് മലയാളത്തിന്റെ രണ്ടു് സ്ക്രിപ്റ്റ് ടാഗിനും കൊടുത്തിരിക്കുന്നു.

മീര ഫോണ്ടിലെ ന്റയുടെ ചിത്രീകരണ നിയമം

ഇനി,ഗൂഗിളിന്റെ നോട്ടോ സാന്‍സ് മലയാളം ഫോണ്ടിലെ റെന്‍ഡറിങ്ങ് നിയമങ്ങള്‍ നോക്കൂ.

നോട്ടോ സാന്‍സ് മലയാളം ഫോണ്ടിലെ ന്റയുടെ ചിത്രീകരണ നിയമങ്ങള്‍

യുണിക്കോഡ് സ്റ്റാന്‍ഡേഡും കാര്‍ത്തിക/നിര്‍മല ഫോണ്ടുകളിലെ ബഗ്ഗും, ന്+റ എന്ന രീതിയും എല്ലാം കൂടി പിന്തുണയ്ക്കുന്ന ഈ ഫോണ്ടില്‍ മുകളില്‍ കാണിച്ചപോലെ 5 തരത്തില്‍ ന്റ ഉണ്ടാക്കാനുള്ള നിയമങ്ങളാണുള്ളത് (ഒന്നു ഡൂപ്ലിക്കേറ്റ് ആണ്). യുണിക്കോഡ് എന്ന സ്റ്റാന്‍ഡേഡിന്റെ ഉദ്ദേശത്തെ തന്നെ ചോദ്യം ചെയ്യുന്നതാണു്. യുണിക്കോഡ് മാനകവും ഭാഷാനിയമങ്ങളും രണ്ടുവഴിക്കു പിരിയുന്ന ചുരുക്കം ചില സന്ദര്‍ഭങ്ങളിലൊന്നാണിതു്.

യുണിക്കോഡിന്റെ ന്റ യും കുഴപ്പങ്ങളും

2008 ല്‍ പുറത്തിറങ്ങിയ യുണിക്കോഡ് 5.1 പതിപ്പിലാണു് ന്റയെ സംബന്ധിച്ച കാര്യങ്ങള്‍ യൂണിക്കോഡ് പറയുന്നതു്.

ഇതനുസരിച്ചു്, നിരത്തിയെഴുതിയ ന്റ, 'nta' എന്നോ 'nra' എന്നോ വായിക്കാമെന്നു പറയുന്നു. അതു് ശരിയാണു്. വായനയില്‍ ഇതു് ആശയക്കുഴപ്പമുണ്ടാക്കുന്നതാണു്.ചില്ലക്ഷരവും റയുടെ ചേര്‍ത്തെഴുതിയാല്‍ അതു് നിരത്തിത്തന്നെ കാണിക്കണമെന്നും, എങ്ങനെ വേണമെങ്കിലും വായിക്കാമെന്നും പറയുന്നു. ഇനി ന്‍ -ന്റെ താഴെ റ അടുക്കി എഴുതുന്ന ന്റ വേണമെങ്കില്‍ ൻ + ് + റ എന്നുപയോഗിക്കണം. അതുപ്രകാരം 'ആന്റോ' എന്നു നിരത്തിയ ന്റ വെച്ച് എഴുതുന്നത് :

ആ + ൻ + േ + റ + ാ

എന്നാണു്. എന്നിട്ടതു് 'anto' എന്നു വായിക്കാം!

ഇനി ആന്റോ എന്നു ന്റ അടുക്കിയ രീതിയിലാണെങ്കിലോ,

ആ + ൻ + ് + റ + േ + ാ

എന്നാണു്. എന്നിട്ടതും 'anto' എന്നു വായിക്കാം.

Enroll എന്നു മലയാളത്തിലെഴുതാന്‍

എ + ൻ + റ + േ + ാ + ൾ

ഇതില്‍ ആദ്യം പറഞ്ഞ ആ + ൻ + േ + റ + ാ ശ്രേണിയില്‍ ചിഹ്നം ഇടുന്നതു് ചില്ലക്ഷരത്തിനാണു്. ചില്ലക്ഷരത്തിനു സ്വരചിഹ്നം ഇടുന്ന മലയാളം നമുക്ക് അപരിചിതമാണു്. ചില്ലിന്റെ നിര്‍വചനം തന്നെ സ്വരം ചേരാത്ത വ്യഞ്ജനം എന്നാണല്ലോ.

യുണിക്കോഡിന്റെ ഈ പരാമര്‍ശം 2008 ല്‍ വരുന്നതിനു മുമ്പും അതിനു ശേഷവും എല്ലാവരും എഴുതിയിരുന്ന ന്+റ എന്ന ന്റയെക്കുറിച്ചിതില്‍ ഒന്നും പറയുന്നില്ല.

"The sequence <0D7B, 0D31> is rendered as ൻറ regardless of the reading of that text." എന്നു പറഞ്ഞിരിക്കുന്നതുകൊണ്ട് എ + ൻ + റ + േ + ാ + ൾ എന്നതിന്റെ പട്ടികയില്‍ കാണിച്ചിരിക്കുന്ന Enroll എന്ന രീതിയിലല്ലാതെ 'Entoll' എന്നു വായിച്ചാലും തെറ്റുപറയാന്‍ പറ്റില്ല.

പോരാതെ, ആ + ൻ + േ + റ + ാ എന്ന ശ്രേണിയില്‍ വേറൊരു ഭാഷാ പ്രശ്നം കൂടിയുണ്ടു്. 'anto' എന്ന ഉച്ചാരണത്തില്‍ 2 ഘടകങ്ങള്‍ ഉണ്ടു് - ആ, ന്റോ . സില്ലബിള്‍സ് എന്നും പറയാം. മലയാളത്തിലെ സില്ലബിള്‍ തനിയെ നില്‍ക്കുന്ന അക്ഷരങ്ങള്‍, സ്വരചിഹ്നങ്ങളോടുകൂടിയ അക്ഷരങ്ങള്‍, ചന്ദ്രക്കലയിട്ടു ഘടിപ്പിച്ചു കൂട്ടക്ഷരങ്ങള്‍, സ്വരചിഹ്നങ്ങളോടു കൂടിയ കൂട്ടക്ഷരങ്ങള്‍ എന്നിവയാണു്. ഇതിലെ ൻ + േ + റ + ാ ഈ വകുപ്പിലൊന്നും വരില്ല. ചിത്രീകരണത്തിനപ്പുറത്തു് ഭാഷ പ്രൊസസ്സ് ചെയ്യേണ്ട അവസ്ഥയില്‍ ഇതെല്ലാം സങ്കീര്‍ണ്ണമാക്കുകയാണു്. എന്തിന്? എന്തുപ്രശ്നമാണു് യുണിക്കോഡ് പരിഹരിക്കാന്‍ ശ്രമിച്ചതു് എന്ന ചോദ്യങ്ങളെല്ലാം ബാക്കി നില്‍ക്കുന്നു.

ആന്റോയുടെ പേരെങ്ങനെ എഴുതും?

Anto എന്നു് പേരുള്ള ഒരാള്‍ക്കു് തന്റെ പേരു് മലയാളത്തിലെഴുതണമെന്നു തോന്നിയാല്‍ കുടുങ്ങിയതു തന്നെ. താഴെപ്പറയുന്നതില്‍ ഏതാണു് അദ്ദേഹത്തിനു ടൈപ്പു ചെയ്യേണ്ടിവരിക?

  1. ആ + ൻ + േ + റ + ാ (നിരത്തിയെഴുതിയ ന്റ, യുണിക്കോഡ് മാനകമനുസരിച്ചു്)
  2. ആ + ൻ + ് + റ + േ + ാ ( അടുക്കിയെഴുതിയ ന്റ കിട്ടാന്‍, യുണിക്കോഡ് മാനകമനുസരിച്ചു്)
  3. ആ + ൻ + റ + േ + ാ (ഇതു് Anro എന്നും Anto എന്നും വായിക്കാമെന്നു യുണിക്കോഡ് പറഞ്ഞു. കാര്‍ത്തിക/നിര്‍മല ഫോണ്ടുകളില്‍ ഇതു് അടുക്കിയെഴുതിയ ന്റ കാണിക്കും. മീര, രചന എന്നിവയില്‍ നിരത്തിയെഴുതിയതും)
  4. ആ + ന + ് + റ + ോ (മീര, രചന, അഞ്ജലി തുടങ്ങിയ ഫോണ്ടുകള്‍ അടുക്കിയെഴുതിയ ന്റ കാണിക്കും. യുണിക്കോഡ് ന്റയെപ്പറ്റി പറയുന്നതിനു മുന്നേ ഇങ്ങനെയാണെഴുതിയിരുന്നതു്. സ്കൂളുകളില്‍ മലയാളം ടൈപ്പിങ്ങില്‍ പഠിപ്പിക്കുന്നതും ഇതാണു്. യുണിക്കോഡ് ഇതിനെപ്പറ്റി ഒന്നും പറയുന്നില്ല)
  5. ആ + ന + ് + ZWJ + റ + േ + ാ (ZWJ ഉപയോഗിച്ചുള്ള ന്‍. കാര്‍ത്തിക/നിര്‍മല ഫോണ്ടുകളില്‍ ഇതു് അടുക്കിയെഴുതിയ ന്റ കാണിക്കും. മീര, രചന എന്നിവയില്‍ നിരത്തിയെഴുതിയതും)

പേരുകളൊക്കെ സെര്‍ച്ച്, സോര്‍ട്ട് ചെയ്യേണ്ടിവരുന്ന സോഫ്റ്റ്‌വെയറുകള്‍ ഇവയെല്ലാം നമ്മുടെ ആന്റോ ആണെന്നു മനസ്സിലാക്കുമോ? മനസ്സിലാക്കിയില്ലെങ്കില്‍ ആന്റോയ്ക്ക് സോഫ്‌റ്റ്‌വെയറുള്‍ പണി കൊടുത്തുകൊണ്ടേ ഇരിക്കുമോ? മലയാളികള്‍ മക്കള്‍ക്കു പേരിടുന്നതിനുമുമ്പേ ഇതൊക്കെ ആലോചിക്കുന്നതു് നല്ലതായിരിക്കും.

പ്രശ്നം ഇതിലും നില്‍ക്കില്ല . മലയാളത്തില്‍ വളരെ സാധാരണയായി ഉപയോഗിക്കുന്ന വാക്കാണ് "എന്റെ". എന്നതും അതിന്റെ രൂപങ്ങളും. മലയാളത്തിന്റെ കമ്പ്യൂട്ടേഷണല്‍ ലിംഗ്വിസ്റ്റിക്സിലേയ്ക്കും നാച്വറല്‍ ലാംഗേജ് പ്രൊസസിങ്ങിലേയ്ക്കും നോക്കുകയായാലും ന്റ എന്ന അക്ഷരം സെന്റിമെന്റ്സ് അനലൈസിങ്ങില്‍ സുപ്രധാന സ്ഥാനമുള്ളതാണു്.

ഈ വക പ്രശ്നങ്ങള്‍ക്കു തലവെച്ചുകൊടുക്കാതിരിക്കാനും ഡേറ്റയില്‍ പലവിധമായതിനെ കാഴ്ചയില്‍ ഒന്നായിക്കാണിച്ചു പറ്റിക്കാതിരിക്കാനും ആണു് സ്വതന്ത്രമലയാളം കമ്പ്യൂട്ടിങ്ങിന്റെ ഫോണ്ടുകളില്‍ ന്റ എഴുതാനായി ഒരേ ഒരു നിയമം ഉള്ളതു്. അത് ഭാഷയെ പിന്‍പറ്റുന്നതാണു താനും.

ന്റ യുടെ ചിത്രീകരണം വിവിധ ഫോണ്ടുകളിലെങ്ങനെയെന്നും യുണിക്കോഡില്‍ പുതിയ സീക്വന്‍സ് എങ്ങനെ വന്നു എന്നും വിശദമാക്കുന്ന റിപ്പോര്‍ട്ട് : http://thottingal.in/documents/Malayalam-NTA.pdf

ന്റ യെപ്പോലെത്തന്നെ കുഴപ്പക്കാരനാണു് റ്റ-യും. അതിനെപ്പറ്റി വേറൊരു ലേഖനത്തില്‍ എഴുതാം.