A detailed note by Santhosh Thottingal.Named Entity Recognition, a task of identifying and classifying real world objects such as persons, places, organizations from a given text is a well known NLP problem.
On this Opendata day, we are starting a project to build a free licensed corpus of Malayalam content to facilitate various needs of Malayalam computing related research. The corpus, available at https://gitlab.
ഗായത്രി അക്ഷരരൂപത്തിന്റെ രൂപകല്പനയെപ്പറ്റി ബിനോയ് ഡൊമിനിക് എഴുതുന്നു. അദ്ദേഹത്തിന്റെ വെ
മലയാളത്തിനായി പുതിയൊരു യുണിക്കോഡ് ഫോണ്ട് കൂടി സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങ് സമ്മാനിയ്ക്കുന്നു.
ലിനക്സിലെ സ്വനലേഖ എന്ന ടൈപ്പിങ്ങ് ടൂൾ ഇനി വിൻഡോസിലും മാക്കിലും ലഭ്യമാകും. ലിപ്യന്തരണം(Transliteration)
A detailed note by Santhosh Thottingal. My first attempt to develop a spellchecker for Malayalam was in 2007. I was using hunspell and a word list based approach. It was not successful because