எண்ணங்களின் குரல்வடிவம்: தமிழ் ஒருங்குறி

ஞாயிறு, பிப்ரவரி 26, 2006

தமிழ் ஒருங்குறி - நியூ

இப்போது பழைய ஒருங்குறி, புதிய ஒருங்குறி என்று ஆங்காங்கே சலசலப்புகள் கேட்டுக் கொண்டிருக்கின்றன. இப்பதிவு தற்போது புழக்கத்திலுள்ள ஒருங்குறி பற்றியும், அதற்கு மாற்றாக முன்வைக்கப்படும் TUNE பற்றியுமான விமர்சனங்களை வைப்பதற்கே. இவ்விஷயத்தைப் பற்றிய சரியான புரிதலைப் பெற இக்கட்டுரை உதவக்கூடும் (நன்றி: டைனோ). மேலும் இராம.கி.யும்(சுட்டி #1, சுட்டி #2) செல்வராஜும் இதனைப் பற்றி சிறப்பாக விளக்கியுள்ளார்கள் (அவசியம் படிக்க வேண்டிய இடுகைகள்). இவையனைத்தையும் உள்வாங்கிக் கொண்ட நிலையில், ஒரு சாமானியனாக என் நிலைப்பாட்டை இங்கு வழங்குகிறேன். (இது பற்றிய எனது முந்தைய பதிவு - பின்னூட்டங்களில் உள்ள தகவல்களுக்காக)

தற்போதைய ஒருங்குறியிலுள்ள முக்கியமான பிழை அதில் உயிர்மெய்யெழுத்துக்கள் உருவாக்கப்படும் விதம்தான். ஒரு பள்ளி மாணவனுக்கும் தெரியும், க = க் + அ, கா = க் + ஆ,........... போன்றப் புணர்ச்சி விதிகளை. ஆனால், ஒருங்குறியை உருவாக்கிய சான்றோர்களோ, இந்த அடிப்படையை கூட மதிக்காமல், க் = க + ஃ, கா = க + ஆ,........... என்ற புது வழியை நமக்கு வழங்கியிருக்கிறார்கள். இதனால், எளிதில் கிடைத்திருக்கக் கூடிய ஒரு பொன்னான வாய்ப்பை நழுவ விட்டிருக்கிறது தமிழ்ச் சமூகம்.

எனக்குத் தெரிந்த வரையில், Tamil is a highly structured language. அதன் உறுதியான வடிவமைப்பினால், அதன் இலக்கண விதிகளைக் கொண்டே அதைக் கணிமைப்படுத்துவது எளிது. மொழியின் அடிப்படைகளைக் கடாசி விட்டு, க + ஆ, க + இ என்றெல்லாம் எழுத்துக்களை உருவாக்கியதால், இன்று நமக்கு எளிதில் கிடைத்திருக்கக் கூடிய ஒரு வசதி - கணிமையாற்றலால் சொற்களைத் தேடிப் பெறும் வசதி, ஒரு கைக்கெட்டாத கனியாகி விட்டது. ஒற்றில் முடியும் பெயர்ச் சொற்கள் - கோயமுத்தூர், சங்கர், ஜெயமோகன்....... போன்றவைகளை ஒரு ஆவணத்திலிருந்து தேடியெடுக்கும் வசதி இதனால் தாரை வார்க்கப் பட்டுவிட்டது. ஏனென்றால், அவை 'கோயமுத்தூரில்' (கோயமுத்தூர + இல்), 'சங்கரின்' (சங்கர + இன்), 'ஜெயமோகனை' (ஜெயமோகன + ஐ), என்றெல்லாம்தான் பெரும்பாலும் அந்த ஆவணத்தில் இடம் பெற்றிருக்கும். அவற்றை தேடிப் பெறுவதற்கு, "ஜெய ஜய சங்கர" என்று் முழங்க வேண்டியதுதான்.

இன்னும் சில சிக்கல்களைப் பற்றிக்் கூறுகிறேன், கேட்டுக்கொள்ளுங்கள். 'திருக்குறள்' அல்லது 'கம்பன்' என்ற சொல்லை எங்கிருந்தாவது select & copy செய்கிறீர்கள். அதைக் கொண்டு போய் paste செய்தால் வருவதென்ன? 'திருக்குறள' அல்லது 'கம்பன'. இன்னொரு சிக்கல், ஒரு சொல்லுக்குப் பிறகு full-stopஓ, commaவோ வைக்க மறந்து விட்டதால், cursorஐ அங்கு நகர்த்திச் சென்று, வேண்டிய நிறுத்தக் குறியீட்டைப் புகுத்துகிறீர்கள். உ-ம், 'நன்றி' என்பதற்குப் பிறகு full-stop வைக்கிறீர்கள். ஆனால், full-stop விழுவதோ, இவ்வாறு ----> 'ற.ி' மற்றொன்று - நேற்று ஒரு நண்பருடன் அரட்டையில், "கிருஷ்ணா கஃபேயில் என்ன சாப்பிட்டே?" என்று கேட்க முயன்ற போது, அது 'கஃபே'யை 'க்பே' என்று மாற்றி டென்ஷனாக்கியது. இது போல் பல சிக்கல்கள் இருக்கின்றன, இப்போதுள்ள ஒருங்குறியில்.

இப்போது TUNE எனப்படும் பயங்கரத்தைப் பற்றிப் பார்ப்போம். 'வெச்சா குடுமி, சிரைச்சா மொட்டை' என்பது போல், தற்போதைய ஒருங்குறியின் உயிர்மெய் புணர்ச்சி விதியில் தவறிருக்கிறது என்பதற்காக, புணர்ச்சி என்பதே இல்லாமல் ஒழித்துக் கட்டி விட்டு், ஒவ்வொரு உயிர்மெய்யெழுத்துக்கும் ஒரு தனி குறியீடு வைக்கப்பட்டிருக்கிறதாம். இவ்வாறு, மொத்தமாக முன்னூத்தி சொச்சம் குறியீடுகள். மொழியின் அடிப்படை என்ன? உயிர்மெய் என்பது ஒரு மெய்யெழுத்தும் ஒரு உயிரெழுத்தும் புணருவதால் ஏற்படும் கூட்டெழுத்து என்பதே. ஆகவே, அதை அப்படியே விட்டு வைப்பதுதான் மொழிக்கு நாம் செலுத்தும்் மரியாதை. உயிர்மெய் என்பது இரு குறியீடுகளைக் கொண்டே குறிக்கப்பட வேண்டும். அதை ஒரு குறியீடாகச் சுருக்குவதால் என்ன பயன்? இந்த ஏற்பாட்டில், 'இவன்' என்ற சொல் 'இவனால்' (இவனா + ல்), 'இவனை' (இவனை), 'இவனோடு' (இவனோ + டு), 'இவனிடம்' (இவனி +டம்) ஆகியவற்றில் இடம்பெறவில்லை என்பது, அடைப்புக் குறிகளுக்குள் கொடுக்கப்பட்ட அவற்றின் TUNE representationஐப் பார்த்தாலே் புரியும். முன்னூற்றுக்கும் மேற்பட்ட எண்களுடைய code set மட்டும் நமக்குக் கிடைத்துவிட்டால், நமது எல்லா பிரச்சனைகளும் தீர்ந்து விடும் என்ற தவறான எண்ணமும் ஆபத்தானது. 50 சொச்சம் குறியீடுகள் இருந்த இடத்தில் 300 சொச்சம் குறியீடுகளை வைத்துக் கணிமை செய்ய வேண்டுமென்றால், அதற்கு செயலியாற்றல் (CPU power), நினைவகத் தேவைகள் ஆகியன பல மடங்கு பெருகும் (இல்லாவிட்டால் கணிமைச் செயல்பாட்டின் வேகம் குறையலாம்). P4 / P5களுக்கு வேண்டுமானால் இது ஒரு பொருட்டாக இல்லாதிருக்கலாம். ஆனால் நாம் கிராமங்களுக்கெல்லாம்் கணினிகளைக் கொண்டு செல்ல வேண்டுமென்றால், lowest common denominatorஐத்தான் நாம் கணக்கில் கொள்ள வேண்டும். (சிம்ப்யூட்டர், கைக்கணினி, செல்பேசி, இதர embedded கணினிகளுக்கான இடைமுகங்கள் etc etc). We need a computing platform that's lean & mean.

எனது பரிந்துரைகள்:

கீழ்க்கண்ட குறியீடுகளே இடம்பெற்றிருக்க வேண்டும்

உயிரெழுத்துக்கள் 'அ' விலிருந்து 'ஔ' வரை (and not 'ஃ' to 'ஔ')
ஆய்த எழுத்து
மெய்யெழுத்துக்கள் 'க்'இலிருந்து 'ன்' வரை (இலக்கண வரிசைப்படி)
கிரந்த எழுத்துக்கள் 'ஸ்'இலிருந்து 'க்ஷ்' வரை, மற்றும் 'ஸ்ரீ'
உயிர்மெய்க் கீற்றுக்கள் (கால், கொக்கி, கொம்பு etc etc)
தமிழ் எண்கள் மற்றும் சிறப்புச் சின்னங்கள்

உயிர்மெய்யெழுத்து = மெய்யெழுத்து + கீற்றெழுத்து என்ற அடிப்படையில் புணர்ச்சிகள் ஏற்பட வேண்டும் (க = க் + அ, கா = க் + ஆ, இத்யாதி, இத்யாதி)
grapheme boundary vs. word boundary வேறுபாட்டை நிரலிகள் அறிந்திருக்க வேண்டும் (if they claim Unicode compliance).
'Select', 'Insert', 'sort', 'letter-spacing' ஆகிய செயல்களைச் செய்யும்போது, நிரலிகள் முழு எழுத்துக் கொத்துக்களையும் (character clusters) எடுத்துக் கொண்டு, அவற்றின் மீதே இச்செயல்களைச் செய்ய வேண்டும்.

மேலே குறிப்பிட்ட 1 & 2 ஆகியவற்றை, தமிழ் ஒருங்குறியைச் சீர்திருத்துவதால் அடையலாம். 3 & 4 ஆகியன, மென்பொருள் நிறுவனங்கள் கவனிக்க வேண்டியவை. குறைந்தப்பட்சம், உலாவிகள், மின்மடல் எழுதிகள், word processors, வலை / அச்சுப் பக்கங்களை வடிவமைக்க உதவும் PageMaker / Acrobat / DreamWeaver / Flash போன்ற மென்பொருட்கள், ஆகியவையாவது 3 & 4ஐக் கட்டாயமாகக் கடைபிடிக்க வேண்டும். Unicode compliant என்ற முத்திரையைப் வழங்குவதற்கான விதிகளைக் கடுமையாக்குவதன் மூலம், ஒருங்குறிக் கூட்டமைப்பே இதனை ஓரளவுக்கு உறுதி செய்யலாமென்பது எனது தாழ்மையான கருத்து. இவ்வமைப்பிலுள்ள தமிழ் அங்கத்தினர்கள் கொஞ்சம் அழுத்தம் கொடுத்தால், இத்திசையை நோக்கிய நகர்வுகள் நிகழலாம்.(இதைப் படிக்க நேரும் அத்தகைய அங்கத்தினர்களின் கனிவான கவனத்திற்கு)

இப்பரிந்துரைகளைச் செயல்படுத்துவதன்் மூலமாக, தமிழ்க் கணிமையில் தேடல், வரிசைப்படுத்துதல், பக்க வடிவமைப்புகள், text-to-speech, ஆகிய செயல்பாடுகளில் கணிசமான முன்னேற்றமிருக்கும் என்பது என் எதிர்பார்ப்பு. முக்கியமாக, ஒற்றில் முடியும் பெயர்ச் சொற்களை ஆவணங்களிலிருந்து தேடியெடுக்க முடியும், அதாவது ஜெயமோகன் என்று தேடும்போது, 'ஜெயமோகனின்' (ஜெயமோகன் + இன்) என்ற அதற்குத் தொடர்புடைய instanceஉம் கிடைக்க வாய்ப்பிருக்கிறது. ஆனால், உகர / 'ம்' விகுதிச் சொற்களைத்் தேடிப்் பெறுவதில் இன்னமும் பிரச்சனை இருக்கும் (உ-ம், 'நாகப்பட்டினத்தில்', 'தமிழ் நாட்டை' ஆகியவை 'நாகப்பட்டினம்', 'தமிழ் நாடு' என்று கொடுத்துத் தேடினால் கிடைக்காது). அவற்றையும்் பெற வேண்டுமானால், மென்பொருள்களை கொஞ்சம் tinker செய்ய வேண்டியதுதான்.

12 கருத்துகள்:

இரா. செல்வராசு (R.Selvaraj) சொன்னது…: வாய்ஸ், நன்றாக எழுதி இருக்கிறீர்கள். புதிய யூனிகோடு சொல்வது போல் உயிர்மெய்களுக்குத் தனிவங்குகள் தேவையில்லை என்றே எனக்கும் தோன்றுகிறது. ஆனால், என்னால் உறுதியாகச் சொல்ல முடியவில்லை.

குறிப்பாக இப்போதும் உயிர்மெய்களைச் சரியாக rendering செய்வதற்கு ஏதோ நுட்பம் இருக்கிறது என்று நினைக்கிறேன். காட்டுக்கு, கெ என்று எழுத முதலில் க, பிறகு கொக்கி என்று எழுதினால், முன்பின் மாற்றிச் சரியாகக் கெ என்று காட்டுகிறது என்று எண்ணுகிறேன். இதனை உகர ஊகார உயிர்மெய்களில் இன்னும் பார்க்க முடியும். 'சூ' என்ற சரியான வடிவம் ச+ஊ என்றே இப்போதும் குறிக்கப் படுகிறது என்று எண்ணுகிறேன். இதன் நீட்சியாகவே எல்லா உயிர்மெய்களையும் (அகரமேறா மெய்யும் உயிரும் சேர்ந்து) குறிக்க முடியும் என்னும் போது உயிர்மெய்களுக்குத் தனிவங்குகள் தேவையில்லை தானே.

உங்களது பட்டியலில் உயிர்மெய்க் கீற்றுக்களில் உகர ஊகார உயிர்மெய்ச் சீர்திருத்தத்திற்கும் இடம் விட்டு அவற்றிற்கும் தனிக்கீற்றுக்கள் சேர்க்க வேண்டும். உதாரணத்திற்கு, ஜு, ஷூ என்கிறதில் உள்ள கிரந்தக் கீற்றுக்களைச் சிலரும், புதிய கீற்றுக்களைச் சிலரும் (நா.கணேசன் தமிழ்மணம் மன்றத்தில் சுட்டிய மயிலை கல்யாணின் யுனிசீர்மை எழுத்துரு) பரிந்துரைக்கிறார்கள்.

என் தனிக்கருத்து கிரந்தக் கீற்றுக்களே நன்றாக இருக்கின்றன என்பது தான்.; பிப்ரவரி 27, 2006 12:26 AM
Voice on Wings சொன்னது…: நன்றி, சதயம் :)

செல்வராஜ், rendering சரியில்லாத நிரலிகளில், அதனை வலுப்படுத்துவதே சிறந்த அணுகுமுறை. அதைக் காரணங்காட்டி ஒவ்வொரு உயிர்மெய்யெழுத்துக்கும் தனியிடம் ஒதுக்குவது ஒரு அதிகப்படியான நடவடிக்கையே. அவ்வாறு செய்வதால், நாம் முன்பு குறிப்பிட்ட தேடல் சிக்கலும் தீர்வடையாது.

எனக்குத் தெரிந்து உ, ஊ ஆகியவற்றின் கீற்றுக்கள் கிரந்த எழுத்துக்களில் உள்ளது போலத்தான் இப்போதும் உள்ளன. உ-ம்,
து = த + ு, தூ = த + ூ.

நான் பரிந்துரைக்கும் உயிர்மெய் 'தகர' வரிசை (ஒரு தெளிவிற்காக):
த = த் + [அகரம்] (currently non-existant vowel modfier)
தா = த் + ா
தி = த் + ி
தீ = த் + ீ
து = த் + ு
தூ = த் + ூ
தெ = த் + ெ
தே = த் + ே
தை = த் + ை
தொ = த் + ொ
தோ = த் + ோ
தௌ = த் + ௌ

மேலேயுள்ள கீற்றெழுத்துக்கள் எல்லாவற்றுக்கும் தனி குறியீடுகள் வழங்கப்பட வேண்டும், இப்போதிருப்பது போலவே. முக்கியமாக வேறுபடுவது, தற்போதுள்ள ஒற்றுப் புள்ளிக்கு பதிலாக அகரத்தைக் குறிக்கும் ஒரு கீற்றெழுத்து இருக்க வேண்டுமென்பதில்தான். இம்முறையில், உயிர்மெய்யிற்கான புணர்ச்சி விதி, இலக்கணத்திலுள்ளபடி இருப்பதைக் காணலாம். உங்கள் பரிந்துரையும் இதேதான், அல்லவா?; பிப்ரவரி 27, 2006 1:42 AM
இரா. செல்வராசு (R.Selvaraj) சொன்னது…: வாய்ஸ், ஆம். எனது பரிந்துரையும் அதுவே.; பிப்ரவரி 27, 2006 5:32 AM
இரா. செல்வராசு (R.Selvaraj) சொன்னது…: வாய்ஸ், உங்களின் கடைசிப் பின்னூட்டத்தில் எல்லாம் கட்டம் கட்டமாகத் தெரிவதால் சரியாக என்ன சொல்லி இருக்கிறீர்கள் என்பதில் சிறு ஐயம். பெரும்பாலும் கால், கொம்பு, கொக்கி போன்ற கீற்றுக்களைத் தான் அங்கு சொல்லி இருக்கிறீர்கள் என்று நினைக்கிறேன்.

உறுதியாக, நானும் அதையே தான் பரிந்துரைக்கிறேன் என்று சொல்லு முன்பாக எனக்கு இப்போது சந்தேகம் ஒன்றுள்ளது. அந்தக் கீற்றுக்களுக்குப் பதிலாக உயிர்களையே (அ, ஆ, இ..) குறித்து, renderingஇல் புணர்ந்து சரியான உயிர்மெய்யைக் கொணர முடியுமா? அது சிறப்பானதாய் இருக்குமா? வேறு சிக்கல்கள் உளவா? என்பவையே அவை.

உதாரணத்துக்கு, "ச+ூ=சூ" என்ற தற்போதைய முறைக்குப் பதிலாக "ச்+ூ=சூ" என்று நீங்கள் சொல்லுவதாய் எண்ணுகிறேன். அதையே
"ச்+ஊ=சூ" என்று குறித்தால் நிறை/குறைகள் என்ன என்று பார்க்க வேண்டும்.

(சொல்லின் இடையில் உயிர் வரும் சாத்தியம் சில இடங்களில் இருக்கிறது என்பதில் பிரச்சினைகள் எழலாம். இது குறித்தும் இராம.கி எங்கோ எழுதியதைப் படித்தது போல் ஞாபகம்); பிப்ரவரி 28, 2006 12:51 AM
Voice on Wings சொன்னது…: செல்வராஜ், சரியாகத்தான் ஊகித்திருக்கிறீர்கள். நீங்கள் காணும் கட்டங்களெல்லாம் நான் உள்ளிட்ட கீற்றெழுத்துக்கள்தான். (ஆனால், அவை ஏன் உங்களுக்குக் கட்டங்களாகத் தெரிகின்றன?)

"கீற்றெழுத்துக்கு பதிலாக உயிரெழுத்தையே உபயோகிக்கலாமே" என்ற உங்கள் யோசனையைப் பற்றி: எனக்கு என்னமோ, கீற்றுக்களை உபயோகித்தால் நிரலிகளுக்கு graphemesஐ அடையாளம் காண்பது எளிதாகுமோ என்று தோன்றியது. ஒரு உயிரெழுத்தாயிருந்தால் அது முழு எழுத்தா என்ற சந்தேகமிருக்கும். கீற்றென்றால் அது நிச்சயமாக பகுதியெழுத்துதான் என்ற அடிப்படையில் நிரலியால் grapheme boundaryஐ வரைய முடியும். இது எனது ஊகம்தான், வல்லுனர்கள்தான் இதற்கு சரியான விடையளிக்க வேண்டும்.; பிப்ரவரி 28, 2006 9:41 AM
Yagna சொன்னது…: VoW, நானும் நீங்கள் கூறுவதையே வலியுறுத்தி இந்த பதிவை உள்ளிட்டிருக்கேன். அங்கே 2002ல கேதி விஸ்ஸிங்க் எழ்ஹுதின ஆராய்ச்சிக் கட்டுரையையும் இனைத்திருக்கிறேன். அதை படிச்சுட்டு INFITT இந்த மாதிரி கோரிக்கையை ஆதரிச்சா என்ன பன்றது?; பிப்ரவரி 28, 2006 10:52 PM
பெயரில்லா சொன்னது…: இந்த கருத்து வலைப்பதிவு நிர்வாகியால் நீக்கப்பட்டது.; பிப்ரவரி 28, 2006 11:39 PM
பெயரில்லா சொன்னது…: . 50 சொச்சம் குறியீடுகள் "இருந்த இடத்தில் 300 சொச்சம் குறியீடுகளை வைத்துக் கணிமை செய்ய வேண்டுமென்றால், அதற்கு செயலியாற்றல் (CPU power), நினைவகத் தேவைகள் ஆகியன பல மடங்கு பெருகும் (இல்லாவிட்டால் கணிமைச் செயல்பாட்டின் வேகம் குறையலாம்). P4 / P5களுக்கு வேண்டுமானால் இது ஒரு பொருட்டாக இல்லாதிருக்கலாம்"

க் + அ அல்லது க + அ என்று சேமிப்பதற்கு இரண்டு மடங்கு பைட்
செலவாகும். ஒரே உயிர்மெய்யெழுத்திற்கு ஒரு குறியீடு இருந்தால்
குறைந்த இடம் தான் தேவை.; மார்ச் 01, 2006 1:01 AM
வலைஞன் சொன்னது…: //க = க் + அ, கா = க் + ஆ,........... போன்றப் புணர்ச்சி விதிகளை. ஆனால், ஒருங்குறியை உருவாக்கிய சான்றோர்களோ, இந்த அடிப்படையை கூட மதிக்காமல், க் = க + ஃ, கா = க + ஆ,........... என்ற புது வழியை ...//

க் ங் ச் போன்ற மெய்யெழுத்துக்களை விட க ங ச போன்ற உயிர்மெய் எழுத்துக்கள் நேரடி தட்டச்சின் போது அதிகமாகப் பயன்படுத்தப் படுகின்றன. இதனால் இவற்றை எழுத இரண்டு முறை தட்டுவதை குறைப்பதற்காக என இவ்வாறு தீர்மானிக்கப் பட்டிருக்கலாம்.

அப்போது இம்மாதிரி தேடுபொறிக் குழப்பங்கள் பற்றிய எண்ணம் எழுந்திருக்க வாய்ப்பில்லை. பயன்பாட்டில் தானே நிறை குறைகள் தெரிய வரும்?; மார்ச் 01, 2006 6:51 AM
Voice on Wings சொன்னது…: யக்ஞா,

உங்கள் பதிவை மேலோட்டமாகப் படித்தேன். விரிவாகப் படித்துவிட்டு உங்கள் பதிவிலேயே எனது கருத்தைத் தெரிவிக்கிறேன்.

******************
குமரன்,

வருகைக்கு நன்றி. இந்தப் பூப்பறிக்கும் விளையாட்டைப் பற்றி இன்னும் சரியாகப் புரிந்து கொள்ளவில்லை :) தமிழ்மணம் தேர்தல் களம் போலாகி விட்டது என்று மட்டும் புரிகிறது :)

******************
ஆதிரை,

நீங்கள் கூறுவது ஒரு கோப்பின் அளவு அதிகமாவதைப் பற்றி. அதை நானும் ஒப்புக்கொள்கிறேன். சில எழுத்துக்களைச்் சேமிக்க 16 பிட்களுக்கு பதிலாக 32 பிட்கள் ஆகும்். வேறு சில எழுத்துக்களுக்கு (உ-ம், மெய்யெழுத்துக்கள்) 32க்கு பதிலாக 16 பிட்களே செலவாகும். ஆனால் நான் கூற வருவது processing overload பற்றி. தமிழில் வேலை செய்ய வேண்டுமென்றாலே, 300+ எழுத்துக்களைக் கொண்ட look-up table மற்றும் அவற்றுக்கான glyph படங்கள், ஆகிய அனைத்தையும் நினைவில் ஏற்றி, ஒவ்வொரு செயலுக்கும் அவற்றை parse செய்து, என்று, செயலியின் மீதுள்ள சுமை அதிகமாகலாமென்பது என் ஊகம். நான் கூறியது போலவே, இது Intel Pentium 4 போன்ற செயலிகளில் எந்தவொரு மாறுதலையும் ஏற்படுத்தாது. ஆனால் பத்தாயிரம் ரூபாய்களுக்குக் குறைந்த கணினிகளை நினைத்துப் பாருங்கள். செல்பேசி, கைக்கணினி, e-book, போன்ற constrained configuration உள்ள கருவிகளை நினைத்துப் பாருங்கள். இவற்றிலும் தமிழ் கணிமை பரவலாக்கப்பட வேண்டுமல்லவா?

*********************
வலைஞன்,

தட்டச்சுக்கும் குறியேற்றத்திற்கும் சம்மந்தமில்லை. தற்போது 'க' என்ற வகையில் குறியீடு இருந்தாலும், romanized keyboardஇல் 'க் + அ' என்றுதான் தட்டச்சப்படுகிறது. அதேபோல், நாளை குறியேற்றத்தில் ஏதாவது மாறுதல் வந்து, 'க் + அ' என்று குறியீடுகள் மாறினாலும், அதை 'க' என்ற ஒரே தட்டில் பெறுமாறு நிரலியெழுதலாம். இப்போதும் 'Y' என்று ஒரே தட்டில் 'ஸ்ரீ' என்ற நான்கு குறியீடுகள் கொண்ட எழுத்தைப் பெறுகிறோமல்லவா (தமிழ்99 கீபோர்டில்)? keyboard நிரலியை வசதிக்கேற்றவாறு எழுதிக்கொள்ளலாம், குறியேற்றம் எப்படியிருந்தாலும்.; மார்ச் 01, 2006 10:10 AM
Voice on Wings சொன்னது…: ஒரு திருத்தம்: மேலே ஆதிரைக்குத் தெரிவித்த கருத்தில்,

//சில எழுத்துக்களைச்் சேமிக்க 16 பிட்களுக்கு பதிலாக 32 பிட்கள் ஆகும்். வேறு சில எழுத்துக்களுக்கு (உ-ம், மெய்யெழுத்துக்கள்) 32க்கு பதிலாக 16 பிட்களே செலவாகும்.்.//

இவ்வரிகள் தவறாகும். புதிய TUNE முறையில் எல்லா எழுத்துக்களுக்குமே 16 பிட்கள்தான் ஆகும். ஆகவே, சேமிப்பின் தேவை குறையுமென்பது உண்மையே. ஆனால் நான் கூறியது, 50இலிருந்து 300 குறியீடுகளாக உயருவதால், செயலியின் மீதுள்ள processing சுமையைப் பற்றி.; மார்ச் 01, 2006 11:15 AM
CAPitalZ சொன்னது…: http://1paarvai.wordpress.com/2006/09/23/tamil-unicode-16/

- ஒருங்குறியின் மேன்மை
- பிற மொழிகள் இடம்பெற்ற முறை
- தமிழ் மொழிக்கு உள்ள இடம்
- தமிழ் அறிஞர்கள் செய்யத் தவறிய செயல்
- தமிழுக்கு உள்ள சிக்கல் / அதனால் தமிழுக்குரிய பாதிப்பு
- தமிழுக்குக் கிடைக்க வேண்டிய இடம்
- தமிழை உயர்த்த செய்ய வேண்டிய பணிகள்
- போன்ற கருத்துகளுடன் நான் எடுத்துக் காட்ட விரும்பும் செயல் திட்டம் போன்றவற்றை பவர் பொய்ன்றில் கொடுத்துள்ளேன்.

தட்டிப் பார்க்கவும்.

______
CAPital; அக்டோபர் 19, 2006 11:06 PM