ஞாயிறு, பிப்ரவரி 26, 2006

தமிழ் ஒருங்குறி - நியூ

இப்போது பழைய ஒருங்குறி, புதிய ஒருங்குறி என்று ஆங்காங்கே சலசலப்புகள் கேட்டுக் கொண்டிருக்கின்றன. இப்பதிவு தற்போது புழக்கத்திலுள்ள ஒருங்குறி பற்றியும், அதற்கு மாற்றாக முன்வைக்கப்படும் TUNE பற்றியுமான விமர்சனங்களை வைப்பதற்கே. இவ்விஷயத்தைப் பற்றிய சரியான புரிதலைப் பெற இக்கட்டுரை உதவக்கூடும் (நன்றி: டைனோ). மேலும் இராம.கி.யும்(சுட்டி #1, சுட்டி #2) செல்வராஜும் இதனைப் பற்றி சிறப்பாக விளக்கியுள்ளார்கள் (அவசியம் படிக்க வேண்டிய இடுகைகள்). இவையனைத்தையும் உள்வாங்கிக் கொண்ட நிலையில், ஒரு சாமானியனாக என் நிலைப்பாட்டை இங்கு வழங்குகிறேன். (இது பற்றிய எனது முந்தைய பதிவு - பின்னூட்டங்களில் உள்ள தகவல்களுக்காக)

தற்போதைய ஒருங்குறியிலுள்ள முக்கியமான பிழை அதில் உயிர்மெய்யெழுத்துக்கள் உருவாக்கப்படும் விதம்தான். ஒரு பள்ளி மாணவனுக்கும் தெரியும், க = க் + அ, கா = க் + ஆ,........... போன்றப் புணர்ச்சி விதிகளை. ஆனால், ஒருங்குறியை உருவாக்கிய சான்றோர்களோ, இந்த அடிப்படையை கூட மதிக்காமல், க் = க + ஃ, கா = க + ஆ,........... என்ற புது வழியை நமக்கு வழங்கியிருக்கிறார்கள். இதனால், எளிதில் கிடைத்திருக்கக் கூடிய ஒரு பொன்னான வாய்ப்பை நழுவ விட்டிருக்கிறது தமிழ்ச் சமூகம்.

எனக்குத் தெரிந்த வரையில், Tamil is a highly structured language. அதன் உறுதியான வடிவமைப்பினால், அதன் இலக்கண விதிகளைக் கொண்டே அதைக் கணிமைப்படுத்துவது எளிது. மொழியின் அடிப்படைகளைக் கடாசி விட்டு, க + ஆ, க + இ என்றெல்லாம் எழுத்துக்களை உருவாக்கியதால், இன்று நமக்கு எளிதில் கிடைத்திருக்கக் கூடிய ஒரு வசதி - கணிமையாற்றலால் சொற்களைத் தேடிப் பெறும் வசதி, ஒரு கைக்கெட்டாத கனியாகி விட்டது. ஒற்றில் முடியும் பெயர்ச் சொற்கள் - கோயமுத்தூர், சங்கர், ஜெயமோகன்....... போன்றவைகளை ஒரு ஆவணத்திலிருந்து தேடியெடுக்கும் வசதி இதனால் தாரை வார்க்கப் பட்டுவிட்டது. ஏனென்றால், அவை 'கோயமுத்தூரில்' (கோயமுத்தூர + இல்), 'சங்கரின்' (சங்கர + இன்), 'ஜெயமோகனை' (ஜெயமோகன + ஐ), என்றெல்லாம்தான் பெரும்பாலும் அந்த ஆவணத்தில் இடம் பெற்றிருக்கும். அவற்றை தேடிப் பெறுவதற்கு, "ஜெய ஜய சங்கர" என்று் முழங்க வேண்டியதுதான்.

இன்னும் சில சிக்கல்களைப் பற்றிக்் கூறுகிறேன், கேட்டுக்கொள்ளுங்கள். 'திருக்குறள்' அல்லது 'கம்பன்' என்ற சொல்லை எங்கிருந்தாவது select & copy செய்கிறீர்கள். அதைக் கொண்டு போய் paste செய்தால் வருவதென்ன? 'திருக்குறள' அல்லது 'கம்பன'. இன்னொரு சிக்கல், ஒரு சொல்லுக்குப் பிறகு full-stopஓ, commaவோ வைக்க மறந்து விட்டதால், cursorஐ அங்கு நகர்த்திச் சென்று, வேண்டிய நிறுத்தக் குறியீட்டைப் புகுத்துகிறீர்கள். உ-ம், 'நன்றி' என்பதற்குப் பிறகு full-stop வைக்கிறீர்கள். ஆனால், full-stop விழுவதோ, இவ்வாறு ----> 'ற.ி' மற்றொன்று - நேற்று ஒரு நண்பருடன் அரட்டையில், "கிருஷ்ணா கஃபேயில் என்ன சாப்பிட்டே?" என்று கேட்க முயன்ற போது, அது 'கஃபே'யை 'க்பே' என்று மாற்றி டென்ஷனாக்கியது. இது போல் பல சிக்கல்கள் இருக்கின்றன, இப்போதுள்ள ஒருங்குறியில்.

இப்போது TUNE எனப்படும் பயங்கரத்தைப் பற்றிப் பார்ப்போம். 'வெச்சா குடுமி, சிரைச்சா மொட்டை' என்பது போல், தற்போதைய ஒருங்குறியின் உயிர்மெய் புணர்ச்சி விதியில் தவறிருக்கிறது என்பதற்காக, புணர்ச்சி என்பதே இல்லாமல் ஒழித்துக் கட்டி விட்டு், ஒவ்வொரு உயிர்மெய்யெழுத்துக்கும் ஒரு தனி குறியீடு வைக்கப்பட்டிருக்கிறதாம். இவ்வாறு, மொத்தமாக முன்னூத்தி சொச்சம் குறியீடுகள். மொழியின் அடிப்படை என்ன? உயிர்மெய் என்பது ஒரு மெய்யெழுத்தும் ஒரு உயிரெழுத்தும் புணருவதால் ஏற்படும் கூட்டெழுத்து என்பதே. ஆகவே, அதை அப்படியே விட்டு வைப்பதுதான் மொழிக்கு நாம் செலுத்தும்் மரியாதை. உயிர்மெய் என்பது இரு குறியீடுகளைக் கொண்டே குறிக்கப்பட வேண்டும். அதை ஒரு குறியீடாகச் சுருக்குவதால் என்ன பயன்? இந்த ஏற்பாட்டில், 'இவன்' என்ற சொல் 'இவனால்' (இவனா + ல்), 'இவனை' (இவனை), 'இவனோடு' (இவனோ + டு), 'இவனிடம்' (இவனி +டம்) ஆகியவற்றில் இடம்பெறவில்லை என்பது, அடைப்புக் குறிகளுக்குள் கொடுக்கப்பட்ட அவற்றின் TUNE representationஐப் பார்த்தாலே் புரியும். முன்னூற்றுக்கும் மேற்பட்ட எண்களுடைய code set மட்டும் நமக்குக் கிடைத்துவிட்டால், நமது எல்லா பிரச்சனைகளும் தீர்ந்து விடும் என்ற தவறான எண்ணமும் ஆபத்தானது. 50 சொச்சம் குறியீடுகள் இருந்த இடத்தில் 300 சொச்சம் குறியீடுகளை வைத்துக் கணிமை செய்ய வேண்டுமென்றால், அதற்கு செயலியாற்றல் (CPU power), நினைவகத் தேவைகள் ஆகியன பல மடங்கு பெருகும் (இல்லாவிட்டால் கணிமைச் செயல்பாட்டின் வேகம் குறையலாம்). P4 / P5களுக்கு வேண்டுமானால் இது ஒரு பொருட்டாக இல்லாதிருக்கலாம். ஆனால் நாம் கிராமங்களுக்கெல்லாம்் கணினிகளைக் கொண்டு செல்ல வேண்டுமென்றால், lowest common denominatorஐத்தான் நாம் கணக்கில் கொள்ள வேண்டும். (சிம்ப்யூட்டர், கைக்கணினி, செல்பேசி, இதர embedded கணினிகளுக்கான இடைமுகங்கள் etc etc). We need a computing platform that's lean & mean.

எனது பரிந்துரைகள்:
  1. கீழ்க்கண்ட குறியீடுகளே இடம்பெற்றிருக்க வேண்டும்
    • உயிரெழுத்துக்கள் 'அ' விலிருந்து 'ஔ' வரை (and not 'ஃ' to 'ஔ')
    • ஆய்த எழுத்து
    • மெய்யெழுத்துக்கள் 'க்'இலிருந்து 'ன்' வரை (இலக்கண வரிசைப்படி)
    • கிரந்த எழுத்துக்கள் 'ஸ்'இலிருந்து 'க்ஷ்' வரை, மற்றும் 'ஸ்ரீ'
    • உயிர்மெய்க் கீற்றுக்கள் (கால், கொக்கி, கொம்பு etc etc)
    • தமிழ் எண்கள் மற்றும் சிறப்புச் சின்னங்கள்
  2. உயிர்மெய்யெழுத்து = மெய்யெழுத்து + கீற்றெழுத்து என்ற அடிப்படையில் புணர்ச்சிகள் ஏற்பட வேண்டும் (க = க் + அ, கா = க் + ஆ, இத்யாதி, இத்யாதி)
  3. grapheme boundary vs. word boundary வேறுபாட்டை நிரலிகள் அறிந்திருக்க வேண்டும் (if they claim Unicode compliance).
  4. 'Select', 'Insert', 'sort', 'letter-spacing' ஆகிய செயல்களைச் செய்யும்போது, நிரலிகள் முழு எழுத்துக் கொத்துக்களையும் (character clusters) எடுத்துக் கொண்டு, அவற்றின் மீதே இச்செயல்களைச் செய்ய வேண்டும்.
மேலே குறிப்பிட்ட 1 & 2 ஆகியவற்றை, தமிழ் ஒருங்குறியைச் சீர்திருத்துவதால் அடையலாம். 3 & 4 ஆகியன, மென்பொருள் நிறுவனங்கள் கவனிக்க வேண்டியவை. குறைந்தப்பட்சம், உலாவிகள், மின்மடல் எழுதிகள், word processors, வலை / அச்சுப் பக்கங்களை வடிவமைக்க உதவும் PageMaker / Acrobat / DreamWeaver / Flash போன்ற மென்பொருட்கள், ஆகியவையாவது 3 & 4ஐக் கட்டாயமாகக் கடைபிடிக்க வேண்டும். Unicode compliant என்ற முத்திரையைப் வழங்குவதற்கான விதிகளைக் கடுமையாக்குவதன் மூலம், ஒருங்குறிக் கூட்டமைப்பே இதனை ஓரளவுக்கு உறுதி செய்யலாமென்பது எனது தாழ்மையான கருத்து. இவ்வமைப்பிலுள்ள தமிழ் அங்கத்தினர்கள் கொஞ்சம் அழுத்தம் கொடுத்தால், இத்திசையை நோக்கிய நகர்வுகள் நிகழலாம்.(இதைப் படிக்க நேரும் அத்தகைய அங்கத்தினர்களின் கனிவான கவனத்திற்கு)

இப்பரிந்துரைகளைச் செயல்படுத்துவதன்் மூலமாக, தமிழ்க் கணிமையில் தேடல், வரிசைப்படுத்துதல், பக்க வடிவமைப்புகள், text-to-speech, ஆகிய செயல்பாடுகளில் கணிசமான முன்னேற்றமிருக்கும் என்பது என் எதிர்பார்ப்பு. முக்கியமாக, ஒற்றில் முடியும் பெயர்ச் சொற்களை ஆவணங்களிலிருந்து தேடியெடுக்க முடியும், அதாவது ஜெயமோகன் என்று தேடும்போது, 'ஜெயமோகனின்' (ஜெயமோகன் + இன்) என்ற அதற்குத் தொடர்புடைய instanceஉம் கிடைக்க வாய்ப்பிருக்கிறது. ஆனால், உகர / 'ம்' விகுதிச் சொற்களைத்் தேடிப்் பெறுவதில் இன்னமும் பிரச்சனை இருக்கும் (உ-ம், 'நாகப்பட்டினத்தில்', 'தமிழ் நாட்டை' ஆகியவை 'நாகப்பட்டினம்', 'தமிழ் நாடு' என்று கொடுத்துத் தேடினால் கிடைக்காது). அவற்றையும்் பெற வேண்டுமானால், மென்பொருள்களை கொஞ்சம் tinker செய்ய வேண்டியதுதான்.

15 கருத்துகள்:

சதயம் சொன்னது…

ஐயா! இது சாமானியனின் பார்வையில்லை...தீர்க்கமாய் யோசிக்கும் ஒரு ஆய்வாளனின் பார்வையில் எழுதியிருக்கிறீர்கள்.

உங்கள் கருத்துக்களை வழிமொழிகிறேன்.

செல்வராஜ் (R.Selvaraj) சொன்னது…

வாய்ஸ், நன்றாக எழுதி இருக்கிறீர்கள். புதிய யூனிகோடு சொல்வது போல் உயிர்மெய்களுக்குத் தனிவங்குகள் தேவையில்லை என்றே எனக்கும் தோன்றுகிறது. ஆனால், என்னால் உறுதியாகச் சொல்ல முடியவில்லை.

குறிப்பாக இப்போதும் உயிர்மெய்களைச் சரியாக rendering செய்வதற்கு ஏதோ நுட்பம் இருக்கிறது என்று நினைக்கிறேன். காட்டுக்கு, கெ என்று எழுத முதலில் க, பிறகு கொக்கி என்று எழுதினால், முன்பின் மாற்றிச் சரியாகக் கெ என்று காட்டுகிறது என்று எண்ணுகிறேன். இதனை உகர ஊகார உயிர்மெய்களில் இன்னும் பார்க்க முடியும். 'சூ' என்ற சரியான வடிவம் ச+ஊ என்றே இப்போதும் குறிக்கப் படுகிறது என்று எண்ணுகிறேன். இதன் நீட்சியாகவே எல்லா உயிர்மெய்களையும் (அகரமேறா மெய்யும் உயிரும் சேர்ந்து) குறிக்க முடியும் என்னும் போது உயிர்மெய்களுக்குத் தனிவங்குகள் தேவையில்லை தானே.

உங்களது பட்டியலில் உயிர்மெய்க் கீற்றுக்களில் உகர ஊகார உயிர்மெய்ச் சீர்திருத்தத்திற்கும் இடம் விட்டு அவற்றிற்கும் தனிக்கீற்றுக்கள் சேர்க்க வேண்டும். உதாரணத்திற்கு, ஜு, ஷூ என்கிறதில் உள்ள கிரந்தக் கீற்றுக்களைச் சிலரும், புதிய கீற்றுக்களைச் சிலரும் (நா.கணேசன் தமிழ்மணம் மன்றத்தில் சுட்டிய மயிலை கல்யாணின் யுனிசீர்மை எழுத்துரு) பரிந்துரைக்கிறார்கள்.

என் தனிக்கருத்து கிரந்தக் கீற்றுக்களே நன்றாக இருக்கின்றன என்பது தான்.

Voice on Wings சொன்னது…

நன்றி, சதயம் :)

செல்வராஜ், rendering சரியில்லாத நிரலிகளில், அதனை வலுப்படுத்துவதே சிறந்த அணுகுமுறை. அதைக் காரணங்காட்டி ஒவ்வொரு உயிர்மெய்யெழுத்துக்கும் தனியிடம் ஒதுக்குவது ஒரு அதிகப்படியான நடவடிக்கையே. அவ்வாறு செய்வதால், நாம் முன்பு குறிப்பிட்ட தேடல் சிக்கலும் தீர்வடையாது.

எனக்குத் தெரிந்து உ, ஊ ஆகியவற்றின் கீற்றுக்கள் கிரந்த எழுத்துக்களில் உள்ளது போலத்தான் இப்போதும் உள்ளன. உ-ம்,
து = த + ு, தூ = த + ூ.

நான் பரிந்துரைக்கும் உயிர்மெய் 'தகர' வரிசை (ஒரு தெளிவிற்காக):
த = த் + [அகரம்] (currently non-existant vowel modfier)
தா = த் + ா
தி = த் + ி
தீ = த் + ீ
து = த் + ு
தூ = த் + ூ
தெ = த் + ெ
தே = த் + ே
தை = த் + ை
தொ = த் + ொ
தோ = த் + ோ
தௌ = த் + ௌ

மேலேயுள்ள கீற்றெழுத்துக்கள் எல்லாவற்றுக்கும் தனி குறியீடுகள் வழங்கப்பட வேண்டும், இப்போதிருப்பது போலவே. முக்கியமாக வேறுபடுவது, தற்போதுள்ள ஒற்றுப் புள்ளிக்கு பதிலாக அகரத்தைக் குறிக்கும் ஒரு கீற்றெழுத்து இருக்க வேண்டுமென்பதில்தான். இம்முறையில், உயிர்மெய்யிற்கான புணர்ச்சி விதி, இலக்கணத்திலுள்ளபடி இருப்பதைக் காணலாம். உங்கள் பரிந்துரையும் இதேதான், அல்லவா?

செல்வராஜ் (R.Selvaraj) சொன்னது…

வாய்ஸ், ஆம். எனது பரிந்துரையும் அதுவே.

செல்வராஜ் (R.Selvaraj) சொன்னது…

வாய்ஸ், உங்களின் கடைசிப் பின்னூட்டத்தில் எல்லாம் கட்டம் கட்டமாகத் தெரிவதால் சரியாக என்ன சொல்லி இருக்கிறீர்கள் என்பதில் சிறு ஐயம். பெரும்பாலும் கால், கொம்பு, கொக்கி போன்ற கீற்றுக்களைத் தான் அங்கு சொல்லி இருக்கிறீர்கள் என்று நினைக்கிறேன்.

உறுதியாக, நானும் அதையே தான் பரிந்துரைக்கிறேன் என்று சொல்லு முன்பாக எனக்கு இப்போது சந்தேகம் ஒன்றுள்ளது. அந்தக் கீற்றுக்களுக்குப் பதிலாக உயிர்களையே (அ, ஆ, இ..) குறித்து, renderingஇல் புணர்ந்து சரியான உயிர்மெய்யைக் கொணர முடியுமா? அது சிறப்பானதாய் இருக்குமா? வேறு சிக்கல்கள் உளவா? என்பவையே அவை.

உதாரணத்துக்கு, "ச+ூ=சூ" என்ற தற்போதைய முறைக்குப் பதிலாக "ச்+ூ=சூ" என்று நீங்கள் சொல்லுவதாய் எண்ணுகிறேன். அதையே
"ச்+ஊ=சூ" என்று குறித்தால் நிறை/குறைகள் என்ன என்று பார்க்க வேண்டும்.

(சொல்லின் இடையில் உயிர் வரும் சாத்தியம் சில இடங்களில் இருக்கிறது என்பதில் பிரச்சினைகள் எழலாம். இது குறித்தும் இராம.கி எங்கோ எழுதியதைப் படித்தது போல் ஞாபகம்)

Voice on Wings சொன்னது…

செல்வராஜ், சரியாகத்தான் ஊகித்திருக்கிறீர்கள். நீங்கள் காணும் கட்டங்களெல்லாம் நான் உள்ளிட்ட கீற்றெழுத்துக்கள்தான். (ஆனால், அவை ஏன் உங்களுக்குக் கட்டங்களாகத் தெரிகின்றன?)

"கீற்றெழுத்துக்கு பதிலாக உயிரெழுத்தையே உபயோகிக்கலாமே" என்ற உங்கள் யோசனையைப் பற்றி: எனக்கு என்னமோ, கீற்றுக்களை உபயோகித்தால் நிரலிகளுக்கு graphemesஐ அடையாளம் காண்பது எளிதாகுமோ என்று தோன்றியது. ஒரு உயிரெழுத்தாயிருந்தால் அது முழு எழுத்தா என்ற சந்தேகமிருக்கும். கீற்றென்றால் அது நிச்சயமாக பகுதியெழுத்துதான் என்ற அடிப்படையில் நிரலியால் grapheme boundaryஐ வரைய முடியும். இது எனது ஊகம்தான், வல்லுனர்கள்தான் இதற்கு சரியான விடையளிக்க வேண்டும்.

Yagna சொன்னது…

VoW, நானும் நீங்கள் கூறுவதையே வலியுறுத்தி இந்த பதிவை உள்ளிட்டிருக்கேன். அங்கே 2002ல கேதி விஸ்ஸிங்க் எழ்ஹுதின ஆராய்ச்சிக் கட்டுரையையும் இனைத்திருக்கிறேன். அதை படிச்சுட்டு INFITT இந்த மாதிரி கோரிக்கையை ஆதரிச்சா என்ன பன்றது?

குமரன் (Kumaran) சொன்னது…

அன்பு நண்பரே.

http://elavasam.blogspot.com/2006/02/blog-post_28.html

இந்த வலைப் பதிவைப் பார்த்து உங்கள் பொன்னான வாக்குகளை எங்கள் ரோஜா அணியினருக்குத் தருமாறு பணிவன்புடன் வேண்டிக் கொள்கிறேன்.

aathirai சொன்னது…
இந்த கருத்து வலைப்பதிவு நிர்வாகியால் நீக்கப்பட்டது.
aathirai சொன்னது…

. 50 சொச்சம் குறியீடுகள் "இருந்த இடத்தில் 300 சொச்சம் குறியீடுகளை வைத்துக் கணிமை செய்ய வேண்டுமென்றால், அதற்கு செயலியாற்றல் (CPU power), நினைவகத் தேவைகள் ஆகியன பல மடங்கு பெருகும் (இல்லாவிட்டால் கணிமைச் செயல்பாட்டின் வேகம் குறையலாம்). P4 / P5களுக்கு வேண்டுமானால் இது ஒரு பொருட்டாக இல்லாதிருக்கலாம்"

க் + அ அல்லது க + அ என்று சேமிப்பதற்கு இரண்டு மடங்கு பைட்
செலவாகும். ஒரே உயிர்மெய்யெழுத்திற்கு ஒரு குறியீடு இருந்தால்
குறைந்த இடம் தான் தேவை.

newsintamil சொன்னது…

//க = க் + அ, கா = க் + ஆ,........... போன்றப் புணர்ச்சி விதிகளை. ஆனால், ஒருங்குறியை உருவாக்கிய சான்றோர்களோ, இந்த அடிப்படையை கூட மதிக்காமல், க் = க + ஃ, கா = க + ஆ,........... என்ற புது வழியை ...//

க் ங் ச் போன்ற மெய்யெழுத்துக்களை விட க ங ச போன்ற உயிர்மெய் எழுத்துக்கள் நேரடி தட்டச்சின் போது அதிகமாகப் பயன்படுத்தப் படுகின்றன. இதனால் இவற்றை எழுத இரண்டு முறை தட்டுவதை குறைப்பதற்காக என இவ்வாறு தீர்மானிக்கப் பட்டிருக்கலாம்.

அப்போது இம்மாதிரி தேடுபொறிக் குழப்பங்கள் பற்றிய எண்ணம் எழுந்திருக்க வாய்ப்பில்லை. பயன்பாட்டில் தானே நிறை குறைகள் தெரிய வரும்?

Voice on Wings சொன்னது…

யக்ஞா,

உங்கள் பதிவை மேலோட்டமாகப் படித்தேன். விரிவாகப் படித்துவிட்டு உங்கள் பதிவிலேயே எனது கருத்தைத் தெரிவிக்கிறேன்.

******************
குமரன்,

வருகைக்கு நன்றி. இந்தப் பூப்பறிக்கும் விளையாட்டைப் பற்றி இன்னும் சரியாகப் புரிந்து கொள்ளவில்லை :) தமிழ்மணம் தேர்தல் களம் போலாகி விட்டது என்று மட்டும் புரிகிறது :)

******************
ஆதிரை,

நீங்கள் கூறுவது ஒரு கோப்பின் அளவு அதிகமாவதைப் பற்றி. அதை நானும் ஒப்புக்கொள்கிறேன். சில எழுத்துக்களைச்் சேமிக்க 16 பிட்களுக்கு பதிலாக 32 பிட்கள் ஆகும்். வேறு சில எழுத்துக்களுக்கு (உ-ம், மெய்யெழுத்துக்கள்) 32க்கு பதிலாக 16 பிட்களே செலவாகும். ஆனால் நான் கூற வருவது processing overload பற்றி. தமிழில் வேலை செய்ய வேண்டுமென்றாலே, 300+ எழுத்துக்களைக் கொண்ட look-up table மற்றும் அவற்றுக்கான glyph படங்கள், ஆகிய அனைத்தையும் நினைவில் ஏற்றி, ஒவ்வொரு செயலுக்கும் அவற்றை parse செய்து, என்று, செயலியின் மீதுள்ள சுமை அதிகமாகலாமென்பது என் ஊகம். நான் கூறியது போலவே, இது Intel Pentium 4 போன்ற செயலிகளில் எந்தவொரு மாறுதலையும் ஏற்படுத்தாது. ஆனால் பத்தாயிரம் ரூபாய்களுக்குக் குறைந்த கணினிகளை நினைத்துப் பாருங்கள். செல்பேசி, கைக்கணினி, e-book, போன்ற constrained configuration உள்ள கருவிகளை நினைத்துப் பாருங்கள். இவற்றிலும் தமிழ் கணிமை பரவலாக்கப்பட வேண்டுமல்லவா?

*********************
வலைஞன்,

தட்டச்சுக்கும் குறியேற்றத்திற்கும் சம்மந்தமில்லை. தற்போது 'க' என்ற வகையில் குறியீடு இருந்தாலும், romanized keyboardஇல் 'க் + அ' என்றுதான் தட்டச்சப்படுகிறது. அதேபோல், நாளை குறியேற்றத்தில் ஏதாவது மாறுதல் வந்து, 'க் + அ' என்று குறியீடுகள் மாறினாலும், அதை 'க' என்ற ஒரே தட்டில் பெறுமாறு நிரலியெழுதலாம். இப்போதும் 'Y' என்று ஒரே தட்டில் 'ஸ்ரீ' என்ற நான்கு குறியீடுகள் கொண்ட எழுத்தைப் பெறுகிறோமல்லவா (தமிழ்99 கீபோர்டில்)? keyboard நிரலியை வசதிக்கேற்றவாறு எழுதிக்கொள்ளலாம், குறியேற்றம் எப்படியிருந்தாலும்.

Voice on Wings சொன்னது…

ஒரு திருத்தம்: மேலே ஆதிரைக்குத் தெரிவித்த கருத்தில்,

//சில எழுத்துக்களைச்் சேமிக்க 16 பிட்களுக்கு பதிலாக 32 பிட்கள் ஆகும்். வேறு சில எழுத்துக்களுக்கு (உ-ம், மெய்யெழுத்துக்கள்) 32க்கு பதிலாக 16 பிட்களே செலவாகும்.்.//

இவ்வரிகள் தவறாகும். புதிய TUNE முறையில் எல்லா எழுத்துக்களுக்குமே 16 பிட்கள்தான் ஆகும். ஆகவே, சேமிப்பின் தேவை குறையுமென்பது உண்மையே. ஆனால் நான் கூறியது, 50இலிருந்து 300 குறியீடுகளாக உயருவதால், செயலியின் மீதுள்ள processing சுமையைப் பற்றி.

CAPitalZ சொன்னது…

http://1paarvai.wordpress.com/2006/09/23/tamil-unicode-16/

- ஒருங்குறியின் மேன்மை
- பிற மொழிகள் இடம்பெற்ற முறை
- தமிழ் மொழிக்கு உள்ள இடம்
- தமிழ் அறிஞர்கள் செய்யத் தவறிய செயல்
- தமிழுக்கு உள்ள சிக்கல் / அதனால் தமிழுக்குரிய பாதிப்பு
- தமிழுக்குக் கிடைக்க வேண்டிய இடம்
- தமிழை உயர்த்த செய்ய வேண்டிய பணிகள்
- போன்ற கருத்துகளுடன் நான் எடுத்துக் காட்ட விரும்பும் செயல் திட்டம் போன்றவற்றை பவர் பொய்ன்றில் கொடுத்துள்ளேன்.

தட்டிப் பார்க்கவும்.

______
CAPital

sexy சொன்னது…

情趣用品,情趣用品,情趣用品,情趣用品,情趣用品,情趣用品,情趣,情趣,情趣,情趣,情趣,情趣,情趣用品,情趣用品,情趣,情趣,A片,A片,情色,A片,A片,情色,A片,A片,情趣用品,A片,情趣用品,A片,情趣用品,a片,情趣用品

A片,A片,AV女優,色情,成人,做愛,情色,AIO,視訊聊天室,SEX,聊天室,自拍,AV,情色,成人,情色,aio,sex,成人,情色

免費A片,美女視訊,情色交友,免費AV,色情網站,辣妹視訊,美女交友,色情影片,成人影片,成人網站,H漫,18成人,成人圖片,成人漫畫,情色網,日本A片,免費A片下載,性愛

情色文學,色情A片,A片下載,色情遊戲,色情影片,色情聊天室,情色電影,免費視訊,免費視訊聊天,免費視訊聊天室,一葉情貼圖片區,情色視訊,免費成人影片,視訊交友,視訊聊天,言情小說,愛情小說,AV片,A漫,AVDVD,情色論壇,視訊美女,AV成人網,成人交友,成人電影,成人貼圖,成人小說,成人文章,成人圖片區,成人遊戲,愛情公寓,情色貼圖,色情小說,情色小說,成人論壇


情色文學,色情小說,情色小說,色情,寄情築園小遊戲,情色電影,aio,av女優,AV,免費A片,日本a片,美女視訊,辣妹視訊,聊天室,美女交友,成人光碟

A片,A片,A片下載,做愛,成人電影,.18成人,日本A片,情色小說,情色電影,成人影城,自拍,情色論壇,成人論壇,情色貼圖,情色,免費A片,成人,成人網站,成人圖片,AV女優,成人光碟,色情,色情影片,免費A片下載,SEX,AV,色情網站,本土自拍,性愛,成人影片,情色文學,成人文章,成人圖片區,成人貼圖