ஞாயிறு, ஜூலை 15, 2007

வெற்று விவாதங்கள் தரும் அயர்ச்சி

இணையத்தில் தமிழை முதலில் வலையேற்றியது யார் என்று ஒரு விரிவான விவாதம் நடைபெற்றுக் கொண்டிருக்கிறது. அவற்றின் ஆயிரக்கணக்கான சொற்களையும் பின்னூட்டங்களையும் சுட்டிகளையும் படித்த பின்னரும் எந்த ஒரு பயனுள்ள தகவலோ, அந்நேரத்தைச் செலவழித்ததற்கான நியாயப்படுத்தலோ இல்லாமல் ஒரு வெற்றுணர்வே ஏற்பட்டிருக்கிறது. எழுத்துலகப் பெருந்தலைகளுக்கும் வலையுலகப் பெருந்தலைகளுக்கும் நடக்கும் பனிப்போரும் அதைச் சுற்றி நின்று வேடிக்கை பார்க்கும் கூட்டமுமாக, ஒரு நுட்ப விவாதம் நடத்திச் செல்லப்படுவது தமிழர் முன்னேற்றம் குறித்த நம்பிக்கையின்மையையே ஏற்படுத்துவதாக உள்ளது.

முதலில் நம் தமிழ்ச்சூழலில் புழங்கும் அடைமொழிக் கலாச்சாரம். ராஜாதி ராஜ, ராஜ கம்பீர, ராஜ மார்த்தாண்ட என்று அக்காலத்தில் அரசர்களுக்குத் துதி பாடிய கேவலமான செயலின் நீட்சியாக இன்றும் ஒவ்வொருவருக்கும் அடைமொழி அளித்துக் கொள்ள வேண்டிய தேவை தொடருகிறது. ஆகவே, புரட்சித் தலைவர், புரட்சிக் கலைஞர், சொல்லின் செல்வர், சிலம்புச் செல்வர், மெல்லிசை மன்னர் போன்ற வெத்துப் பட்டங்கள் சராமாரியாக வாரி வழங்கப்பட்டுக் கொண்டிருக்கின்றன. அக்காலாச்சாரம் இணையத்திலும் புகுந்து, தமிழ் இணைய பிதா, மாதா என்று தனது அவல முகத்தைக் காட்டிக் கொண்டிருக்கிறது. நாளடைவில் இன்றைய முன்னணி இணைய பெர்சனாலிடிகளுக்கெல்லாம் இத்தகைய அடைமொழிகள் வந்துவிடக்கூடிய வேடிக்கையான சூழல் ஏற்படும் நாள் வெகு தொலைவிலில்லை என்பதை வருத்தத்துடன் குறிப்பிட்டுக் கொள்ள வேண்டியிருக்கிறது. Sycophancy என்பது நமது ரத்தத்தில் ஊறிவிட்ட ஒரு சமாச்சாரமாக இருக்கும் வேளையில் இது குறித்து எதுவும் செய்ய இயலப்போவதில்லை.

தமிழை வலையேற்றுவது அத்தகைய அரிய செயலா? அது ஒரு விஞ்ஞான / தொழில்நுட்பக் கண்டுபிடிப்பா என்றெல்லாம் நம்மை நாமே கொஞ்சம் கடினமான கேள்விகளைக் கேட்டுக் கொள்வது நலம். எல்லா மொழிகளும் தமது எழுத்துக்களை கணிமைப் படுத்திய பின், தமிழர்களுக்கே உரிய வேகத்துடன் ஆற அமர நமது எழுத்துக்களையும் கணிமைப்படுத்தி உள்ளோம். இதற்காக எதுவும் புதிய நுட்பங்களை உருவாக்கியிருக்கத் தேவை இருந்திருக்காது. மற்ற மொழிகளில் என்ன செய்திருக்கிறார்கள் என்று பார்த்துக் கொண்டு, அதை நமது மொழிக்கும் localize செய்ய வேண்டியிருந்திருக்கும். ஒரு சில நாட்களில், இரவு உணவுக்குப் பின் படுக்கப்போகுமுன் சில மணி நேரங்களுக்கு சில சோதனைகளைச் செய்து அதில் வெற்றி கண்டுவிடக்கூடிய ஒரு வேலைக்கு "இணைய பிதா" போன்ற பில்டப்புகள் தேவையா? அது யாராக இருந்தால் என்ன? இந்தப் பிதா இல்லையென்றால் வேறொரு பிதா அதைச் செய்திருப்பார். இந்த நுட்பங்களெல்லாம் ராணுவ ரகசியங்களல்ல. நுட்ப ஆர்வலர்கள் மத்தியில் எளிதாகவே பரிமாறிக் கொள்ளப்படுபவைதான் இவையெல்லாம்.

இவ்வளவு புளகாங்கிதமடைகிறோம் நமது தமிழ்க் கணிமையைக் குறித்து. ஆனால் உண்மை நிலையென்ன? ஆங்கிலம் தெரியாத ஒருவரால் கணினியைப் பயன்படுத்த முடியாது என்ற கசப்பான உண்மைதான் இன்றும் நிலவுகிறது. தேநீர்க் கடையில் தினத்தந்தி வாசிக்கும் பாமரன் கணினியைப் பயன்படுத்த முடியப் போவது எப்போது? அவரது கணினிப் பயன்பாட்டுக்குத் தடையாயிருப்பது அவரது பொருளாதார நிலை மட்டும்தானா? கணினிகளின் விலை குறைந்து கொண்டே வருகின்றன. ஒரு சிறிய வங்கிக் கடனை வாங்கி, அதில் ஒரு கணினியை வாங்கிப் போடுவது அவருக்கு அப்படியொன்றும் கடினமான செயலாக இருக்காது. அதைவிட அவருக்குப் பெரிய தடைக்கற்களாக இருக்கக்கூடியவை அக்கணினியிலுள்ள ஆங்கில QWERTY விசைப்பலகையும், Start > Program Files என்று விளிக்கும் ஆங்கில இடைமுகமும்தான். அதன்பிறகு அவர் தமிழ்மணத்திற்கோ தினமலர் தளத்திற்கோ வரவேண்டுமென்றாலும் அதற்கு அவருக்குத் தெரிந்திருக்க வேண்டிய ஆங்கில URL முகவரிகளும்தான். ஆகவே,
  • முற்றும் முழுவதுமாகத் தமிழ் பேசும் கணினி தேவை (அது 'ழ' கணினியோ அல்லது 'ஙே' கணினியோ :) )
  • அதன் விசைப்பலகையின் விசைகளில் தமிழெழுத்துக்கள் பொறித்திருக்க வேண்டும் என்பது ஒரு obvious தேவை. (பாமினி, ஷாலினி என்று ஆயிரத்தெட்டு வகையறாக்கள் இல்லாமல், ஆங்கிலத்தில் QWERTY என்று ஒன்று இருப்பது போல், அனைவருக்கும் ஏற்புடைய ஒரு வடிவமைப்பில்)
  • URL transliterator: இப்போதைக்கு தமிழில் URLகள் வரப்போவதில்லை. ஆனால் ஒரு பயனர் தனக்கு வேண்டிய வலைத்தள முகவரியைத் தமிழில் தட்டச்சு செய்தால், அதை ஒரு ஆங்கில http வேண்டுகோளாக மாற்றுவது சாத்தியமே. இதுவும் ஒரு அத்தியாவசியத் தேவை.
  • OpenOffice முற்றும் முழுவதுமாக தமிழ் இடைமுகத்துடன்
  • நெடுங்கால இலக்கு - பயனர் ஆங்கில வலைத்தளங்களைக் கோரினாலும் குத்துமதிப்பாகவாவது machine translation செய்து அவற்றைத் தமிழில் வழங்கும் தொழில்நுட்பம். அது போலவே, ஆங்கில ஆவணங்களை (குத்துமதிப்பாகவாவது) தமிழில் மொழிபெயர்க்கும் OpenOffice plugin.
'தமிழிணைய வேந்தர்கள்', 'செந்தமிழ்க் கணிமைப் புரவலர்கள்' (என் பங்குக்கு சில அடைமொழிகள்) ஆகியோர் இத்திசைகளில் சிந்தித்தால் கொஞ்சம் நன்றாயிருக்கும் - பழைய பல்லவிகளைப் பாடுவதை விடுத்து.

வெள்ளி, ஜூலை 13, 2007

தமிழ்த்திரையில் பெண்கள் பற்றிய விவாதம்

அண்மையில சில சுவாரசியமான விவாதங்களைப் பார்க்க முடிஞ்சுது - குறிப்பா லட்சுமி மற்றும் மோகன்தாசுக்கு இடையில் நடைபெற்று வரும் / வந்த 'சிவாஜி' குறித்த விவாதங்கள். அந்தப் படத்த நான் இன்னும் பாக்கல்ல - பாக்கறதா உத்தேசமும் கிடையாது. லட்சுமியோட வாதம் முதலில் கவனத்தை கவர்ந்தது. அவர் கூறும் கருத்து - பெண்களை (அல்லது ஒரு குறிப்பிட்ட பெண்ணை) 'கொஞ்சமே கொஞ்சம்' புத்திசாலித்தனத்துடனாவது இப்படத்தில் சித்தரித்திருக்க வேண்டும் என்பதாகப் புரிந்து கொள்கிறேன். அதுக்கு மோகன்தாஸ் எதிர்வினையாற்றி மொத்த ஆண்குலத்தின் சார்பா சில கருத்துகளைத் தெரிவிச்சதில் எனக்கு அவ்வளவா உடன்பாடு கிடையாது. ஒரு ஆண் என்ற முறையில், திறமையுள்ள பெண்களையே விரும்பியிருக்கிறேன், தொடர்ந்து விரும்பவும் செய்வேன் என்ற உறுதிமொழி அளித்துவிட்டு (அப்படியே மோகன்தாசின் கூற்றில் உண்மையில்லை என்பதையும் நிரூபித்துக் கொண்டு) எனது வாதத்தைத் தொடர்கிறேன்.

இங்க நான் உதாரணமா குறிப்பிட விரும்பும் ஒரு படம் Kill Bill. படம் ஒரு பெண்ணை மையமாகக் கொண்டது. அவளது எதிரிகளும் பெண்களே. படத்தில் நிறைய சண்டைக் காட்சிகள் வரும், நன்றாகப் படமாக்கப்பட்டிக்கும். கொஞ்சம் உன்னிப்பா கவனிச்சீங்கன்னா, அவள் ஆண்களை வெகு சுலபமா வீழ்த்தி விடுவாள். அவர்கள் நூற்றுக்கணக்கா வந்தாலும் அவர்களையெல்லாம் ஒரு சில நிமிடங்களில் ஒன்றுமில்லாமல் ஆக்கி விடுவாள். ஆனா எதிரில் சண்டையிடுவது பெண் என்னும்போது மட்டும் வெகு நேரப் போராட்டத்துக்குப் பிறகே அவளால வெற்றியடைய முடியும். இது ஏன் அப்படின்னா, அதைப் படைத்தவரின் மனநிலையை ஒத்தே அவர் வெளியிடும் படைப்பும் அமையும்ன்னு அதை அப்படியே ஏத்துக்க வேண்டியதுதான். பெண்களை சண்டைக்கலையில் திறமை மிக்கவர்களாகக் காட்ட வேண்டும் என்ற படைப்பாளியின் முடிவை நாம கேள்வி கேட்க முடியாது, அப்படி கேள்வியில்லாமல் ஏற்றுக் கொண்டுதான் இருக்கிறோம் (படத்தை வெற்றியாக்கியதன் மூலமாக). Crouching tiger........, Charlie's Angels, போன்ற படங்களிலும் இத்தகைய கருத்தை வெளிப்படுத்தியிருப்பார்கள். அவையும் வெற்றியடைந்தனன்னு நினைக்கறேன்.

இது என்ன அநியாயம்? ஆண்களை விட அவ வலு மிக்கவளாகவே இருக்கட்டும்....... ஆனாலும், அவளை சில நிமிடங்களாவது தாக்குப் பிடிக்கக் கூடியவர்களா ஆண்களை சித்தரிச்சிருக்க'லாம்', 'லாம்'ன்னு பல லாம்களை அடுக்குவது எவ்வளவு அபத்தமானதா இருக்கு? இன்னைக்கு பெண்களை 33% ஆவது புத்திசாலிகளா காட்டணும்ன்னு கேப்போம். அப்பறம், சிறுபான்மையினரை குற்றவாளிகளாவோ, தீய பழக்கம் உடையவர்களாவோ காட்டக்கூடாதுன்னுவோம். அதுக்கு அப்பறம் எரிபொருள் சேமிக்கிறதுக்காக இனிமே ஹீரோக்கள் பஸ்லயோ, டிரெயின்லயோ பயணம் செய்யற மாதிரிதான் காட்சி அமைக்கணும், கார்ல போற மாதிரி காட்டினா நல்ல 'முன்மாதிரி'யா இருக்காதுன்னுவோம். ஏற்கனவே, சினிமால புகை பிடிக்கக்கூடாது, தண்ணியடிக்கக்கூடாது, முத்தம் குடுத்துக்கக்கூடாதுன்னு சட்டம் போட்டு தடை செஞ்சாச்சு. தமிழ்ல பேர் வைக்க'லாமே'ன்னு (வன்மையாவே) அறிவுறுத்தியாச்சு. இவ்வளவு விதிகள் / வழிகாட்டுதல்களையும் கடந்து ஒரு படைப்பாளிக்கு புனைய எதாவது கதை மிஞ்சுமான்னு பாக்கணும்.

Stereotypeகள் தொடரணும்ன்னு சொல்லல்ல. பெண்கள் சில குறிப்பிட்ட நடிகர்களின் படங்களில் சற்று சாமர்த்தியம் குறைந்தவர்களாகக் காட்டப்படுகிறார்கள்ன்னா அதை ஒத்துக்கறேன். ஆனா, ஒட்டு மொத்த தமிழ் சினிமால வர்ற பெண் பாத்திரங்கள் எல்லாமே அவ்வாறுதான் சித்தரிக்கப்படுகிறார்கள்ன்னா அதை என்னால நிச்சயமா மறுக்க முடியும். (நடிகை) லட்சுமி, சுஜாதா, ஸ்ரீதேவி, சரிதா, சுகாசினி, ரேவதி, ராதிகா போன்ற நடிகைகள் பல படங்களில் சுயசிந்தனையாளர்களா காட்டப்பட்டிருக்காங்க. அவங்கல்லாம் பாலசந்தர் பட நாயகிகள் எனப்படும் 'தாழ்த்தப்பட்ட' கேட்டகிரில வர்றாங்களான்னு தெரியல. ஒரு சில நாட்களுக்கு முன்பு நான் பார்த்த '16 வயதினிலே', அதே இயக்குனரின் 'சிகப்பு ரோஜாக்கள்'ன்னு நிறைய top-of-the-mind உதாரணங்களைத் தர முடியும். 'மிஸ்டர் சுகாசினியின் பெண்கள்' அப்படீன்னு மதுரா ஒரு தனிப்பதிவே போடுமளவுக்கு உதாரணங்கள் உண்டு.

பழைய எம்ஜியார் படம் ஒண்ணு டிவில போய்க்கிட்டு இருந்தது. பேர் தெரியல. ஆனா கதை என்னன்னா, ஒரு துஷ்டப் பெண்ணரசி, பகடை விளையாட்டுல தந்திரம் செஞ்சி வேற்று நாட்டு அரசர்களை எல்லாம் தனக்கு அடிமைகளாக்கி, அவர்களது நாடுகளையும் தன்வசப்படுத்துகிறாள் என்பதுதான். இன்னொரு உதாரணம் - "வாராய் நீ வாராய்............. போகுமிடம் வெகு தூரமில்லை, நீ வாராய்........" என்ற பாட்டின் காட்சியமைப்பு ஞாபகமிருக்கும்ன்னு நினைக்கிறேன். தன்னை மலையிலிருந்து தள்ளிவிடப்போகும் கணவனை தந்திரத்தால் வென்று உயிர் தப்பும் பெண்ணை பற்றிய காட்சி அதுன்னு நினைக்கிறேன். ஆக, பெண்களை அறிவுக் கூர்மை மிக்கவர்களாக (பெண்ணியமெல்லாம் பேசப்படாத) அந்தக்காலத்திலிருந்தே காட்டி வந்திருக்கிறார்கள் என்பதுதான் இதிலிருந்து நான் நிறுவ முயலுவது.

ஒரு பாத்திரப் படைப்பு என்பது முற்றும் முழுவதுமாக ஒரு படைப்பாளியின் உரிமை. சரஸ்வதி நிர்வாணமாக இருக்கிறாளா என்பது அவளைப் படைப்பவன் கையிலேயே உள்ளது. அவ்வாறு இருந்திருக்கக் கூடாது என்பதெல்லாம் கலை வன்முறையே. அதே போலத்தான் ஒரு படைப்பாளியின் பாத்திரப் படைப்பை கேள்விக்குள்ளாக்குவதுவும்.

சனி, ஜூலை 07, 2007

ஒரு வேற்று மொழியில் சில வெளிப்பாடுகள்

^\$[0-9]+(\.00)?$ - இதைப் பார்த்தால் என்னவெல்லாமோ தோன்றலாம். ஆனால் இது பயப்படும்படியான விஷயமல்ல. சொல்லப்போனால் இது ஒரு விருப்பத்தின் வெளிப்பாடாகும். அதாவது, ஒரு ஆவணத்தில் எங்கெல்லாம் (டாலர்களில்) பணம் குறிப்பிடப்பட்டிருக்குன்னு தேடி நமக்குச் சொல்லுவதற்குத்தான் இப்படி ஒரு வெளிப்பாடு (expression). இது எவ்வகையான வெளிப்பாடு என்று யோசனையில் மூழ்குவதற்கு முன் நானே கூறிவிடுகிறேன். இவை regular expressions அல்லது சுருக்கமாக regex எனப்படுபவை.

இதே மாதிரி இன்னொரு regexஐப் பார்க்கலாம்:
^(http://)?.*(blog|wordpress|typepad|livejournal).*$ - இதைப் பார்த்தா ஏதோ வலைப்பதிவுகள் சம்மந்தப்பட்டதுன்னு புரிஞ்சிருக்கும். ஒரு பக்கத்தில் இருக்கும் எல்லா வலைப்பதிவு முகவரிகளையும் தேடிக் குடுக்கத்தான் இந்த regex. குறிப்பிட்ட பதிவு / தளத்தில் எந்தெந்த வலைப்பதிவுகளுக்கெல்லாம் இணைப்பு கொடுக்கப்பட்டுள்ளதுன்னு தேட விரும்பினா இதை பயன்படுத்தலாம்.

இதப் பாருங்க: .*[;:]-?[)\*pD]$ இது என்னவா இருக்கும்ன்னு நினைக்கறீங்க? இதை வச்சி உங்களுக்கு வந்த ஒரு மடலில் அதை அனுப்பியவர் என்னல்லாம் சொல்லி உங்க கிட்ட வழிஞ்சிருக்காருன்னு தெரிஞ்சிக்கலாம் ;) (இதோ, இந்த மாதிரிதான்)

இப்படி, சிக்கலான வேலைகளையும் சுருக்கமான குறிப்புகளைக் கொண்டு சாதிக்கும் ஆற்றல் படைத்தவை இந்த regexகள். அவற்றின் புரியாத மொழியை எப்படி புரிஞ்சிக்கிறது?

அ, ஆ, இ, ஈ, யிலிருந்து ஆரம்பிக்க வேண்டியதுதான். அவற்றுடைய எழுத்துக்கள் இவைதான்:
^ - ஒரு பொருளின் தொடக்கம் (இதில் பொருள் என்பது இடத்திற்குத் தகுந்தாற்போல் சொல் / வாக்கியம் / பத்தி இப்படி எதுவாக வேண்டுமானாலும் இருக்கலாம்) . உ-ம். ^தமிழ் - தமிழ் என்று தொடங்கும் அனைத்துப் பொருட்களையும் குறிக்கும்.

$ - ஒரு பொருளின் முடிவு. உ-ம். வடை$ - வடை என்று முடியும் அனைத்து பொருட்களையும் குறிக்கும் (இட்லிவடை, சட்னிவடை, etc.)

. - எந்த ஒரு குறியீடாகவும் இருக்கலாம்
உ-ம். ப.ம் எனபது பணம் என்பதற்கும் பொருந்தும், பலம் / பதம் என்பவற்றுக்கும் பொருந்தும். பயணம் என்பதற்குப் பொருந்தாது, ஏன் என்பதை ஊகித்துக் கொள்ளவும்.

* - இதற்கு முன் இடம்பெறும் குறியீடு ஒரு முறையும் வராமலிருக்கலாம் அல்லது , ஒரு முறையோ பலமுறைகளோ கூட வரலாம்.
உ-ம். க.*னி. இதற்குப் பொருந்தக் கூடிய சொற்கள் 'கனி' (ஒரு குறியீடு கூட இல்லாதிருக்கலாம் அல்லவா?), கணினி (நடுவில் ஒரு குறியீடு), கவிதாயினி (நடுவில் பல குறியீடுகள்)

+ - இதற்கு முன் இடம் பெறும் குறியீடு ஒரு முறையோ அல்லது அதற்கு மேலோ வரலாம். உ-ம். (லக)+ எனபது லகலகலகலகலகலக என்று எவ்வளவு 'லக-லக'க்களை வேண்டுமானாலும் குறிக்க வல்லது.

? - இதற்கு முன் வரும் குறியீடு ஒரு முறை வரலாம் அல்லது வராமலே போகலாம்.
உ-ம். இ?ராமன். ராமனுக்கு முன் 'இ' போட்டாலும் போடாவிட்டாலும் பொருத்தமே.

[ ] - இவற்றுக்குள் இருக்கும் குறியீடுகளில் ஒன்றைக் குறிக்கும்
உ-ம். க[லரடணன]ம் எனபது கலம், கரம், கணம், கனம், கடம் ஆகியவற்றைக் குறிக்கும். கரணம் என்பதைக் குறிக்காது.

இந்த சதுர அடைப்புக்குறிகளுக்குள் ஒரு rangeஐயும் குறிப்பிடலாம்.

உ-ம் ^[அ-ஔ] என்பது உயிரெழுத்துக்களில் தொடங்கும் சொற்களுக்குப் பொருந்தும். அவ்வாறு வேண்டாமென்பதையும் குறிப்பிட இயலும்
உ-ம் ^[^அ-ஔ] என்பது உயிரெழித்துக்களில் தொடங்கும் சொற்களைத் தவிர இதர சொற்களைத் தருமாறு வேண்டுவதற்காகும். caret(^) சின்னம் சதுர அடைப்புகளுக்குள் வரும்போது அதன் பொருள் வேறுபடுவதைப் பார்க்கலாம்.

( ) - இவற்றுக்குள் இருக்கும் குறியீடுகள் அப்படியே கூட்டாக இயங்கும் எனபதை முந்தைய லகலக உதாரணத்திலேயே பார்த்தோம். அதோடு, இது ஒரு தற்காலிக நினைவகமாகவும் செயல்படுகிறது. அதாவது, இந்த அடைப்புக் குறிகளுக்குள் உள்ளவற்றை $1, $2, $3...... போன்ற பெயர்களைக் கொண்டு இதர வெளிப்பாடுகளில் பயன்படுத்த இயலும்.

| - மேலுள்ள கூட்டெழுத்துகளுக்கு options கொடுக்க இந்தக் குறியீடு பயன்படும்.
உ-ம் .*\.(mp3|wav|wma|ogg|ram|aac)$ என்பது எல்லா விதமான ஒலிக்கோப்புகளையும் தேடிப் பெறுவதற்கு உபயோகப்படும்.

\ - மேலுள்ள குறியீடுகளையே regex கொண்டு தேடணும்ன்னா, அவற்றை அப்படியே கொடுக்க முடியாது. ஆகவே, இந்தக் குறியீட்டைப் பயன்படுத்தி, அவைகளைத் தேடணும். உ-ம். \$[0-9]+(\.00)? $1000.00 என்பதைத் தேடிப் பெறணும். ஆனா $க்கும் .க்கும் regexல வேற பொருள் இருக்கு. ஆகவே \$, \. அப்படீன்னு குறிப்பிட்டு, அதுக்கு regexக்கான பொருளை எடுத்துக் கொள்ளாமல், வழக்கமான பொருளை எடுத்துக் கொள்ளும்படி குறிப்பிடுவதற்குத்தான் இந்தக் குறியீடு. இந்த உத்தியை escape செய்வது என்பார்கள். தவறாகப் புரிந்து கொள்ளப்படுவதிலிருந்து பிழைத்துக் கொள்வது என்று எடுத்துக் கொள்ளலாம்.

அ, ஆ, இ, ஈ தெரிஞ்சாச்சி இல்லையா? இனி படைப்பிலக்கியத்தில் இறங்கி விட வேண்டியதுதான். வாங்க, கொஞ்சம் regex வெளிப்பாடுகளை நாமும் வெளிப்படுத்தலாம்.


(\+[0-9]+[- ])?\(?[0-9]+\)?[- ][0-9]+([- ][0-9]+)? - இந்த அழகான expressionஐக் கொண்டு ஒரு ஆவணத்தில் இடம்பெறும் எல்லா தொலைப்பேசி எண்களையும் பெறலாம்.

^.*sort.*\(.*\).*{$ - இது கோடாளிகளுக்கு. வரிசைப்படுத்தும் (sorting) நிரல்களை தேடிப் பிடிக்கலாம் (hopefully).

^.*(எட்|8)டு?.*.*$ - எல்லா எட்டு போட்ட பதிவுகளின் தலைப்புகளும் ('டு'வுக்கு அடுத்துள்ள கேள்விக்குறியை கவனிக்க! எட்டப்பன், எட்டாக்கனி, எட்டிய உயரங்கள்ன்னு எல்லா சாத்தியங்களையும் cover பண்ணணுமில்லையா?)

^.*(போதும்)+.*(ஐயோ)*.*(அம்மா)*!? - இப்பதிவைப் படித்துக் கொண்டிருக்கும் உங்களின் இப்போதைய மனநிலை இப்படி இருக்காது என்று நம்புகிறேன்.

Regexஐ எங்கே பயன்படுத்துகிறார்கள் என்றால், பொதுவாக மென்பொருள்களில் அதிகமாக இது உபயோகப் படுத்தப் படுகிறது. Markup மொழிகளில் உள்ள ஆவணங்களிலிருந்து வேண்டிய தகவலைப் பிரித்தெடுப்பதற்கு (இதை ஆங்கிலத்தில் parsing என்பார்கள்) இது பயன்படுகிறது. மென்பொருள்களுக்கு அப்பாலும், வழக்கமான தேடலை விட மிகத் துல்லியமான விடைகளை அளிக்கும் சாத்தியத்தை regex நமக்கு அளிக்கிறது. ஆகவேதான், OpenOfficeஇல் இதைக் கொண்டு தேடும் வசதியும் வழங்கப்பட்டுள்ளது. Microsoft Officeஇன் தற்போதைய பதிப்பில் எப்படியென்று தெரியவில்லை. கூகிள் போன்ற இணையத் தேடல்களிலும் இத்தகைய தேடல் வசதியை வழங்கலாமென்று தோன்றுகிறது.

இன்னொரு பயன்பாடு, வலைத்தளங்களின் URLஐ அழகுபடுத்துவதற்கு. வெளியுலகுக்கு ஒரு வலைப்பக்கத்தின் URL www.domain.com/abcd/efgh/ijkl என்று அழகாக வழங்கப்பட்டிருக்கும். ஆனால் பக்கம் இருப்பதுவோ www.domain.com/cgi-bin/abcd.cgi?x=efgh&y=JwwpxU4852&z=ijkl என்று எதாவதொரு கந்திர கோளமான முகவரியில். கொடுக்கப்பட்ட URLஐயும் பக்கம் உண்மையில் இருக்கும் URLஐயும் எப்படி பொருந்த வைப்பது? இதற்குத்தான் web serverஇல் ^/([^/]+)/([^/]+)/([^/]+)$ என்பதைப் போன்ற ஒரு regex எழுதப்பட்டிருக்கும், அதற்குப் பொருந்தும் http வேண்டுகோள்களை இவ்வாறு மாற்றி எழுதுவதற்கு: ^/cgi-bin/$1\.cgi\?x=$2&y=JwwpxU4852&z=$3$. இந்த மாற்றியெழுதுதலுக்கு URL rewriting என்று பெயர். இதற்கு regex பெரிதும் பயன்படுகிறது.

வேறெதுவும் பயன் இருக்கிறதா என்றுத் தெரியவில்லை. இருந்தாலும் ஒரு சாமர்த்தியமான ஒரு நுட்பம் இது என்பதில் சந்தேகமில்லை. மிகவும் பயனுள்ள செயல்பாடுகளை இதனால் நாம் அடையக்கூடும் என்பதை மட்டும் உறுதியாகக் கூறிக் கொள்கிறேன்.