ஜாவாஸ்கிரிப்ட்டில் UTF-8 ஐ குறியாக்கம்/டிகோட் செய்வது எப்படி

Javaskiripttil Utf 8 Ai Kuriyakkam Tikot Ceyvatu Eppati



UTF-8 என்பது ' யூனிகோட் உருமாற்ற வடிவம் 8-பிட் ” மற்றும் பயன்படுத்தப்பட்ட மொழி/ஸ்கிரிப்டைப் பொருட்படுத்தாமல் எல்லா சாதனங்களிலும் எழுத்துகள் சரியான முறையில் காட்டப்படுவதை உறுதிசெய்யும் ஒரு சிறந்த குறியாக்க வடிவமைப்பிற்கு ஒத்திருக்கிறது. மேலும், இந்த வடிவம் இணையப் பக்கங்களுக்கு உதவிகரமாகவும், இணையத்தில் உரைத் தரவைச் சேமிப்பதற்கும், செயலாக்குவதற்கும், பரிமாற்றுவதற்கும் பயன்படுத்தப்படுகிறது.

இந்த டுடோரியல் கீழே கூறப்பட்ட உள்ளடக்க பகுதிகளை உள்ளடக்கியது:







UTF-8 குறியாக்கம் என்றால் என்ன?

' UTF-8 குறியாக்கம் ” என்பது யூனிகோட் எழுத்துகளின் வரிசையை 8-பிட் பைட்டுகளைக் கொண்ட குறியாக்கப்பட்ட சரமாக மாற்றும் செயல்முறையாகும். மற்ற எழுத்துக்குறி குறியீட்டு முறைகளுடன் ஒப்பிடும்போது இந்த குறியாக்கம் பெரிய அளவிலான எழுத்துக்களைக் குறிக்கும்.



UTF-8 என்கோடிங் எப்படி வேலை செய்கிறது?

UTF-8 இல் உள்ள எழுத்துக்களைக் குறிக்கும் போது, ​​ஒவ்வொரு தனிப்பட்ட குறியீடு புள்ளியும் ஒன்று அல்லது அதற்கு மேற்பட்ட பைட்டுகளால் குறிக்கப்படுகிறது. ASCII வரம்பில் உள்ள குறியீடு புள்ளிகளின் முறிவு பின்வருமாறு:



  • ஒற்றை பைட் ASCII வரம்பில் (0-127) குறியீடு புள்ளிகளைக் குறிக்கிறது.
  • இரண்டு பைட்டுகள் ASCII வரம்பில் (128-2047) குறியீடு புள்ளிகளைக் குறிக்கின்றன.
  • மூன்று பைட்டுகள் ASCII வரம்பில் (2048-65535) குறியீடு புள்ளிகளைக் குறிக்கின்றன.
  • நான்கு பைட்டுகள் ASCII வரம்பில் (65536-1114111) குறியீடு புள்ளிகளைக் குறிக்கின்றன.

இது '' இன் முதல் பைட் UTF-8 'வரிசை' என்று குறிப்பிடப்படுகிறது தலைவர் பைட் ” இது வரிசையில் உள்ள பைட்டுகளின் எண்ணிக்கை மற்றும் பாத்திரத்தின் குறியீடு புள்ளி மதிப்பு பற்றிய தகவல்களை வழங்குகிறது.
ஒற்றை, இரண்டு, மூன்று மற்றும் நான்கு பைட்டுகள் வரிசைக்கான 'லீடர் பைட்' முறையே (0-127), (194-233), (224-239), மற்றும் (240-247) வரம்பில் உள்ளது.





வரிசையில் மீதமுள்ள பைட்டுகள் '' என்று அழைக்கப்படுகின்றன. பின்தங்கி ”பைட்டுகள். இரண்டு, மூன்று மற்றும் நான்கு பைட் வரிசைக்கான பைட்டுகள் அனைத்தும் வரம்பில் உள்ளன (128-191). முன்னணி மற்றும் பின்தங்கிய பைட்டுகளை பகுப்பாய்வு செய்வதன் மூலம் கதாபாத்திரத்தின் குறியீட்டு புள்ளி மதிப்பைக் கணக்கிட முடியும்.

கோட் பாயின்ட் மதிப்புகள் எவ்வாறு கணக்கிடப்படுகின்றன?

வெவ்வேறு பைட் வரிசைகளுக்கான குறியீடு புள்ளி மதிப்புகள் பின்வருமாறு கணக்கிடப்படுகின்றன:



  • இரண்டு பைட் வரிசை: குறியீட்டு புள்ளி '((எல்பி - 194) * 64) + (டிபி - 128)' க்கு சமம்.
  • மூன்று பைட்டுகள் வரிசை : குறியீட்டு புள்ளி '((எல்பி - 224) * 4096) + ((டிபி1 - 128) * 64) + (டிபி2 - 128)'க்கு சமம்.
  • நான்கு பைட்டுகள் வரிசை : குறியீடு புள்ளியானது '((எல்பி - 240) * 262144) + ((டிபி1 - 128) * 4096) + ((டிபி2 - 128) * 64) + (டிபி3 - 128)' க்கு சமமானது.

ஜாவாஸ்கிரிப்ட்டில் UTF-8 ஐ குறியாக்கம்/டிகோட் செய்வது எப்படி?

ஜாவாஸ்கிரிப்டில் UTF-8 இன் குறியாக்கம் மற்றும் டிகோடிங் கீழே கூறப்பட்ட அணுகுமுறைகள் மூலம் மேற்கொள்ளப்படலாம்:

  • ' enodeURICகூறு() 'மற்றும்' decodeURICகூறு() ”முறைகள்.
  • ' encodeURI() 'மற்றும்' decodeURI() ”முறைகள்.
  • வழக்கமான வெளிப்பாடுகள்.

அணுகுமுறை 1: “encodeURICcomponent()” மற்றும் “decodeURICcomponent()” முறைகளைப் பயன்படுத்தி ஜாவாஸ்கிரிப்ட்டில் UTF-8 ஐ குறியாக்கம்/டிகோட் செய்யவும்

' குறியாக்கம்யூரிகாம்பொனென்ட்() ” முறை URI கூறுகளை குறியாக்குகிறது. மேலும், இது @, &, :, +, $, # போன்ற சிறப்பு எழுத்துக்களை குறியாக்கம் செய்யலாம். decodeURIகூறு() ” முறை, இருப்பினும், ஒரு URI கூறுகளை டிகோட் செய்கிறது. இந்த முறைகள் முறையே UTF-8 க்கு அனுப்பப்பட்ட மதிப்புகளை குறியாக்கம் மற்றும் குறியாக்கம் செய்ய பயன்படுத்தப்படலாம்.

தொடரியல் (“குறியீடுயூரிகாம்பொனென்ட்()” முறை)

குறியாக்கம்URIகூறு ( எக்ஸ் )

கொடுக்கப்பட்ட தொடரியல், ' எக்ஸ் ” என்பது குறியிடப்பட வேண்டிய URI ஐக் குறிக்கிறது.

வருவாய் மதிப்பு
இந்த முறை குறியிடப்பட்ட URI ஐ ஒரு சரமாக மீட்டெடுத்தது.

தொடரியல் ('டிகோட்யூரிகாம்பொனென்ட்()' முறை)

decodeURIகூறு ( எக்ஸ் )

இங்கே,' எக்ஸ் ” என்பது டிகோட் செய்யப்பட வேண்டிய URI ஐக் குறிக்கிறது.

வருவாய் மதிப்பு
இந்த முறை டிகோட் செய்யப்பட்ட URI ஐ வழங்குகிறது.

எடுத்துக்காட்டு 1: ஜாவாஸ்கிரிப்டில் UTF-8 ஐ குறியாக்குதல்
இந்த எடுத்துக்காட்டு, பயனர் வரையறுக்கப்பட்ட செயல்பாட்டின் உதவியுடன் அனுப்பப்பட்ட சரத்தை குறியிடப்பட்ட UTF-8 மதிப்புக்கு குறியாக்குகிறது:

செயல்பாடு encode_utf8 ( எக்ஸ் ) {
திரும்ப தப்பிக்காமல் ( குறியாக்கம்URIகூறு ( எக்ஸ் ) ) ;
}
val விடவும் = 'இங்கே' ;
பணியகம். பதிவு ( 'கொடுக்கப்பட்ட மதிப்பு ->' + மதிப்பு ) ;
encodeVal ஐ விடுங்கள் = encode_utf8 ( மதிப்பு ) ;
பணியகம். பதிவு ( 'குறியீடு செய்யப்பட்ட மதிப்பு ->' + குறியாக்கம் ) ;

இந்த குறியீடு வரிகளில், கீழே கொடுக்கப்பட்டுள்ள படிகளைச் செய்யவும்:

  • முதலில், செயல்பாட்டை வரையறுக்கவும் ' encode_utf8() ” என்று குறிப்பிட்ட அளவுருவால் குறிப்பிடப்படும் அனுப்பப்பட்ட சரத்தை குறியாக்குகிறது.
  • இந்த குறியாக்கம் ' குறியாக்கம்யூரிகாம்பொனென்ட்() 'செயல்பாடு வரையறையில் முறை.
  • குறிப்பு: ' unescape() ” முறை எந்த தப்பிக்கும் வரிசையையும் அது குறிப்பிடும் எழுத்துடன் மாற்றுகிறது.
  • அதன் பிறகு, குறியாக்கம் செய்யப்பட வேண்டிய மதிப்பை துவக்கி அதைக் காண்பிக்கவும்.
  • இப்போது, ​​வரையறுக்கப்பட்ட செயல்பாட்டை செயல்படுத்தி, இந்த மதிப்பை UTF-8க்கு குறியாக்க, வரையறுக்கப்பட்ட எழுத்துகளின் கலவையை அதன் வாதங்களாக அனுப்பவும்.

வெளியீடு

இங்கே, தனிப்பட்ட எழுத்துக்கள் UTF-8 இல் குறிப்பிடப்பட்டு குறியாக்கம் செய்யப்படுகின்றன என்பதைக் குறிக்கலாம்.

எடுத்துக்காட்டு 2: ஜாவாஸ்கிரிப்டில் UTF-8 ஐ டிகோடிங் செய்தல்
கீழேயுள்ள குறியீடு விளக்கமானது, குறியிடப்பட்ட UTF-8 பிரதிநிதித்துவத்திற்கு அனுப்பப்பட்ட மதிப்பை (எழுத்துகள் வடிவில்) டிகோட் செய்கிறது:

செயல்பாடு decode_utf8 ( எக்ஸ் ) {
திரும்ப decodeURIகூறு ( தப்பிக்க ( எக்ஸ் ) ) ;
}
val விடவும் = 'çè' ;
பணியகம். பதிவு ( 'கொடுக்கப்பட்ட மதிப்பு ->' + மதிப்பு ) ;
டிகோட் செய்யலாம் = decode_utf8 ( மதிப்பு ) ;
பணியகம். பதிவு ( 'டிகோட் செய்யப்பட்ட மதிப்பு ->' + டிகோட் ) ;

இந்த குறியீட்டின் தொகுதியில்:

  • அதேபோல், செயல்பாட்டை வரையறுக்கவும் ' decode_utf8() ' இது ' வழியாக அனுப்பப்பட்ட எழுத்துக்களின் கலவையை டிகோட் செய்கிறது decodeURIகூறு() ”முறை.
  • குறிப்பு: ' தப்பிக்க() ” முறையானது ஒரு புதிய சரத்தை மீட்டெடுக்கிறது, இதில் பல்வேறு எழுத்துக்கள் பதிலீடு எண் பதின்மமான எஸ்கேப் சீக்வென்ஸால் மாற்றப்படுகின்றன.
  • அதன் பிறகு, டிகோட் செய்யப்பட வேண்டிய எழுத்துக்களின் கலவையைக் குறிப்பிடவும் மற்றும் UTF-8 க்கு டிகோடிங்கைச் செய்ய வரையறுக்கப்பட்ட செயல்பாட்டை அணுகவும்.

வெளியீடு

இங்கே, முந்தைய எடுத்துக்காட்டில் உள்ள குறியிடப்பட்ட மதிப்பு இயல்புநிலை மதிப்பிற்கு டிகோட் செய்யப்பட்டுள்ளது என்பதைக் குறிக்கலாம்.

அணுகுமுறை 2: “encodeURI()” மற்றும் “decodeURI()” முறைகளைப் பயன்படுத்தி ஜாவாஸ்கிரிப்டில் UTF-8 ஐ குறியாக்கம்/டிகோட் செய்யவும்

' encodeURI() ” முறையானது, பல எழுத்துகளின் ஒவ்வொரு நிகழ்வையும், பாத்திரத்தின் UTF-8 குறியாக்கத்தைக் குறிக்கும் பல தப்பிக்கும் தொடர்களுடன் மாற்றுவதன் மூலம் URI ஐ குறியாக்குகிறது. ஒப்பிடும்போது ' குறியாக்கம்யூரிகாம்பொனென்ட்() ” முறை, இந்த குறிப்பிட்ட முறை வரையறுக்கப்பட்ட எழுத்துக்களை குறியாக்குகிறது.

' decodeURI() ” முறை, இருப்பினும், URI (குறியீடு செய்யப்பட்டது) ஐ டிகோட் செய்கிறது. UTF-8 குறியிடப்பட்ட மதிப்பில் உள்ள எழுத்துக்களின் கலவையை குறியாக்கம் மற்றும் குறியாக்கம் செய்ய இந்த முறைகள் இணைந்து செயல்படுத்தப்படலாம்.

தொடரியல்(குறியீடுயூரி() முறை)

என்கோடுயூரி ( எக்ஸ் )

மேலே உள்ள தொடரியல், “ எக்ஸ் ” என்பது URI ஆக குறியிடப்பட வேண்டிய மதிப்புக்கு ஒத்திருக்கிறது.

வருவாய் மதிப்பு
இந்த முறை குறியிடப்பட்ட மதிப்பை ஒரு சரத்தின் வடிவத்தில் மீட்டெடுக்கிறது.

தொடரியல்(டிகோட்யூரி() முறை)

decodeURI ( எக்ஸ் )

இங்கே,' எக்ஸ் ” என்பது குறியிடப்பட்ட URI ஐ குறியிடப்பட வேண்டும்.

வருவாய் மதிப்பு
இது டிகோட் செய்யப்பட்ட URI ஐ சரமாக வழங்குகிறது.

எடுத்துக்காட்டு 1: ஜாவாஸ்கிரிப்டில் UTF-8 ஐ குறியாக்குதல்
இந்த ஆர்ப்பாட்டமானது, குறியிடப்பட்ட UTF-8 மதிப்புக்கு அனுப்பப்பட்ட எழுத்துக்களின் கலவையை குறியாக்குகிறது:

செயல்பாடு encode_utf8 ( எக்ஸ் ) {
திரும்ப தப்பிக்க முடியாது ( என்கோடுயூரி ( எக்ஸ் ) ) ;
}
val விடவும் = 'இங்கே' ;
பணியகம். பதிவு ( 'கொடுக்கப்பட்ட மதிப்பு ->' + மதிப்பு ) ;
encodeVal ஐ விடுங்கள் = encode_utf8 ( மதிப்பு ) ;
பணியகம். பதிவு ( 'குறியீடு செய்யப்பட்ட மதிப்பு ->' + குறியாக்கம் ) ;

இங்கே, குறியாக்கத்திற்காக ஒதுக்கப்பட்ட செயல்பாட்டை வரையறுக்கும் அணுகுமுறைகளை நினைவுபடுத்தவும். இப்போது, ​​UTF-8 குறியிடப்பட்ட சரமாக அனுப்பப்பட்ட எழுத்துகளின் கலவையைக் குறிக்க “encodeURI()” முறையைப் பயன்படுத்தவும். அதன்பிறகு, அதேபோல, மதிப்பிடப்பட வேண்டிய எழுத்துக்களை வரையறுத்து, குறியாக்கத்தைச் செயல்படுத்த வரையறுக்கப்பட்ட மதிப்பை அதன் வாதங்களாகக் கடந்து வரையறுக்கப்பட்ட செயல்பாட்டை செயல்படுத்தவும்.

வெளியீடு

இங்கே, அனுப்பப்பட்ட எழுத்துகளின் கலவை வெற்றிகரமாக குறியாக்கம் செய்யப்பட்டது என்பது தெளிவாகிறது.

எடுத்துக்காட்டு 2: ஜாவாஸ்கிரிப்டில் UTF-8 ஐ டிகோடிங் செய்தல்
கீழே உள்ள குறியீடு விளக்கமானது குறியிடப்பட்ட UTF-8 மதிப்பை டிகோட் செய்கிறது (முந்தைய எடுத்துக்காட்டில்):

செயல்பாடு decode_utf8 ( எக்ஸ் ) {
திரும்ப decodeURI ( தப்பிக்க ( எக்ஸ் ) ) ;
}
val விடவும் = 'çè' ;
பணியகம். பதிவு ( 'கொடுக்கப்பட்ட மதிப்பு ->' + மதிப்பு ) ;
டிகோட் செய்யலாம் = decode_utf8 ( மதிப்பு ) ;
பணியகம். பதிவு ( 'டிகோட் செய்யப்பட்ட மதிப்பு ->' + டிகோட் ) ;

இந்த குறியீட்டின் படி, செயல்பாட்டை அறிவிக்கவும் ' decode_utf8() ' என்று குறிப்பிடப்பட்ட அளவுருவை உள்ளடக்கியது, இது 'ஐப் பயன்படுத்தி டிகோட் செய்யப்பட வேண்டிய எழுத்துகளின் கலவையைக் குறிக்கிறது decodeURI() ”முறை. இப்போது, ​​டிகோடிங் செய்ய வேண்டிய மதிப்பைக் குறிப்பிடவும் மற்றும் டிகோடிங்கைப் பயன்படுத்துவதற்கு வரையறுக்கப்பட்ட செயல்பாட்டை செயல்படுத்தவும் UTF-8 'பிரதிநிதித்துவம்.

வெளியீடு

முன்னர் குறியிடப்பட்ட மதிப்பு அதற்கேற்ப தீர்மானிக்கப்பட்டது என்பதை இந்த முடிவு குறிக்கிறது.

அணுகுமுறை 3: வழக்கமான வெளிப்பாடுகளைப் பயன்படுத்தி ஜாவாஸ்கிரிப்டில் UTF-8 ஐ குறியாக்கம்/டிகோட் செய்தல்

மல்டி-பைட் யூனிகோட் சரம் UTF-8 மல்டிபிள் சிங்கிள்-பைட் எழுத்துகளுக்கு குறியாக்கம் செய்யப்படும் வகையில் இந்த அணுகுமுறை குறியாக்கத்தைப் பயன்படுத்துகிறது. அதேபோல், குறியாக்கம் செய்யப்பட்ட சரம் மல்டி-பைட் யூனிகோட் எழுத்துகளுக்கு மீண்டும் டிகோட் செய்யப்படும் வகையில் டிகோடிங் மேற்கொள்ளப்படுகிறது.

எடுத்துக்காட்டு 1: ஜாவாஸ்கிரிப்டில் UTF-8 ஐ குறியாக்குதல்
கீழே உள்ள குறியீடு பல-பைட் யூனிகோட் சரத்தை UTF-8 ஒற்றை-பைட் எழுத்துகளுக்கு குறியாக்குகிறது:

செயல்பாடு குறியாக்கம்UTF8 ( மதிப்பு ) {
என்றால் ( வகை மதிப்பு != 'லேசான கயிறு' ) வீசு புதிய தட்டச்சுப் பிழை ( 'அளவுரு' மதிப்பு 'ஒரு சரம் அல்ல' ) ;
நிலையான string_utf8 = மதிப்பு பதிலாக (
/[\u0080-\u07ff]/g , // U+0080 - U+07FF => 2 பைட்டுகள் 110yyyyyy, 10zzzzzz
செயல்பாடு ( எக்ஸ் ) {
இருந்தது வெளியே = எக்ஸ். charCodeAt ( 0 ) ;
திரும்ப லேசான கயிறு . சார்கோடில் இருந்து ( 0xc0 | வெளியே >> 6 , 0x80 | வெளியே & 0x3f ) ; }
) . பதிலாக (
/[\u0800-\uffff]/g , // U+0800 - U+FFFF => 3 பைட்டுகள் 1110xxxx, 10yyyyyy, 10zzzzzz
செயல்பாடு ( எக்ஸ் ) {
இருந்தது வெளியே = எக்ஸ். charCodeAt ( 0 ) ;
திரும்ப லேசான கயிறு . சார்கோடில் இருந்து ( 0xe0 | வெளியே >> 12 , 0x80 | வெளியே >> 6 & 0x3F , 0x80 | வெளியே & 0x3f ) ; }
) ;
பணியகம். பதிவு ( 'வழக்கமான வெளிப்பாட்டைப் பயன்படுத்தி குறியாக்கப்பட்ட மதிப்பு -> ' + string_utf8 ) ;
}
குறியாக்கம்UTF8 ( 'இங்கே' )

குறியீட்டின் இந்த துணுக்கில்:

  • செயல்பாட்டை வரையறுக்கவும் ' encodeUTF8() 'என்று குறியிடப்பட வேண்டிய மதிப்பைக் குறிக்கும் அளவுருவை உள்ளடக்கியது' UTF-8 ”.
  • அதன் வரையறையில், 'ஐப் பயன்படுத்தி சரம் அல்லாத அனுப்பப்பட்ட மதிப்பின் மீது ஒரு சரிபார்ப்பைப் பயன்படுத்தவும். வகை 'ஆபரேட்டர் மற்றும் குறிப்பிட்ட தனிப்பயன் விதிவிலக்கை திரும்ப' வீசு ” முக்கிய வார்த்தை.
  • அதன் பிறகு, விண்ணப்பிக்கவும் ' charCodeAt() 'மற்றும்' சார்கோடில் இருந்து() ”சரத்தில் உள்ள முதல் எழுத்தின் யூனிகோடை மீட்டெடுக்கும் முறைகள் மற்றும் கொடுக்கப்பட்ட யூனிகோட் மதிப்பை முறையே எழுத்துகளாக மாற்றும் முறைகள்.
  • இறுதியாக, இந்த மதிப்பை குறியீடாக்க, கொடுக்கப்பட்ட எழுத்துக்களின் வரிசையை அனுப்புவதன் மூலம் வரையறுக்கப்பட்ட செயல்பாட்டை செயல்படுத்தவும். UTF-8 'பிரதிநிதித்துவம்.

வெளியீடு

இந்த வெளியீடு குறியாக்கம் சரியான முறையில் மேற்கொள்ளப்படுகிறது என்பதைக் குறிக்கிறது.

எடுத்துக்காட்டு 2: ஜாவாஸ்கிரிப்டில் UTF-8 ஐ டிகோடிங் செய்தல்
இந்த ஆர்ப்பாட்டத்தில், எழுத்துகளின் வரிசை '' UTF-8 'பிரதிநிதித்துவம்:

செயல்பாடு டிகோட்யுடிஎஃப்8 ( மதிப்பு ) {
என்றால் ( வகை மதிப்பு != 'லேசான கயிறு' ) வீசு புதிய தட்டச்சுப் பிழை ( 'அளவுரு' மதிப்பு 'ஒரு சரம் அல்ல' ) ;
நிலையான str = மதிப்பு பதிலாக (
/[\u00e0-\u00ef][\u0080-\u00f][\u0080-\u00f]/g ,
செயல்பாடு ( எக்ஸ் ) {
இருந்தது வெளியே = ( ( எக்ஸ். charCodeAt ( 0 ) & 0x0f ) << 12 ) | ( ( எக்ஸ். charCodeAt ( 1 ) & 0x3f ) << 6 ) | ( எக்ஸ். charCodeAt ( 2 ) & 0x3f ) ;
திரும்ப லேசான கயிறு . சார்கோடில் இருந்து ( வெளியே ) ; }
) . பதிலாக (
/[\u00c0-\u00df][\u0080-\u00f]/g ,
செயல்பாடு ( எக்ஸ் ) {
இருந்தது வெளியே = ( எக்ஸ். charCodeAt ( 0 ) & 0x1f ) < '+str);
}
decodeUTF8('à çè')

இந்த குறியீட்டில்:

  • இதேபோல், செயல்பாட்டை வரையறுக்கவும் ' decodeUTF8() 'கடந்த மதிப்பைக் குறிக்கும் அளவுருவை டிகோட் செய்ய வேண்டும்.
  • செயல்பாட்டு வரையறையில், '' வழியாக அனுப்பப்பட்ட மதிப்பின் சரம் நிலையை சரிபார்க்கவும் வகை 'ஆபரேட்டர்.
  • இப்போது, ​​விண்ணப்பிக்கவும் ' charCodeAt() ” முறையே முதல், இரண்டாவது மற்றும் மூன்றாவது சரம் எழுத்துகளின் யூனிகோடை மீட்டெடுக்கும் முறை.
  • மேலும், விண்ணப்பிக்கவும் ' String.fromCharCode() ” யுனிகோட் மதிப்புகளை எழுத்துகளாக மாற்றும் முறை.
  • அதேபோல், முதல் மற்றும் இரண்டாவது சரம் எழுத்துகளின் யூனிகோடைப் பெறவும், இந்த யூனிகோட் மதிப்புகளை எழுத்துகளாக மாற்றவும் இந்த நடைமுறையை மீண்டும் செய்யவும்.
  • கடைசியாக, UTF-8 டிகோட் செய்யப்பட்ட மதிப்பை வழங்க, வரையறுக்கப்பட்ட செயல்பாட்டை அணுகவும்.

வெளியீடு

இங்கே, டிகோடிங் சரியாகச் செய்யப்பட்டுள்ளதா என்பதைச் சரிபார்க்கலாம்.

முடிவுரை

UTF-8 பிரதிநிதித்துவத்தில் என்கோடிங்/டிகோடிங் ' enodeURICகூறு()” மற்றும் ' decodeURICகூறு() முறைகள், ' encodeURI() 'மற்றும்' decodeURI() ” முறைகள் அல்லது வழக்கமான வெளிப்பாடுகளைப் பயன்படுத்துதல்.