லினக்ஸில் iconv கட்டளை

Linaksil Iconv Kattalai



இந்தக் கட்டுரையைச் செயல்படுத்துவதற்கு முன் உங்கள் லினக்ஸ் இயந்திரத்தைப் புதுப்பிப்பதை உறுதிசெய்யவும். புதுப்பிப்புக்கு, லினக்ஸின் 'apt' பயன்பாட்டை 'புதுப்பிப்பு' முக்கிய வார்த்தையுடன் பயன்படுத்தவும் மற்றும் 'sudo' சலுகைகளைப் பயன்படுத்தி இந்த வழிமுறையை இயக்கவும். இப்போது செயல்படுத்துவதற்குச் செல்லலாம் என்றாலும், இந்த அமைப்பையும் மேம்படுத்த விரும்புகிறோம், அதாவது, மேம்படுத்தல் பிழைகள் ஏற்படுவதற்கான வாய்ப்பைக் குறைக்கும், மேலும் கணினி சிக்கலை மிகவும் துல்லியமாக தீர்க்க முடியும். எனவே, 'மேம்படுத்தல்' அறிவுறுத்தலுக்குள் 'apt' பயன்பாட்டைப் பயன்படுத்தவும்.

இப்போது லினக்ஸின் டெர்மினல் கன்சோலில் உள்ள ஐகான்வ் பயன்பாட்டைப் பார்ப்போம். எனவே, எங்கள் டெர்மினல் திரையில் அறியப்பட்ட மற்றும் அதிகம் பயன்படுத்தப்படும் குறியீட்டு எழுத்துத் தொகுப்புகளைக் காண்பிக்க, '-l' கொடியுடன் 'iconv' என்ற வழிமுறையை செயல்படுத்தி வருகிறோம். இது குறியிடப்பட்ட எழுத்துத் தொகுப்புகளை அவற்றின் மாற்றுப்பெயர்களுடன் காண்பிக்கும். சிறிது கீழே ஸ்க்ரோல் செய்த பிறகு குறியீட்டு எழுத்துத் தொகுப்புகளின் நீண்ட பட்டியலைக் காணலாம்.







இப்போது, ​​லினக்ஸில் iconv கட்டளையை செயல்படுத்தத் தொடங்குவதற்கான நேரம் இது. முதலில், ஒரு வகை கோப்பை மற்றொரு வகைக்கு மாற்ற நமது கணினியில் பல்வேறு வகையான கோப்புகள் தேவை. எனவே, ஜாவா வகை, சி வகை மற்றும் உரை வகை ஆகிய மூன்று வெவ்வேறு கோப்புகளை உருவாக்க கன்சோல் முனையத்தில் 'டச்' வினவலைப் பயன்படுத்துகிறோம். தற்போதைய அடைவு உள்ளடக்கங்களை பட்டியலிட்டால், அதில் புதிதாக உருவாக்கப்பட்ட கோப்புகளைக் காண்பீர்கள்.



இதற்குப் பிறகு, ஒவ்வொரு கோப்பின் பெயருடன் “கோப்பு” வினவலைப் பயன்படுத்தி ஒவ்வொரு கோப்பின் வகையையும் தனித்தனியாகப் பார்ப்போம். ஒவ்வொரு கோப்பிற்கும் தனித்தனியாக அமைக்கப்பட்ட குறியீட்டு எழுத்து வகையைக் காட்ட இந்த வினவலுக்கு “-I” விருப்பம் தேவை. “-I” விருப்பத்தைப் பயன்படுத்த மறந்துவிட்டால், அதற்குப் பதிலாக “—mime” கொடியைப் பயன்படுத்தவும். '-I' மற்றும் '-mime' கொடிகள் இரண்டும் ஒரே மாதிரியாக வேலை செய்கின்றன.



இப்போது, ​​'txt' வகை கோப்பிற்கான 'கோப்பு' வழிமுறையை இயக்கிய பிறகு, 'US-ASCII' எழுத்து வகை குறியாக்கத்தைப் பெற்றோம். ஜாவா மற்றும் சி கோப்புகளுக்கு ஒரே அறிவுறுத்தலைப் பயன்படுத்தும் போது, ​​இரண்டு கோப்புகளிலும் 'பைனரி' எழுத்து வகை குறியாக்கம் இருப்பதைக் காட்டுகிறது. அதனுடன், இந்த மூன்று கோப்புகளும் காலியாக இருப்பதை இந்த அறிவுறுத்தல் காட்டுகிறது.





இப்போது, ​​ஒரு குறிப்பிட்ட எழுத்துத் தொகுப்பு குறியீட்டு கோப்பை மற்றொரு எழுத்துத் தொகுப்பு குறியாக்கத்திற்கு மாற்ற, கன்சோலில் ஐகான்வி அறிவுறுத்தலைப் பயன்படுத்துவதை விளக்குவோம். அதற்கு முன், நமது கோப்புகளில் சில குறியீடு அல்லது தரவைச் சேர்க்க வேண்டும். எனவே, 'text.java' கோப்பில் ஜாவா குறியீட்டையும், 'text.c' கோப்பில் C குறியீட்டையும், 'test.txt' கோப்பில் உரைத் தரவையும் சேர்த்துள்ளோம். கீழே கொடுக்கப்பட்டுள்ளபடி, மூன்று கோப்புகளின் உள்ளடக்கங்களைக் காட்ட பூனை வினவல் இங்கே பயன்படுத்தப்பட்டது:



இப்போது நாங்கள் தரவுகளை வெற்றிகரமாகச் சேர்த்துள்ளோம், இந்த கோப்புகளின் எழுத்துக்குறி குறியாக்கத்தை மீண்டும் ஒருமுறை பார்ப்போம். எனவே, '-I' கொடி மற்றும் கோப்பு பெயர்கள், அதாவது test.txt, test.java மற்றும் test.c ஆகியவற்றுடன் ஷெல்லில் உள்ள அதே கோப்பு வழிமுறைகளை நாங்கள் முயற்சித்தோம். மூன்று கோப்புகளுக்கும் தனித்தனியாக இந்த மூன்று வழிமுறைகளை இயக்குவது, ஜாவா மற்றும் சி கோப்புகளுக்கான எழுத்துக்குறி தொகுப்பு குறியாக்கம் புதுப்பிக்கப்பட்டதைக் காட்டுகிறது, அதே நேரத்தில் உரைக் கோப்பிற்கு, அதாவது US-ASCII. ஜாவா மற்றும் சி கோப்புகளின் குறியாக்கம் முன்பு 'பைனரி' ஆகும்; இப்போது, ​​அது 'US-ASCII'. மேலும், உரைக் கோப்பில் எளிய உரைத் தரவு உள்ளது, மற்ற இரண்டு குறியீடு கோப்புகள் உள்ளடக்கமாக ஸ்கிரிப்ட்களைக் கொண்டிருக்கும்.

இந்தக் கட்டுரைக்குத் தேவையான உண்மையான பணியைச் செய்ய வேண்டிய நேரம் இது, அதாவது ஷெல்லில் உள்ள iconv கட்டளையைப் பயன்படுத்தி ஒரு குறியாக்கத்தை மற்றொன்றுக்கு மாற்றவும். எனவே, 'sudo' சலுகைகளுடன் ஷெல் முனையத்தில் 'iconv' வழிமுறைகளைப் பயன்படுத்துகிறோம். இந்த கட்டளையானது '-f' விருப்பத்தை 'from' குறிக்கிறது, மற்றும் '-t' விருப்பம் 'to' ஐ குறிக்கிறது, அதாவது, ஒரு குறியாக்கத்திலிருந்து மற்றொன்றுக்கு.

'-f' விருப்பத்திற்குப் பிறகு, உங்கள் கோப்பில் ஏற்கனவே உள்ள குறியாக்கத்தை நீங்கள் குறிப்பிட வேண்டும், அதாவது US-ASCII. “-t” விருப்பத்திற்குப் பிறகு, நீங்கள் பழைய குறியாக்கத்துடன் மாற்ற விரும்பும் குறியாக்கத்தைக் குறிப்பிட வேண்டும், அதாவது UNICODE. ஆதாரமாகப் பயன்படுத்தப்படும் கோப்பின் பெயரை அதன் பொருள் படத்தை உருவாக்க –o விருப்பத்துடன் குறிப்பிட வேண்டும். ஆப்ஜெக்ட் படம் மற்றொரு கோப்பாக இருக்கும், அதாவது, 'new.c', அதே வகையான ஆனால் புதிய குறியாக்கம் மற்றும் அதே தரவு.

பின்வரும் அறிவுறுத்தலைச் செயல்படுத்திய பிறகு, அதே கோப்பகத்தில் ஒரு புதிய கோப்பைப் பெறுவீர்கள், அதாவது, 'ls' வினவலின் படி. இப்போது, ​​iconv அறிவுறுத்தலைப் பயன்படுத்தி உருவாக்கப்பட்ட புதிய கோப்பின் எழுத்துக்குறி தொகுப்பு குறியாக்கத்தை நாங்கள் சரிபார்க்கிறோம். '-I' விருப்பத்துடன் 'கோப்பு' வழிமுறையை மீண்டும் பயன்படுத்துவோம் மற்றும் புதிய கோப்பு பெயர், அதாவது new.c.

இந்தப் புதிய கோப்பிற்கான எழுத்துத் தொகுப்பு பழைய கோப்பின் எழுத்துத் தொகுப்பிலிருந்து வேறுபட்டிருப்பதைக் காண்பீர்கள், அதாவது UTF-16LE எழுத்துத் தொகுப்பிலிருந்து. ஏனென்றால், நாங்கள் எங்கள் new.c கோப்பிற்கான iconv வழிமுறையைப் பயன்படுத்தி US-ASCII குறியாக்கத்தை UNICODE குறியாக்கத்திற்கு மொழிபெயர்த்துள்ளோம். 'பூனை' வினவல் கோப்பில் அதே C குறியீட்டைக் காட்டுகிறது, ஆனால் ஏற்கனவே வழங்கியது போல் சில யூனிகோட் எழுத்துகளுடன் தொடங்கியது.

அதே வழியில், test.txt உரைக் கோப்பின் குறியாக்கத்தை மாற்றுவோம். கோப்பு அறிவுறுத்தல் இது US-ASCII எழுத்துக்குறி தொகுப்பு குறியாக்கத்தைக் கொண்டுள்ளது என்பதைக் காட்டுகிறது. US-ASCII இலிருந்து TURKISH8 க்கு test.txt கோப்பின் குறியாக்கத்தை மாற்ற iconv கட்டளை அதே வடிவமைப்பில் பயன்படுத்தப்பட்டது. இது US-ASCII ஐ துருக்கியாக மாற்றாது என்பதை நீங்கள் காண்பீர்கள்.

இதற்குப் பிறகு, US-ASCII முதல் UTF-32 எழுத்துக்குறி தொகுப்பை ஒரே கோப்பிற்கான குறியாக்கத்தை மறைக்க அதே கட்டளையைப் பயன்படுத்தினோம். இந்த நேரத்தில், அது வேலை செய்கிறது. ஏனென்றால், சில நேரங்களில் ஒரு குறியாக்க தொகுப்பை மற்றொன்றுக்கு மாற்றுவதில் சிக்கல் இருக்கலாம் அல்லது மற்ற குறியாக்கம் அதை ஆதரிக்காமல் போகலாம்.

முடிவுரை

இந்தக் கட்டுரையில், iconv Linux வழிமுறைகளைப் பயன்படுத்தி, ஒரு குறியாக்க எழுத்தை அவற்றின் மாற்றுப்பெயர்களைப் பயன்படுத்தி மற்றொரு குறியீடாக மாற்றுவது பற்றி விவாதிக்கப்பட்டது. இந்த முறையில், நாம் பல்வேறு வகையான கோப்புகளை உருவாக்க வேண்டியிருந்தது.