பாண்டாஸ் தொடர் முதல் CSV வரை

Pantas Totar Mutal Csv Varai



பாண்டாஸில் உள்ள “Series.to_csv()” முறையானது குறிப்பிட்ட தொடர் பொருளை கமாவால் பிரிக்கப்பட்ட மதிப்புகள் (csv) குறிப்பில் வெளியிடுகிறது. இந்தச் செயல்பாடு ஒரு தொடரிலிருந்து மதிப்புகளை எடுத்து, குறியீட்டு மற்றும் நெடுவரிசை மதிப்புகளைப் பிரிப்பதற்கான காற்புள்ளிகளைச் சேர்ப்பதன் மூலம் அவற்றின் வடிவமைப்பை மாற்றியமைக்கிறது.

இந்தச் செயல்பாட்டைப் பயன்படுத்த, பின்வரும் தொடரியல் முறையைப் பயன்படுத்த வேண்டும்:









பைதான் திட்டத்தில் இந்த முறையைப் பயன்படுத்துவதற்கான வழிகளைக் கற்றுக்கொள்வதற்கான இரண்டு வெவ்வேறு நுட்பங்களை இந்தக் கட்டுரை உங்களுக்கு வழங்கும்.



எடுத்துக்காட்டு # 1: Series.to_csv() முறையைப் பயன்படுத்தி, தேதிநேர அட்டவணையுடன் ஒரு தொடரை கமாவால் பிரிக்கப்பட்ட மதிப்புகளாக மாற்றுதல்

ஒரு தொடரை CSV வடிவத்தில் மாற்ற, 'Series.to_csv()' செயல்பாட்டைப் பயன்படுத்துவோம். இந்த விளக்கப்படம் DatetimeIndex உடன் தொடரை உருவாக்கும், பின்னர் அதை கமாவால் பிரிக்கப்பட்ட மதிப்புகள் வடிவமாக மாற்றும்.





இந்த முறையைச் செயல்படுத்த, பைதான் நிரலாக்கத்தை ஆதரிக்கும் கருவி எங்களிடம் இருக்க வேண்டும். குறியீடுகளைத் தொகுக்க “ஸ்பைடர்” கருவி தேர்ந்தெடுக்கப்பட்டது. அதில் ஸ்கிரிப்டை எழுத, முதலில் எங்கள் கணினியில் நிறுவப்பட்ட கருவியைத் தொடங்கினோம். பைதான் நிரலுக்கு தேவையான முடிவை அடைவதற்கான அதன் முறைகளைப் பயன்படுத்த ஒரு நூலகம் தேவை. இங்கு நாங்கள் ஏற்றியிருக்கும் நூலகம் 'பாண்டாக்கள்'. குறியீட்டின் அதே வரிசையில், இந்த நூலகத்தின் மாற்றுப்பெயர் 'pd' என அடையாளம் காணப்பட்டுள்ளது. எனவே, நிரலில் எங்கிருந்தாலும், ஒரு செயல்பாட்டை அணுக 'பாண்டாக்கள்' என்று எழுத வேண்டும். அதற்கு பதிலாக 'pd' என்று எழுதுவோம்.

குறியீட்டுடன் தொடங்குவதற்கான முதல் படி ஒரு பாண்டாஸ் தொடரை உருவாக்குவதாகும். பாண்டாக்களிலிருந்து தொடர் உருவாக்கும் முறையைப் பயன்படுத்துவதற்கு நாம் 'pd' என்று எழுத வேண்டும். 'pd.Series()' செயல்பாடு குறிப்பிட்ட மதிப்புகளுடன் ஒரு தொடரை உருவாக்க அழைக்கப்படுகிறது. தொடருக்கு நாங்கள் வழங்கிய மதிப்புகள் 'இஸ்தான்புல்', 'இஸ்மிர்', 'அங்காரா', 'அங்காரா', 'அன்டல்யா', 'கோன்யா' மற்றும் 'பர்சா' ஆகும். இந்த மதிப்புகளின் வரிசைக்கு நீங்கள் ஒரு பெயரைக் கொடுக்க விரும்பினால், 'பெயர்' அளவுருவைப் பயன்படுத்தி அவ்வாறு செய்யலாம். இங்கே, இந்த மதிப்புகளின் வரிசைக்கு 6 நகரங்களின் பெயர்கள் இருப்பதால் 'நகரங்கள்' என்று பெயரிட்டுள்ளோம். இந்த தொடரை சேமிக்க, ஒரு தொடர் பொருள் 'துருக்கி' உருவாக்கப்பட்டது.



DatetimeIndex ஐ உருவாக்க, “pd.date_range()” முறையைப் பயன்படுத்தியுள்ளோம். இந்தச் செயல்பாட்டின் அடைப்புக்குறிக்குள், நாங்கள் 4 வாதங்களைக் கடந்துவிட்டோம்: “தொடக்கம்”, “அதிர்வெண்”, “காலங்கள்” மற்றும் “tz”.

'தொடக்க' வாதம் அதிலிருந்து தேதி வரம்பை உருவாக்கத் தொடங்குவதற்கு ஒரு தேதி மற்றும் நேரத்தை எடுக்கும். இங்கே, தொடங்கும் தேதி மற்றும் நேரத்தை “2022-03-02 02:30” எனக் குறிப்பிட்டுள்ளோம். 'அதிர்வெண்' அளவுரு தேதி வரம்பிற்கான அதிர்வெண்ணை வகைப்படுத்துகிறது. எனவே, நாங்கள் அதை 'D' மதிப்புடன் வழங்கினோம். இப்போது, ​​தினசரி அதிர்வெண்ணில் தேதி வரம்பை உருவாக்கும். 'காலம்' மதிப்புரு '6' ஆக அமைக்கப்பட்டுள்ளது, அதாவது இது 6 நாட்களுக்கு ஒரு தேதி வரம்பை உருவாக்கும். கடைசி அளவுரு 'tz' ஆகும், இது குறிப்பிட்ட பகுதிக்கான நேர மண்டலத்தைக் குறிப்பிடுகிறது. 'ஆசியா/இஸ்தான்புல்' க்கான நேர மண்டலத்தை நாங்கள் குறிப்பிட்டுள்ளோம்.

இந்த தேதி வரம்பைச் சேமிக்க, 'தேதிநேரம்' மாறியை உருவாக்கியுள்ளோம். DatetimeIndexஐ அமைக்க, 'Series.index' பண்பைப் பயன்படுத்தியுள்ளோம். 'துருக்கி' தொடரின் பெயர் '.index' பண்புடன் வழங்கப்பட்டு, 'தேதிநேரம்' மாறியில் சேமிக்கப்பட்ட தேதி நேர வரம்பிற்கு ஒதுக்கப்பட்டுள்ளது. எனவே, 'குறியீட்டு' சொத்து 'தேதிநேர' மாறியிலிருந்து மதிப்புகளை எடுத்து 'துருக்கி' தொடரின் குறியீட்டு பட்டியலாக மாற்றும். கடைசியாக, வெளியீட்டுத் தொடரைப் பார்க்க, 'அச்சு()' முறையைப் பயன்படுத்தியுள்ளோம், மேலும் அதன் உள்ளடக்கத்தைக் காண்பிக்க 'துருக்கி' தொடரை உள்ளீடாக அனுப்பியுள்ளோம்.

ஸ்கிரிப்டை இயக்குவதற்கு 'Run file' விருப்பத்தை அழுத்தியுள்ளோம். இதன் விளைவாக, “2022-03-02 02:30:00+03:00” இலிருந்து தொடங்கி, “2022-03-07 02:30:00+03:00″ இல் முடிவடையும் தேதி நேர அட்டவணையுடன் கூடிய தொடரை நாம் பார்க்கலாம். 6 நாட்கள். தொடரின் கீழே “Freq :D”, வரிசைப் பட்டியலின் பெயர் “நகரங்கள்” மற்றும் dtype “object” ஆகியவை குறிப்பிடப்பட்டுள்ளன.

இப்போது, ​​மேலே உள்ள ஸ்னாப்ஷாட்டில் நாம் பார்த்த இந்தத் தொடரை CSV வடிவத்திற்கு மாற்ற கற்றுக்கொள்வோம். தொடரை காற்புள்ளியால் பிரிக்கப்பட்ட மதிப்புகளுக்கு மாற்ற, எங்களிடம் ஒரு முறை உள்ளது பாண்டாஸ் தொகுதி “Series.to_csv()”. இந்த முறை வழங்கப்பட்ட தொடரின் மதிப்புகளை எடுத்து, நெடுவரிசையின் மதிப்புகளுக்கு இடையே காற்புள்ளிகளைச் சேர்க்கிறது.

“Series.to_csv()” செயல்பாடு அழைக்கப்படுகிறது. நாம் மாற்ற விரும்பும் தொடரின் பெயர் “Turkey.to_csv()” என முறையுடன் குறிப்பிடப்பட்டுள்ளது. காற்புள்ளியால் பிரிக்கப்பட்ட மதிப்புகளைப் பாதுகாக்க, 'Comma_Separated' என்ற மாறியை உருவாக்கி, அதன் உள்ளடக்கத்தை வெளியீட்டுச் சாளரத்தில் 'print()' செயல்பாட்டைத் தொடங்குகிறோம்.

csv வடிவத்தில் எங்கள் தொடர் இதோ. குறியீட்டு மற்றும் தொடர் மதிப்புகள் அவற்றில் உள்ள காற்புள்ளிகளைப் பயன்படுத்தி பிரிக்கப்பட்டிருப்பதை ஸ்னாப்ஷாட்டில் காணலாம்.

எடுத்துக்காட்டு # 2: NaN மதிப்புகள் கொண்ட தொடரை கமாவால் பிரிக்கப்பட்ட மதிப்புகளாக மாற்ற Series.to_csv() முறையைப் பயன்படுத்துதல்

'Series.to_csv()' முறையைப் பயன்படுத்துவதற்கான இரண்டாவது நுட்பம், சில பூஜ்ய உள்ளீடுகளை வைத்திருக்கும் தொடரை CSV வடிவத்திற்கு மாற்ற இந்த முறையைப் பயன்படுத்துவதாகும்.

முதலில் தேவையான தொகுப்புகளை இறக்குமதி செய்துள்ளோம். 'pd' என்பது பாண்டாக்களுக்கு மாற்றுப்பெயராகவும், 'np' என்பது நம்பிக்கு மாற்றுப்பெயராகவும் உருவாக்கப்பட்டுள்ளது. நம்பி டூல்கிட் இங்கே ஏற்றப்பட்டுள்ளது, ஏனென்றால் பாண்டாஸ் “pd.Series()” முறையைப் பயன்படுத்தி உருவாக்கும் போது “np.NaN” ஐப் பயன்படுத்தி எங்கள் தொடரில் சில பூஜ்ய உள்ளீடுகளைச் செய்வோம்.

'pd.Series()' செயல்பாடு பின்வரும் மதிப்புகளுடன் ஒரு பாண்டாஸ் தொடரை உருவாக்க பயன்படுத்தப்படுகிறது: 'Nile', 'Amazon', np.NaN, 'Ganges', 'Mississippi', 'np.NaN', 'Yangtze', 'டானுப்', 'மெகாங்', 'np.NaN' மற்றும் 'வோல்கா'. தொடருக்கு மொத்தம் 21 மதிப்புகள் வரையறுக்கப்பட்டுள்ளன, அவற்றில் 3 உள்ளீடுகள் “np.NaN” மதிப்புகளைக் கொண்டுள்ளன, அதாவது தொடரில் 3 மதிப்புகள் இல்லை. 'பெயர்' பண்பு, நாங்கள் வழங்கிய 'தலைப்புகள்' மதிப்புகளின் இந்த வரிசையின் பெயரைக் குறிப்பிடுகிறது. இயல்புநிலை பட்டியலுக்குப் பதிலாக பயனர் வரையறுக்கப்பட்ட குறியீட்டு பட்டியலை அமைக்க 'இண்டெக்ஸ்' பண்பு பயன்படுத்தப்படுகிறது.

இங்கே, '10', '11', '12', '13', '14', '16', '17', '18', '19', '20', மதிப்புகள் கொண்ட குறியீட்டு பட்டியலை நாங்கள் விரும்புகிறோம். மற்றும் 21'. இப்போது, ​​எங்கள் தொடரில் '0' க்குப் பதிலாக '10' இலிருந்து தொடங்கும் குறியீட்டு பட்டியல் இருக்கும். இப்போது, ​​இந்தத் தொடரைச் சேமித்து வைக்கவும், இதன் மூலம் நாம் அதை நிரலில் பின்னர் பயன்படுத்தலாம். 'நதிகள்' என்ற தொடர் பொருளை நாங்கள் துவக்கியுள்ளோம், மேலும் 'pd.Series()' முறையை அழைப்பதன் மூலம் உருவாக்கப்பட்ட வெளியீட்டுத் தொடரை ஒதுக்கியுள்ளோம். பைதான் மூலம் “print()” செயல்பாட்டைப் பயன்படுத்தி அதை காட்சிக்கு வைப்பதன் மூலம் தொடரைக் காணலாம்.

டெர்மினலில் ரெண்டர் செய்யப்பட்ட வெளியீடு 10 இல் தொடங்கி 21 இல் முடிவடையும் குறியீட்டுப் பட்டியல் ஒரு தொடரை அச்சிட்டுள்ளது, அதாவது தொடர் 21 மதிப்புகளைக் கொண்டுள்ளது.

தொடர் 'Series.to_csv()' முறையுடன் CSV வடிவமாக மாற்றப்படும்.

எங்கள் தொடரான ​​“துருக்கி” மூலம் “Series.to_csv()” முறையைப் பயன்படுத்தியுள்ளோம். எனவே, இந்த முறையானது 'துருக்கி' தொடரிலிருந்து மதிப்புகளை எடுத்து அவற்றை கமாவால் பிரிக்கப்பட்ட மதிப்புகள் வடிவத்திற்கு மாற்றும். முடிவு “Converted_csv” மாறியில் சேமிக்கப்படுகிறது. இறுதியில், மாற்றப்பட்ட தொடர் 'அச்சு()' செயல்பாட்டின் உதவியுடன் அச்சிடப்படுகிறது.

கீழே உள்ள முடிவின் ஸ்னாப்ஷாட்டில், தொடரின் மதிப்புகள் குறியீட்டு பட்டியலிலிருந்து பிரிக்க காற்புள்ளியைப் பயன்படுத்தும் விதத்தில் இப்போது மாற்றப்பட்டிருப்பதைக் காணலாம். மேலும், மதிப்புகள் இல்லாத இடங்களில், குறியீட்டு எண் மட்டுமே கமாவால் அச்சிடப்படும்.

முடிவுரை

ஒரு பாண்டா தொடரை CSV வடிவத்திற்கு மாற்றுவது ஒரு நடைமுறை அணுகுமுறையாகும். பாண்டாக்கள் “Series.to_csv()” செயல்பாட்டைப் பயன்படுத்தி இதை அடையலாம். இந்த வழிகாட்டி இந்த முறையைப் பயன்படுத்த இரண்டு நுட்பங்களை நடைமுறைக்குக் கொண்டு வந்தது. முதல் விளக்கப்படத்தில், DatetimeIndex கொண்ட தொடரை கமாவால் பிரிக்கப்பட்ட மதிப்புகள் வடிவத்திற்கு மாற்ற இந்த முறையைப் பயன்படுத்தியுள்ளோம். 2வது நிகழ்வானது, 'Series.to_csv()'   செயல்பாட்டைப் பயன்படுத்தி, சில விடுபட்ட உள்ளீடுகளைக் கொண்ட தொடரை CSV வடிவத்தில் மாற்றியமைத்தது. விண்டோஸ் இயக்க முறைமையில் 'ஸ்பைடர்' கருவியைப் பயன்படுத்தி இரண்டு நுட்பங்களும் நடைமுறையில் செயல்படுத்தப்பட்டுள்ளன.