பைத்தானில் ஊறுகாய் அகராதி

Paittanil Urukay Akarati



Python entity frameworks ஐ முன்-செயலாக்க ஊறுகாயைப் பயன்படுத்தலாம், இது நினைவகத்திலிருந்து ஒரு பொருளை பைட் ஸ்ட்ரீமாக மாற்றும் செயல்முறையாகும், இது வட்டில் பைனரி வடிவமாக சேமிக்கப்படும். இந்த செயல்முறை வரிசைப்படுத்தல் என்று அழைக்கப்படுகிறது. இதைச் செய்ய, ஊறுகாய் டம்ப் () முறையைப் பயன்படுத்தவும். இந்த பைனரி பதிவை மீண்டும் பைதான் நிரலில் ஏற்றும்போது, ​​அது வரிசை நீக்கப்பட்டு மீண்டும் பைதான் பொருளாக மாற்றப்படும்.

பைத்தானின் ஊறுகாய் தொகுதியைப் பயன்படுத்தி, தரவை, குறிப்பாக அகராதியை எவ்வாறு சேமிப்பது என்பதை இந்தக் கட்டுரை உங்களுக்குக் கற்பிக்கிறது. தொடங்குவதற்கு, நாம் ஊறுகாய் தொகுதியை வாங்க வேண்டும். Pickle dump() மூன்று அளவுருக்களை ஏற்றுக்கொள்கிறது. முதல் உள்ளீடு சேமிக்க வேண்டிய தரவைக் குறிப்பிடுகிறது. இரண்டாவது அளவுரு என்பது ஒரு கோப்பு எழுதும்-பைனரி (wb) பயன்முறையில் திறக்கப்படும் போது திரும்பப் பெறும் கோப்புப் பொருளாகும். முக்கிய மதிப்பு வாதம் மூன்றாவது அளவுரு ஆகும். இந்த அளவுருவால் நெறிமுறை வரையறுக்கப்படுகிறது. ஊறுகாய் இரண்டு வகைகளாக வகைப்படுத்தப்பட்டுள்ளது: மிக உயர்ந்த நெறிமுறை மற்றும் ஊறுகாய் இயல்புநிலை நெறிமுறை. தரவை மீட்டெடுக்க அல்லது சீரழிக்க, ஊறுகாய் சுமை () முறை பயன்படுத்தப்படுகிறது, இதன் மூலம் ஒரு கோப்பை ரீட்-பைனரி (ஆர்பி) பயன்முறையில் திறப்பதன் மூலம் ஒரு கோப்பு பொருள் பெறப்படுகிறது.







எடுத்துக்காட்டு 1: ஊறுகாய் டம்ப் மற்றும் லோட் செயல்பாட்டைப் பயன்படுத்தி ஒரு ஊறுகாய் கோப்பில் தரவை வரிசைப்படுத்துதல் மற்றும் சீரமைத்தல்

இந்த எடுத்துக்காட்டில், மிக எளிமையான குறியீட்டைக் கொண்ட ஒரு அகராதியாகத் தரவை எவ்வாறு வரிசைப்படுத்துவது மற்றும் சீரியலாக்குவது என்பதைக் கற்றுக்கொள்வோம்.




முந்தைய விளக்கப்படத்தில் வழங்கப்பட்ட குறியீட்டில், பைதான் நூலகத்திலிருந்து முதல் ஊறுகாய் தொகுதி இறக்குமதி செய்யப்படுகிறது, அதன் முறைகள் பயன்படுத்தப்படலாம். பின்னர், 2 விசைகள் மற்றும் மதிப்புகள் கொண்ட தரவுகளின் அகராதி துவக்கப்பட்டு 'வடிவம்' என்ற மாறியில் சேமிக்கப்படுகிறது. அடுத்த வரியில், ரைட்-பைனரி (wb) பயன்முறையில் 'info.p' என்ற பெயரில் ஒரு புதிய கோப்பை திறக்க, Pickle dump() முறை பயன்படுத்தப்படுகிறது மற்றும் 'shape' தரவு இந்த கோப்பில் சேமிக்கப்படுகிறது. அடுத்த வரியில், நாம் Rb பயன்முறையில் தரவுகளை டம்ப் செய்த அதே கோப்பில் ஊறுகாய் சுமை() முறை பயன்படுத்தப்படுகிறது. இது எங்கள் அகராதி தரவை வழங்குகிறது மற்றும் 'a' என்ற மாறியில் சேமிக்கப்படும். இறுதியாக, பின்வரும் ஸ்கிரீன்ஷாட்டில் காட்டப்பட்டுள்ளபடி அச்சு கட்டளையைப் பயன்படுத்தி இந்த திரும்பிய பொருள் வெளியீட்டு முனையத்தில் காட்டப்படும்.



டம்ப் முறையைப் பயன்படுத்தி தரவு முதலில் “info.p” கோப்பில் சேமிக்கப்பட்டதைக் காணலாம். பின்னர், அதே கோப்பில் load() முறையைப் பயன்படுத்தியபோது, ​​எங்கள் தரவை நாங்கள் திரும்பப் பெற்றோம்.





எடுத்துக்காட்டு 2: பைத்தானில் தரவை வரிசைப்படுத்துவதற்கு கூடுதல் நெறிமுறையுடன் ஊறுகாய் டம்ப் செயல்பாட்டைப் பயன்படுத்துதல்

சமீபத்திய நெறிமுறையான ஊறுகாயின் “HIGHEST_PROTOCOL” என்ற கூடுதல் நெறிமுறையைப் பயன்படுத்துவதற்கு இது போன்ற ஒரு எடுத்துக்காட்டு. இந்த நெறிமுறை புதிய மொழி அம்சங்களை அனுமதிக்கிறது.




முந்தைய விளக்கப்படத்தில் வழங்கப்பட்ட குறியீட்டில், முதல் ஊறுகாய் தொகுதி இறக்குமதி செய்யப்பட்டது. பின்னர், ஒரு விசை மற்றும் மதிப்பு கொண்ட ஒரு பொருளின் அகராதி துவக்கப்பட்டு 'a' மாறியில் சேமிக்கப்படும். அடுத்த வரியில், 'info.p' என்ற புதிய கோப்பு ஒரு கைப்பிடியாக wb பயன்முறையில் திறக்கப்பட்டது. இப்போது, ​​கோப்பு 'கைப்பிடி' என்ற பொருளில் உள்ளது. பின்னர், 'HIGHEST_PROTOCOL' ஐப் பயன்படுத்தி 'a' அகராதியுடன் ''கையாளுவதற்கு' dump() செயல்பாடு பயன்படுத்தப்படுகிறது. இது “a” இல் உள்ள அகராதியை கணினியின் வட்டில் உள்ள “info.p” கோப்பில் சேமிக்க அனுமதிக்கிறது. கோப்பிலிருந்து தகவலைப் பிரித்தெடுக்க, கோப்பு முதலில் “rb” பயன்முறையில் திறக்கப்படும். பின்னர், இந்த கோப்பிற்கு ஊறுகாய் சுமை() முறை பயன்படுத்தப்படுகிறது. திரும்பிய தரவு 'b' பண்புக்கூறில் சேமிக்கப்படும். இறுதியாக, அச்சு கட்டளையைப் பயன்படுத்தி, இந்தத் தகவல் பின்வரும் திரைப் பிடிப்பில் காணப்படுவது போல் வெளியீட்டு முனையில் காட்டப்படும்:

எடுத்துக்காட்டு 3: ஊறுகாய் டம்ப் மற்றும் லோட் செயல்பாட்டைப் பயன்படுத்தி ஒரு ஊறுகாய் கோப்பில் உள்ள தரவுகளின் பட்டியலை வரிசைப்படுத்துதல் மற்றும் சீரமைத்தல்

இந்த எடுத்துக்காட்டில், ஊறுகாய் தொகுதி முதலில் இறக்குமதி செய்யப்படுகிறது. பின்னர், சில தரவு ஒரு பட்டியல் வடிவத்தில் அகராதியில் செருகப்பட்டு, 'shape_colors' மாறியில் சேமிக்கப்படும். அடுத்த வரியில், இந்தத் தரவுகளுடன் ஊறுகாய் டம்ப்() முறை நேரடியாகப் பயன்படுத்தப்படுகிறது. அதன் அளவுருவில் உள்ள கோப்பின் இடத்தில், 'info.p' கோப்பு wb பயன்முறையில் திறக்கப்பட்டது. இதன் விளைவாக, கணினியின் வட்டில் சேமிக்கப்பட்டுள்ள இந்த கோப்பில் அகராதி தரவு இப்போது கொட்டப்படுகிறது. பின்னர், கோப்பிலிருந்து தரவைப் படிக்க, அதே கோப்பில் ஊறுகாய் சுமை() முறை பயன்படுத்தப்படுகிறது. திரும்பிய தரவு 'a' மாறியில் சேமிக்கப்படும். இறுதியாக, அச்சு கட்டளையைப் பயன்படுத்தி, இந்தத் தகவல் பின்வரும் ஸ்னாப்ஷாட்டில் காட்டப்பட்டுள்ளபடி, இரண்டாம் நிலை முனையங்களில் காட்டப்படும்:



எடுத்துக்காட்டு 4: பல்வேறு அளவுருக்கள் கொண்ட ஊறுகாய் டம்ப் மற்றும் லோட் செயல்பாடுகளைப் பயன்படுத்தி ஒரு ஊறுகாய் கோப்பில் தகவல்களைச் சேமிப்பது

வழங்கப்பட்ட குறியீட்டில், முதல் ஊறுகாய் தொகுதி இறக்குமதி செய்யப்படுகிறது. பின்னர், சம்பளங்களின் அகராதி துவக்கப்பட்டு 'சம்பளம்' மாறியில் சேமிக்கப்படும். அடுத்த வரியில், ஒரு புதிய கோப்பு 'salary.p' ஒரு கைப்பிடியாக wb பயன்முறையில் திறக்கப்பட்டது. இப்போது, ​​கோப்பு 'கைப்பிடி' என்ற பொருளில் உள்ளது. பின்னர், 'HIGHEST_PROTOCOL' ஐப் பயன்படுத்தி 'சம்பளம்' அகராதியுடன் 'கையாளுவதற்கு' ஊறுகாய் டம்ப்() செயல்பாடு பயன்படுத்தப்படுகிறது. இது 'சம்பளம்' இல் உள்ள அகராதியை 'salary.p' கோப்பில் கணினியின் வட்டில் சேமிக்க அனுமதிக்கிறது. இப்போது, ​​கோப்பிலிருந்து தரவை மீட்டெடுக்க, கோப்பு முதலில் 'rb' பயன்முறையில் திறக்கப்படுகிறது. பின்னர், இந்த கோப்பிற்கு ஊறுகாய் சுமை() முறை பயன்படுத்தப்படுகிறது. மாற்றியமைக்கப்பட்ட தகவல் 'a' என்ற மாறியில் சேமிக்கப்படுகிறது. இறுதியில், அச்சு கட்டளையைப் பயன்படுத்துவதன் மூலம், இந்தத் தரவு பின்வரும் ஸ்னாப்ஷாட்டில் காட்டப்பட்டுள்ளபடி வெளியீட்டு முடிவில் காட்டப்படும்:



எடுத்துக்காட்டு 5: ஊறுகாய் டம்ப் மற்றும் லோட் செயல்பாட்டைப் பயன்படுத்தி ஒரு ஊறுகாய் கோப்பில் பல பரிமாணங்களில் தரவை வரிசைப்படுத்துதல் மற்றும் சீரமைத்தல்

பைத்தானில் டேட்டாஃப்ரேம்களை (பல பரிமாண அட்டவணைகள்) உருவாக்குவது, பைத்தானின் பைத்தானின் தொகுதியில் காணப்படும் புதிய முறைகள் மற்றும் செயல்பாடுகளைச் சோதிப்பதற்கு எளிது. புதிதாக ஒரு DataFrame ஐ உருவாக்க பல்வேறு முறைகள் உள்ளன, ஆனால் அடிப்படை அகராதியைப் பயன்படுத்துவது எளிமையான ஒன்றாகும்.


முந்தைய விளக்கப்படத்தில் வழங்கப்பட்ட குறியீட்டில், முதல் ஊறுகாய் மற்றும் பாண்டாஸ் தொகுதிகள் இறக்குமதி செய்யப்படுகின்றன. பின்னர், pd.DataFrame() முறையைப் பயன்படுத்தி பல பரிமாண அட்டவணை உருவாக்கப்படுகிறது. மூலோபாயத்தின் அடுத்த பண்பு நான்கு பட்டியல்களின் பட்டியல். ஒவ்வொரு பட்டியல் அட்டவணையின் ஒரு வரிசைக்கு ஒத்திருக்கிறது. இரண்டாவது அளவுரு 'நெடுவரிசைகள்' ஆகும், இது அட்டவணையின் ஒவ்வொரு நெடுவரிசையின் தலைப்பையும் வரையறுக்கிறது. இந்த DataFrame 'pre' இல் சேமிக்கப்படுகிறது. பின்னர், “attendance.p” என்ற புதிய கோப்பு wb பயன்முறையில் திறக்கப்பட்டு, DataFrame உடன் இந்த கோப்பில் ஊறுகாய் டம்ப்() முறை பயன்படுத்தப்படுகிறது. இப்போது, ​​​​எங்கள் குறிப்பிட்ட தரவு கணினியின் ஹார்ட் டிஸ்கில் உள்ள 'attendance.p' கோப்பில் சேமிக்கப்படுகிறது.


கோப்பிலிருந்து தரவை மீட்டெடுக்க, கோப்பைப் படிக்க அனுமதிக்கும் rb பயன்முறையில் கோப்பைத் திறக்கிறோம். பின்னர், ஊறுகாய் சுமை () முறை 'attendance.p' கோப்பில் பயன்படுத்தப்படுகிறது. இறுதியாக, கோப்பில் உள்ள தரவு வெளியீட்டு முனையத்தில் காட்டப்படும். நாம் பார்க்க முடியும் என, முழு DataFrame 'attendance.p' கோப்பில் சேமிக்கப்படும் வெளியீடு முனையத்தில் காட்டப்படும்.

முடிவுரை

ஊறுகாய் கோப்புகளுடன் பணிபுரியும் போது கூடுதல் முன்னெச்சரிக்கை நடவடிக்கைகளை எடுக்கவும். ஊறுகாய் தொகுதிக்கு பாதுகாப்பு இல்லை. நீங்கள் நம்பிக்கையுடன் இருக்கும் தரவை மட்டும் அவிழ்த்து விடுங்கள். அன்பிக்லிங் செயல்பாட்டின் போது தன்னிச்சையான குறியீட்டை இயக்கக்கூடிய தீங்கிழைக்கும் ஊறுகாய் தரவை உருவாக்க முடியும். இருப்பினும், பைத்தானில் அகராதிகள், பட்டியல்கள் மற்றும் அட்டவணைகளை சேமிப்பதில் இது ஒரு சிறந்த முறையாகும். முன் செயலாக்கம் போன்ற தரவுகளில் வழக்கமான செயல்பாடுகளை நீங்கள் செயல்படுத்தும் போது, ​​தரவு பகுப்பாய்வில் ஊறுகாய் குறிப்பாக பயனுள்ளதாக இருக்கும். பைத்தானின் ஊறுகாய் தொகுதியின் வெவ்வேறு முறைகள் மற்றும் அகராதிகளுடன் அதை எவ்வாறு பயன்படுத்துவது என்பதைப் பற்றி அறிய இந்த கட்டுரை உங்களுக்கு உதவியது என்று நம்புகிறேன்.