பாண்டாஸ் சம் நெடுவரிசை

Pantas Cam Netuvaricai



“பைத்தானைப் பயன்படுத்தி பாண்டாஸ் டேட்டாஃப்ரேமில் உள்ள அனைத்து அல்லது குறிப்பிட்ட நெடுவரிசைகளையும் எவ்வாறு தொகுக்க வேண்டும் என்பதை இந்தக் கட்டுரை விளக்குகிறது. DataFrame.sum() செயல்பாடு இந்த டுடோரியலின் பல எடுத்துக்காட்டுகளில் சில பயனுள்ள அளவுருக்களுடன் பயன்படுத்தப்படும்.'

இந்த டுடோரியல் முடிந்ததும், எப்படி செய்வது என்பதை நீங்கள் அறிந்து கொள்ளலாம்:







    • பாண்டாஸில் டேட்டாஃப்ரேம் நெடுவரிசையின் கூட்டுத்தொகையைக் கண்டறியவும்.
    • டேட்டாஃப்ரேம் நெடுவரிசைகளை ஒன்றாகச் சேர்த்தல்
    • குறிப்பிட்ட நிபந்தனையை பூர்த்தி செய்யும் பாண்டாஸ் டேட்டாஃப்ரேமில் நெடுவரிசைகளைச் சேர்க்கவும்.
    • டேட்டாஃப்ரேமின் தரவைத் தொகுத்த பிறகு தொகையைத் தீர்மானிக்கவும்.

டேட்டாஃப்ரேம் நெடுவரிசைகளின் கூட்டுத்தொகையை எவ்வாறு தீர்மானிப்பது?

Pandas இல் உள்ள “dataframe.sum()” செயல்பாடு குறிப்பிட்ட அச்சின் மொத்தத் தொகையை வழங்குகிறது. உள்ளீடு என்பது குறியீட்டின் அச்சாக இருந்தால், செயல்பாடு ஒவ்வொரு நெடுவரிசையின் மதிப்புகளையும் தனித்தனியாகச் சேர்க்கிறது, பின்னர் ஒவ்வொரு நெடுவரிசைக்கும் அதையே செய்கிறது, ஒவ்வொரு நெடுவரிசையிலும் தரவு/மதிப்புகளின் கூட்டுத்தொகையை சேமிக்கும் தொடரை வழங்குகிறது. கூடுதலாக, விடுபட்ட மதிப்புகளைப் புறக்கணிப்பதன் மூலம் டேட்டாஃப்ரேமின் தொகையைக் கணக்கிடுவதை இது ஆதரிக்கிறது.



தொடரியல்: DataFrame.sum(அச்சு = எதுவுமில்லை, ஸ்கிப்னா = எதுவுமில்லை, நிலை = எதுவுமில்லை, எண்கள்_மட்டுமே = எதுவுமில்லை, min_count = 0, **kwargs)



எங்கே,





அச்சு: {நெடுவரிசைகள் (1), அட்டவணை (0)}

ஆர்டர்: முடிவைக் கணக்கிடும்போது NA/null மதிப்புகளைப் புறக்கணிக்கவும்.



நிலை: குறிப்பிடப்பட்ட அச்சு படிநிலையாக இருந்தால் (பல-குறியீடு), தொடராக மாற்றும் முன் குறிப்பிட்ட குறியீட்டு நிலைக்கு எண்ணவும்.

எண்_மட்டும்: ஃப்ளோட், இன்ட் மற்றும் பூலியன் நெடுவரிசைகள் ஏற்கத்தக்கவை. எதுவும் இல்லை என்றால், எல்லாவற்றையும் பயன்படுத்த முயற்சிக்கவும்; இல்லையெனில், எண் தரவு மட்டுமே. தொடருக்கு, செயல்படுத்தப்படவில்லை.

குறைந்தபட்ச_ எண்ணிக்கை: செயல்பாட்டை முடிக்க தேவையான சாத்தியமான மதிப்புகளின் எண்ணிக்கை. min_countஐ விட NA அல்லாத மதிப்புகள் குறைவாக இருந்தால், விளைவு NA ஆக இருக்கும்.

வருமானம்: DataFrame (நிலை குறிப்பிடப்பட்டிருந்தால்) அல்லது தொடர்.

எடுத்துக்காட்டு # 01: டேட்டாஃப்ரேம் நெடுவரிசை மற்றும் அனைத்து நெடுவரிசைகளின் கூட்டுத்தொகையைத் தீர்மானித்தல்

முதலில் செல்லுபடியாகும் தரவு வகைகளுடன், அதாவது, முழு எண்ணாக, மிதவை, முதலியன, நெடுவரிசை அல்லது நெடுவரிசைகள் கொண்ட தரவுச்சட்டம் தேவை. pd.DataFrame() செயல்பாட்டைப் பயன்படுத்தி டேட்டாஃப்ரேம் உருவாக்கப்படும்.


pd.DataFrame() செயல்பாட்டிற்குள் உள்ள பைதான் அகராதியிலிருந்து தேவையான டேட்டாஃப்ரேமை உருவாக்கியுள்ளோம். மேலே உருவாக்கப்பட்ட தரவுச்சட்டத்தில், 'பெயர்', 'நாள்1', 'நாள்2' மற்றும் 'நாள்3' ஆகிய நான்கு நெடுவரிசைகள் உள்ளன. நான்கு நெடுவரிசைகளில் மூன்று நெடுவரிசைகள் அதாவது 'நாள்1', 'நாள்2' மற்றும் 'நாள்3' ஆகியவை தரவு மதிப்புகள் (4, 4, 3, 2, 4, 6, 5, 3), (2, 4,) கொண்ட எண் நெடுவரிசைகள் முறையே 5, 2, 3, 4, 6, 2), மற்றும் (7, 4, 3, 5, 6, 2, 1, 4) இந்த மூன்று நெடுவரிசைகளுக்கான கூட்டுத்தொகையை மட்டுமே நாம் கண்டுபிடிக்க முடியும். இரண்டு தொடர் (அதாவது, ஒரு நெடுவரிசை) மற்றும் ஒரு முழு தரவுச்சட்டத்தின் கூட்டுத்தொகை தொகை() முறையைப் பயன்படுத்தி தீர்மானிக்க முடியும். ஒரு பாண்டாஸ் நெடுவரிசையில் அனைத்து தரவையும் எவ்வாறு தொகுக்க வேண்டும் என்பதை கற்பிப்பதன் மூலம் தொடங்குவோம்.


தொகையைத் தீர்மானிக்க, “day2” நெடுவரிசையில் தொகை() முறையைப் பயன்படுத்தினோம். செயல்பாடு 28 இன் கூட்டு மதிப்பை வழங்கியது. இதைப் போலவே, ஒவ்வொரு டேட்டாஃப்ரேம் நெடுவரிசையின் கூட்டுத்தொகையையும் நாம் தீர்மானிக்கலாம். மொத்த டேட்டாஃப்ரேம் முழுவதும் சம்() முறையைப் பயன்படுத்துவது இதை நிறைவேற்றும்.


அதை பார்க்க முடியும் என, நெடுவரிசை 'நாள்1' தொகை 31; “day2”க்கு, கூட்டு மதிப்பு 28, அதேசமயம், “day3” நெடுவரிசைக்கு, கூட்டு மதிப்பு 32 ஆகும்.

எடுத்துக்காட்டு # 02: டேட்டாஃப்ரேம் நெடுவரிசை மதிப்புகளை கூட்டுவதற்கு, கூட்டு() செயல்பாட்டைப் பயன்படுத்துதல்

முந்தைய எடுத்துக்காட்டின் வெளியீட்டில் இருந்து நீங்கள் பார்க்க முடியும் என, செயல்பாடு கூட்டுத்தொகையை உருவாக்கிய உண்மையான தரவு சட்ட நிரல் தரவை வழங்கவில்லை. இருப்பினும், DataFrame நெடுவரிசைக்கு “DataFrame.sum()”  முறையை ஒதுக்குவதன் மூலம், மொத்த நெடுவரிசை உட்பட DataFrame இல் உள்ள ஒவ்வொரு நெடுவரிசையையும் அணுகலாம். முதலில், இந்த எடுத்துக்காட்டிற்காக மற்றொரு டேட்டாஃப்ரேமை உருவாக்குகிறோம்.


pd.DataFrame() ஐப் பயன்படுத்தி எங்கள் டேட்டாஃப்ரேம் உருவாக்கப்பட்டது. டேட்டாஃப்ரேமை மூன்று நெடுவரிசைகளுடன் உருவாக்கியுள்ளோம்: பொருள், விலை மற்றும் வரி. வரி மதிப்புகள் ('பேனா', 'மார்க்கர்', 'ரூலர்', 'அழிப்பான்', 'பென்சில்', 'கிளிப்போர்டு', 'ஸ்டேப்லர்', 'பின்ஸ்') கொண்ட நெடுவரிசை உருப்படி, மதிப்புகளை சேமிக்கும் நெடுவரிசை விலை (20, 15, 10, 3, 5, 30, 35, 10), மற்றும் 'வரி' நெடுவரிசையில் மதிப்புகள் உள்ளன (8, 5, 3, 3, 4, 10, 5, 2). இப்போது விலை மற்றும் வரி நெடுவரிசை மதிப்புகளைச் சேர்த்து, அசல் டேட்டாஃப்ரேம் நெடுவரிசைகளை வைத்து முடிவுகளை புதிய நெடுவரிசையில் சேமிப்போம்.


புதிய நெடுவரிசை 'மொத்தம்' உடன் கவனிக்கப்படுவதால், கொடுக்கப்பட்ட டேட்டாஃப்ரேமின் அசல் நெடுவரிசைகளும் செயல்பாட்டின் மூலம் திரும்பும். நெடுவரிசை 'மொத்தம்' ஒவ்வொரு 'உருப்படி' தரவுக்கும் எதிராக 'விலை' மற்றும் 'வரி' நெடுவரிசைகளின் மதிப்புகளின் கூட்டுத்தொகையை சேமிக்கிறது.

எடுத்துக்காட்டு # 03: குறிப்பிட்ட டேட்டாஃப்ரேம் நெடுவரிசைகளின் கூட்டுத்தொகையைத் தீர்மானிக்க கூட்டு() செயல்பாட்டைப் பயன்படுத்துதல்

டேட்டாஃப்ரேமின் பல நெடுவரிசைகளை ஒன்றாகச் சேர்க்க, நெடுவரிசைகளின் லேபிள்களுடன் ஒரு பட்டியலைக் குறிப்பிடலாம், பின்னர் கூட்டுத்தொகையைக் கண்டறிய பட்டியலில் உள்ள தொகை() முறையைப் பயன்படுத்தலாம். முந்தைய உதாரணங்களைப் போலவே, முதலில் டேட்டாஃப்ரேமை உருவாக்குவோம்.


'மாணவர்கள்', 'மார்க்ஸ்1', 'மார்க்ஸ்2' மற்றும் 'மார்க்ஸ்3' ஆகிய நான்கு நெடுவரிசைகளுடன் எங்கள் டேட்டாஃப்ரேமை உருவாக்கியுள்ளோம். 'மாணவர்கள்' என்ற நெடுவரிசை தரவுகளை ('லாரி', 'ஜேம்ஸ்', 'ராப்', 'ஆர்யா', 'மேக்ஸ்', 'பென்', 'க்வென்', 'பில்') மற்றும் 'மார்க்ஸ்1' நெடுவரிசையில் சேமிக்கிறது மதிப்புகள் (8, 9, 6, 8, 10, 7, 9, 9), அதேசமயம் “குறிகள்2” மற்றும் “மார்க்ஸ்3” நெடுவரிசைகள் எண் மதிப்புகளை (6, 6, 8, 6, 7, 9, 10, 9) சேமிக்கின்றன. ) மற்றும் (7, 6, 9, 7, 8, 7, 10, 10) முறையே.


முதலில், 'மாணவர்கள்', 'மார்க்ஸ்1' மற்றும் 'மார்க்ஸ்3' என்ற நெடுவரிசை லேபிள்களுடன் பட்டியல் பொருளை உருவாக்கியுள்ளோம். பின்னர் தொகை () முறை பட்டியலில் பயன்படுத்தப்படுகிறது. 'மாணவர்கள்' என்ற நெடுவரிசை எண் அல்லாததாக இருப்பதால் மட்டுமே இந்தச் செயல்பாடு மதிப்பெண்கள்1 மற்றும் மார்க்ஸ்3 நெடுவரிசைகளின் மதிப்புகளைச் சுருக்கிச் சேர்த்தது, எனவே 'மாணவர்கள்' என்ற நெடுவரிசையின் மதிப்புகளுக்கான தொகையை தொகை() செயல்பாட்டால் கண்டுபிடிக்க முடியாது. “மார்க்ஸ்1” மற்றும் “மார்க்ஸ்3” நெடுவரிசைகளின் மதிப்புகளின் கூட்டுத்தொகையை “தொகை” நெடுவரிசையில் சேமித்துள்ளோம்.

எடுத்துக்காட்டு # 04: ஒரு குறிப்பிட்ட நிபந்தனையை பூர்த்தி செய்யும் பாண்டாஸ் டேட்டாஃப்ரேமின் நெடுவரிசைகளைச் சேர்க்கவும்

இந்த எடுத்துக்காட்டில், குறிப்பிட்ட நெடுவரிசைகள் குறிப்பிட்ட நிபந்தனையைப் பூர்த்தி செய்தால், அவற்றின் மதிப்புகளைச் சேர்ப்போம்.


புதிதாக உருவாக்கப்பட்ட டேட்டாஃப்ரேமில் 5 நெடுவரிசைகள் உள்ளன, அதாவது, 'நிறுவனம்', 'வாரம்1_விற்பனை', 'வாரம்2_விற்பனை', 'வாரம்3_விற்பனை' மற்றும் 'கிளைகள்'. இப்போது, ​​கொடுக்கப்பட்ட டேட்டாஃப்ரேம் வரிசைகளின் மதிப்புகளைச் சேர்க்கும்போது அல்லது கண்டுபிடிக்கும்போது கடைசி நெடுவரிசையின் மதிப்பைச் சேர்க்க விரும்பவில்லை என்று வைத்துக்கொள்வோம். நெடுவரிசை மதிப்புகளை அவற்றின் லேபிள்களில் 'வாரம்' என்ற வார்த்தையுடன் சேர்க்க விரும்புகிறோம் என்று வைத்துக் கொள்வோம். நெடுவரிசை லேபிளில் 'வாரம்' என்ற வார்த்தை உள்ளதா இல்லையா என்பதைத் தீர்மானிக்க ஒரு பட்டியல் புரிதலை உருவாக்கலாம்.


இப்போது லேபிள்களில் 'வாரம்' என்ற வார்த்தையைக் கொண்ட நெடுவரிசைகளைப் பெற்றுள்ளோம். தொகை() செயல்பாட்டில் உள்ள axis=1 வாதத்தைப் பயன்படுத்தி “வாரம்” என்ற சொல்லைக் கொண்ட நெடுவரிசைகளை சுருக்கமாகக் கூறலாம்.


இந்த முறையில், நாங்கள் விரும்பாத எந்த நெடுவரிசைகளையும் சேர்க்காமல், வரிசை வாரியாக நெடுவரிசைகள் முழுவதும் தரவைப் பாதுகாப்பாகச் சுருக்கலாம்.

எடுத்துக்காட்டு # 5: டேட்டாஃப்ரேமின் தரவைத் தொகுத்த பிறகு தொகையைத் தீர்மானிக்கவும்

ஒன்று அல்லது அதற்கு மேற்பட்ட நெடுவரிசைகளின் தரவைத் தொகுத்த பிறகு டேட்டாஃப்ரேம் நெடுவரிசைகளின் கூட்டுத்தொகையையும் நாம் காணலாம். நெடுவரிசைக்குள் தரவை வகைகளாகக் குழுவாக்க groupby() முறை பயன்படுத்தப்படும். டேட்டாஃப்ரேமை உருவாக்குவோம், அதன் நெடுவரிசைகளில் ஒன்றின் தரவைக் குழுவாக்கலாம்.


இப்போது “வயது” நெடுவரிசையில் உள்ள தரவைத் தொகுத்து, குழுவின் ஒவ்வொரு வகைக்கும் “மதிப்பெண்1” மற்றும் “மதிப்பெண்2” நெடுவரிசைகளின் மதிப்புகளைக் கூட்டுவோம்.


வயது அடிப்படையில் தரவு மதிப்புகளை முதலில் தொகுத்த பிறகு டேட்டாஃப்ரேமில் உள்ள தரவைச் சுருக்கினால் வயதுக் குழுக்களைப் பொறுத்து நெடுவரிசை வாரியான தொகை கிடைக்கும்.

முடிவுரை

இந்த டுடோரியலில், Pandas sum முறையைப் பயன்படுத்தி டேட்டாஃப்ரேம்கள் முழுவதும் தொகையை எவ்வாறு கணக்கிடுவது என்பதை உங்களுக்குக் கற்பிக்க முயற்சித்தோம். இந்த இடுகையின் எடுத்துக்காட்டுகளில் மதிப்புகளை வரிசை மற்றும் நெடுவரிசை வாரியாக சேர்ப்பதை நாங்கள் விவாதித்தோம். கூடுதலாக, நிபந்தனையுடன் நெடுவரிசைகளை எவ்வாறு சேர்ப்பது மற்றும் டேட்டாஃப்ரேமின் நெடுவரிசையை தொகுத்த பிறகு மதிப்புகளை எவ்வாறு கூட்டுவது என்பதை நீங்கள் கற்றுக்கொண்டீர்கள். இப்போது நீங்கள் டேட்டாஃப்ரேமின் நெடுவரிசைகளை ஒன்றாகச் சேர்க்கலாம் அல்லது டேட்டாஃப்ரேம் நெடுவரிசையில் உள்ள மதிப்புகளை நீங்களே கூட்டலாம்.