பாண்டாஸில் உள்ள DataFrame இல் டிக்ட்டை இணைக்கவும்

Pantasil Ulla Dataframe Il Tikttai Inaikkavum



pandas.DataFrame.append() மற்றும் pandas.concat() செயல்பாடுகளைப் பயன்படுத்தி ஏற்கனவே உள்ள Pandas DataFrame இல் அகராதியை எவ்வாறு இணைப்பது என்பதை எடுத்துக்காட்டுகளுடன் விவாதிப்போம். இங்கே, அகராதி என்பது விசை:மதிப்பு ஜோடியைக் குறிக்கிறது, அதாவது, டேட்டாஃப்ரேமில் இருக்கும் நெடுவரிசை லேபிள்களை விசை குறிக்கிறது மற்றும் மதிப்புகள் ஒரு வரிசையில் சேர்க்கப்படுகின்றன. மேலும், Pandas DataFrame இல் பல அகராதிகளைச் சேர்க்கும் உதாரணங்களைக் காண்போம்.

Pandas.DataFrame.Append ஐப் பயன்படுத்துதல்

pandas.DataFrame.append() செயல்பாடு மற்றொரு DataFrame இன் வரிசைகளை ஏற்கனவே உள்ள DataFrame உடன் இணைக்கப் பயன்படுகிறது. ஏற்கனவே உள்ள DataFrame இல் உள்ள நெடுவரிசைகள் இல்லை என்றால், மற்ற DataFrame நெடுவரிசைகள் ஏற்கனவே உள்ள DataFrame இல் உருவாக்கப்படும். அகராதியைச் சேர்ப்பதன் மூலம் டேட்டாஃப்ரேமில் வரிசை செருகப்பட வேண்டும் என்று இந்தச் செயல்பாட்டைப் பயன்படுத்தவும்.

தொடரியல் :







பின்வருபவை pandas.DataFrame.append() செயல்பாட்டின் உண்மையான தொடரியல்:



பாண்டாக்கள். டேட்டாஃப்ரேம் . இணைக்கவும் ( மற்றவை , புறக்கணிப்பு_குறியீடு , சரிபார்த்தல்_ஒருமைப்பாடு , வகைபடுத்து )
  1. மற்றவை : இது மற்றொரு DataFrame ஐக் குறிக்கிறது, இதில் இந்த DataFrame வரிசைகள் ஏற்கனவே உள்ள DataFrame உடன் இணைக்கப்பட்டுள்ளன. நீங்கள் ஒற்றை வரிசையைச் சேர்க்க விரும்பினால், மதிப்புகளின் அகராதியை அளவுருவாக அனுப்ப வேண்டும்.
  2. புறக்கணிப்பு_குறியீடு (இயல்புநிலை = தவறு): ஏற்கனவே வரிசைகளைக் கொண்ட டேட்டாஃப்ரேமில் வரிசைகளைச் சேர்க்கும்போது இந்த அளவுரு பயன்படுத்தப்படும். இது 'தவறு' எனில், ஏற்கனவே உள்ள வரிசை குறியீடுகளும் இணைக்கப்படும். அது 'உண்மை' எனில், வரிசைகள் 0 முதல் n-1 வரை லேபிளிடப்படும். DataFrame இல் அகராதியைச் சேர்க்கும் போது இந்த அளவுரு 'True' என அமைக்கப்பட்டுள்ளதா என்பதை உறுதிப்படுத்தவும். இல்லையெனில், ஒரு பிழை வகை எழுப்பப்படுகிறது - “TypeError:ignign_index=True எனில் மட்டுமே ஆணையைச் சேர்க்க முடியும்”.
  3. verify_integrity அளவுருவைப் பயன்படுத்தி நகல் குறியீடுகளை நாம் சரிபார்க்கலாம் (இயல்புநிலை = False). குறியீடுகள் நகல் மற்றும் verify_integrity 'True' என அமைக்கப்பட்டால், அது 'ValueError: Indexs have overlapping values' என்பதை வழங்கும்.
  4. ஏற்கனவே உள்ள DataFrame மற்றும் மற்றொரு DataFrame இன் நெடுவரிசைகள் 'True' (இயல்புநிலை = False) என அமைப்பதன் மூலம் வரிசை அளவுருவைப் பயன்படுத்தி சீரமைக்கப்படாவிட்டால், நெடுவரிசைகளை வரிசைப்படுத்த முடியும்.

எடுத்துக்காட்டு 1: ஒற்றை அகராதியைச் சேர்க்கவும்

நான்கு நெடுவரிசைகள் - 'Campaign_Name', 'Location', 'StartDate' மற்றும் 'Budget' - மற்றும் மூன்று வரிசைகள் கொண்ட Pandas DataFrame ஐ உருவாக்கவும். இந்த DataFrame இல் அகராதியைச் சேர்க்கவும்.



இறக்குமதி பாண்டாக்கள்

# DataFrame உருவாக்கவும் - 4 நெடுவரிசைகள் மற்றும் 3 வரிசைகளுடன் பிரச்சாரம்
பிரச்சாரம் = பாண்டாக்கள். டேட்டாஃப்ரேம் ( [ [ 'சந்தைப்படுத்தல் முகாம்' , 'இந்தியா' , '01/12/2023' , 8000 ] ,
[ 'விற்பனை முகாம்' , 'இத்தாலி' , '01/25/2022' , 10000 ] ,
[ 'மற்ற முகாம்' , 'அமெரிக்கா' , '04/17/2023' , 2000 ] ] ,
நெடுவரிசைகள் = [ 'பிரசாரம்_பெயர்' , 'இடம்' , 'தொடக்க தேதி' , 'பட்ஜெட்' ] )
அச்சு ( பிரச்சாரம் , ' \n ' )

# ஒற்றை வரிசையைச் சேர்க்கவும்
பிரச்சாரம் = பிரச்சாரம். இணைக்கவும் ( { 'பிரசாரம்_பெயர்' : 'தொழில்நுட்ப முகாம்' , 'இடம்' : 'அமெரிக்கா' , 'தொடக்க தேதி' : '05/12/2023' , 'பட்ஜெட்' : 2000 } , புறக்கணிப்பு_குறியீடு = உண்மை )
அச்சு ( பிரச்சாரம் , ' \n ' )

வெளியீடு :





“பிரச்சார” தரவுச் சட்டத்தில் அகராதி இணைக்கப்பட்டிருப்பதைக் காணலாம். குறியீடு புறக்கணிக்கப்பட்டதால் இந்தப் புதிய வரிசையின் குறியீடு 3 ஆகும்.



எடுத்துக்காட்டு 2: பல அகராதிகளைச் சேர்க்கவும்

எடுத்துக்காட்டு 1 இன் கீழ் உருவாக்கப்பட்ட அதே டேட்டாஃப்ரேமைப் பயன்படுத்தவும் மற்றும் pandas.DataFrame.append() செயல்பாட்டைப் பயன்படுத்தி ஒரு நேரத்தில் மூன்று வரிசைகளைச் சேர்க்கவும். புறக்கணிப்பு_இண்டெக்ஸ் அளவுருவை 'True' என அமைக்கவும்.

இறக்குமதி பாண்டாக்கள்

# DataFrame உருவாக்கவும் - 4 நெடுவரிசைகள் மற்றும் 3 வரிசைகளுடன் பிரச்சாரம்
பிரச்சாரம் = பாண்டாக்கள். டேட்டாஃப்ரேம் ( [ [ 'சந்தைப்படுத்தல் முகாம்' , 'இந்தியா' , '01/12/2023' , 8000 ] ,
[ 'விற்பனை முகாம்' , 'இத்தாலி' , '01/25/2022' , 10000 ] ,
[ 'மற்ற முகாம்' , 'அமெரிக்கா' , '04/17/2023' , 2000 ] ] ,
நெடுவரிசைகள் = [ 'பிரசாரம்_பெயர்' , 'இடம்' , 'தொடக்க தேதி' , 'பட்ஜெட்' ] )
அச்சு ( பிரச்சாரம் , ' \n ' )

பிரச்சாரம் = பிரச்சாரம். இணைக்கவும் ( { 'பிரசாரம்_பெயர்' : 'தொழில்நுட்ப முகாம்' , 'இடம்' : 'அமெரிக்கா' , 'தொடக்க தேதி' : '05/12/2023' , 'பட்ஜெட்' : 2000 } , புறக்கணிப்பு_குறியீடு = உண்மை )
பிரச்சாரம் = பிரச்சாரம். இணைக்கவும் ( { 'பிரசாரம்_பெயர்' : 'சந்தைப்படுத்தல் முகாம்' , 'இடம்' : 'இந்தியா' , 'தொடக்க தேதி' : '06/23/2023' , 'பட்ஜெட்' : 9000 } , புறக்கணிப்பு_குறியீடு = உண்மை )
பிரச்சாரம் = பிரச்சாரம். இணைக்கவும் ( { 'பிரசாரம்_பெயர்' : 'எம்எஸ் விற்பனை முகாம்' , 'இடம்' : 'இத்தாலி' , 'தொடக்க தேதி' : '01/24/2023' , 'பட்ஜெட்' : 1200 } , புறக்கணிப்பு_குறியீடு = உண்மை )
அச்சு ( பிரச்சாரம் )

வெளியீடு :

தற்போதுள்ள டேட்டாஃப்ரேமில் 3, 4 மற்றும் 5 குறியீடுகளுடன் மூன்று வரிசைகள் ஒன்றன் பின் ஒன்றாக இணைக்கப்பட்டுள்ளன.

பாண்டாக்களைப் பயன்படுத்துதல்.கான்காட்

pandas.concat() செயல்பாடு வரிசைகள் அல்லது நெடுவரிசைகளுடன் இரண்டு அல்லது அதற்கு மேற்பட்ட டேட்டாஃப்ரேம்களை இணைக்கிறது. எனவே, நாம் அகராதியை DataFrame ஆக மாற்ற வேண்டும் மற்றும் இந்த செயல்பாட்டிற்கு இரண்டு DataFrames ஐ அனுப்ப வேண்டும்.

தொடரியல் :

ஏற்கனவே உள்ள டேட்டா ஃப்ரேமில் அகராதியைச் சேர்க்கவும்:

பாண்டாக்கள். தொடர்பு ( [ Existing_DataFrame , மாற்றப்பட்ட_ அகராதி ] , அச்சு = 0 , புறக்கணிப்பு_குறியீடு , சரிபார்த்தல்_ஒருமைப்பாடு )
  1. அச்சு = 0 எனில், இணைப்பு வரிசைகளில் செய்யப்படுகிறது. இது ஒரு துணைத்தலைப்பாக இருப்பதால், தேவையான மூலதனத்தைப் பயன்படுத்தினால், நெடுவரிசைகளுடன் இணைத்தல் செய்யப்படுகிறது. சுருக்கத்திற்கு தேவையான கட்டுரை சேர்க்கப்பட்டது. 1.
  2. புறக்கணிப்பு_இண்டெக்ஸ் (இயல்புநிலை = தவறு): ஏற்கனவே வரிசைகள் உள்ள டேட்டாஃப்ரேமில் வரிசைகளைச் சேர்க்கும்போது இந்த அளவுரு பயன்படுத்தப்படும். இது 'தவறு' எனில், ஏற்கனவே உள்ள வரிசை குறியீடுகளும் இணைக்கப்படும். அது 'உண்மை' எனில், வரிசைகள் 0 முதல் n-1 வரை லேபிளிடப்படும்.
  3. verify_integrity அளவுருவைப் பயன்படுத்தி நகல் குறியீடுகளை நாம் சரிபார்க்கலாம் (இயல்புநிலை = False). குறியீடுகள் நகல் மற்றும் verify_integrity 'True' என அமைக்கப்பட்டால், அது 'ValueError: Indexs have overlapping values' என்பதை வழங்கும்.

எடுத்துக்காட்டு 1: ஒற்றை அகராதியைச் சேர்க்கவும்

நான்கு நெடுவரிசைகள் - 'Campaign_Name', 'Location', 'StartDate' மற்றும் 'Budget' - மற்றும் மூன்று வரிசைகள் கொண்ட Pandas DataFrame ஐ உருவாக்கவும். pandas.concat() செயல்பாட்டைப் பயன்படுத்தி, இந்த DataFrame இல் ஒரு அகராதியை (DataFrame) வரிசையாக இணைக்கவும்.

இறக்குமதி பாண்டாக்கள்


# DataFrame உருவாக்கவும் - 4 நெடுவரிசைகள் மற்றும் 3 வரிசைகளுடன் பிரச்சாரம்
பிரச்சாரம் = பாண்டாக்கள். டேட்டாஃப்ரேம் ( [ [ 'சந்தைப்படுத்தல் முகாம்' , 'இந்தியா' , '01/12/2023' , 8000 ] ,
[ 'விற்பனை முகாம்' , 'இத்தாலி' , '01/25/2022' , 10000 ] ,
[ 'மற்ற முகாம்' , 'அமெரிக்கா' , '04/17/2023' , 2000 ] ] ,
நெடுவரிசைகள் = [ 'பிரசாரம்_பெயர்' , 'இடம்' , 'தொடக்க தேதி' , 'பட்ஜெட்' ] )
அச்சு ( பிரச்சாரம் , ' \n ' )

அகராதி_from_DataFrame = பாண்டாக்கள். டேட்டாஃப்ரேம் ( [ { 'பிரசாரம்_பெயர்' : 'சேவை முகாம்' , 'இடம்' : 'அமெரிக்கா' , 'தொடக்க தேதி' : '04/17/2023' , 'பட்ஜெட்' : 1000 } ] )

# ஒற்றை வரிசையைச் சேர்க்கவும்
பிரச்சாரம் = பாண்டாக்கள். தொடர்பு ( [ பிரச்சாரம் , அகராதி_from_DataFrame ] , அச்சு = 0 )
அச்சு ( பிரச்சாரம் , ' \n ' )

வெளியீடு :

“பிரச்சார” தரவுச் சட்டத்தில் அகராதி இணைக்கப்பட்டிருப்பதைக் காணலாம். குறியீட்டு புறக்கணிக்கப்படாததால், இந்தப் புதிய வரிசையின் குறியீடு 0 ஆகும்.

எடுத்துக்காட்டு 2: பல அகராதிகளைச் சேர்க்கவும்

முந்தைய DataFrame ஐப் பயன்படுத்தி, குறியீட்டைப் புறக்கணிப்பதன் மூலம் மூன்று அகராதிகளை (DataFrame) இணைக்கவும்.

இறக்குமதி பாண்டாக்கள்


# DataFrame உருவாக்கவும் - 4 நெடுவரிசைகள் மற்றும் 3 வரிசைகளுடன் பிரச்சாரம்
பிரச்சாரம் = பாண்டாக்கள். டேட்டாஃப்ரேம் ( [ [ 'சந்தைப்படுத்தல் முகாம்' , 'இந்தியா' , '01/12/2023' , 8000 ] ,
[ 'விற்பனை முகாம்' , 'இத்தாலி' , '01/25/2022' , 10000 ] ,
[ 'மற்ற முகாம்' , 'அமெரிக்கா' , '04/17/2023' , 2000 ] ] ,
நெடுவரிசைகள் = [ 'பிரசாரம்_பெயர்' , 'இடம்' , 'தொடக்க தேதி' , 'பட்ஜெட்' ] )
அச்சு ( பிரச்சாரம் , ' \n ' )

அகராதி_from_DataFrame = பாண்டாக்கள். டேட்டாஃப்ரேம் ( [ { 'பிரசாரம்_பெயர்' : 'தொழில்நுட்ப முகாம்' , 'இடம்' : 'அமெரிக்கா' , 'தொடக்க தேதி' : '05/17/2023' , 'பட்ஜெட்' : 1000 } ,
{ 'பிரசாரம்_பெயர்' : 'சமூக சேவைகள்' , 'இடம்' : 'ஜப்பான்' , 'தொடக்க தேதி' : '04/17/2023' , 'பட்ஜெட்' : 200 } ,
{ 'பிரசாரம்_பெயர்' : 'விற்பனை முகாம்' , 'இடம்' : 'அமெரிக்கா' , 'தொடக்க தேதி' : '04/18/2023' , 'பட்ஜெட்' : 500 } ] )

# பல வரிசைகளைச் சேர்க்கவும்
பிரச்சாரம் = பாண்டாக்கள். தொடர்பு ( [ பிரச்சாரம் , அகராதி_from_DataFrame ] , அச்சு = 0 , புறக்கணிப்பு_குறியீடு = உண்மை )
அச்சு ( பிரச்சாரம் , ' \n ' )

வெளியீடு :

'பிரச்சார' தரவுச்சட்டத்தில் மூன்று அகராதிகள் இணைக்கப்பட்டிருப்பதைக் காணலாம். புறக்கணிப்பு_குறியீட்டு அளவுரு 'False' என அமைக்கப்பட்டதால், இந்த அகராதிகளின் குறியீடுகள் 3, 4 மற்றும் 5 ஆகும்.

முடிவுரை

pandas.DataFrame.append() மற்றும் pandas.concat() செயல்பாடுகளைப் பயன்படுத்தி டேட்டாஃப்ரேமில் ஒற்றை/பல அகராதிகள் இணைக்கப்பட்டுள்ளன. புதிய வரிசைகளின் குறியீடுகள், புறக்கணிப்பு_குறியீட்டு அளவுருவை pandas.concat() செயல்பாட்டில் 'True' என அமைப்பதன் மூலம் தனித்துவமாக இருக்கும். pandas.DataFrame.append() செயல்பாட்டைப் பயன்படுத்தும் போது, ​​புறக்கணிப்பு_இண்டெக்ஸ் அளவுருவை 'True' என அமைக்கவும். இல்லையெனில், TypeError எழுப்பப்படும்.