DataFrame ஐ R இல் வரிசைப்படுத்தவும்

Dataframe Ai R Il Varicaippatuttavum



தரவுச் சட்டங்களை R இல் வரிசைப்படுத்துவது தரவு பகுப்பாய்வு மற்றும் கையாளுதலில் ஒரு முக்கியமான செயல்பாடாகும். குறிப்பிடத்தக்க வகையில், R ஆனது பல நெடுவரிசைகளின் அடிப்படையில் தரவை வரிசைப்படுத்துவதில் அதிக நெகிழ்வுத்தன்மையை வழங்குகிறது மற்றும் ஏறுவரிசை அல்லது இறங்கு வரிசையில் வரிசைப்படுத்துகிறது. R இல், டேட்டாஃப்ரேம்களை வரிசைப்படுத்துவது பல்வேறு முறைகள் மற்றும் செயல்பாடுகளைப் பயன்படுத்தி நிறைவேற்றப்படலாம். இந்தக் கட்டுரையில், குறிப்பிட்ட எந்த ஆர்டர்களிலும் டேட்டாஃப்ரேமை வரிசைப்படுத்த உதவும் பல்வேறு செயல்பாடுகளை நாங்கள் மேற்கொள்வோம்.

எடுத்துக்காட்டு 1: ஆர்டர்() முறையைப் பயன்படுத்தி டேட்டாஃப்ரேமை வரிசைப்படுத்துதல்

R இல் உள்ள ஒழுங்கு() செயல்பாடு ஒன்று அல்லது பல நெடுவரிசைகள் மூலம் DataFrames ஐ வரிசைப்படுத்த பயன்படுகிறது. DataFrame வரிசைகளை மறுசீரமைக்க வரிசைப்படுத்தப்பட்ட வரிசைகளின் குறியீடுகளை ஆர்டர் செயல்பாடு பெறுகிறது.

emp = தகவல்கள். சட்டகம் ( பெயர்கள் = c ( 'ஆண்டி' , 'குறி' , 'போனி' , 'கரோலின்' , 'ஜான்' ) ,

வயது = c ( இருபத்து ஒன்று , 23 , 29 , 25 , 32 ) ,

சம்பளம் = c ( 2000 , 1000 , 1500 , 3000 , 2500 ) )

பூனை ( ' \n \n டேட்டாஃப்ரேம் ஏறுவரிசையில் பெயர்களால் வரிசைப்படுத்தப்பட்டது \n ' )

வரிசைப்படுத்தப்பட்ட_ஏஎஸ்சி = emp [ உடன் ( emp , உத்தரவு ( பெயர்கள் ) ) , ]

அச்சு ( வரிசைப்படுத்தப்பட்ட_ஏஎஸ்சி )

இங்கே, 'emp' DataFrame ஐ வெவ்வேறு மதிப்புகளைக் கொண்ட மூன்று நெடுவரிசைகளுடன் வரையறுக்கிறோம். ஏறுவரிசையில் 'பெயர்கள்' நெடுவரிசை மூலம் 'emp' DataFrame வரிசைப்படுத்தப்படும் என்பதைக் குறிக்க, அறிக்கையை அச்சிட cat() செயல்பாடு பயன்படுத்தப்படுகிறது. இதற்கு, R இல் ஆர்டர்() செயல்பாட்டைப் பயன்படுத்துகிறோம், இது ஏறுவரிசையில் வரிசைப்படுத்தப்பட்ட ஒரு திசையனில் உள்ள மதிப்புகளின் குறியீட்டு நிலைகளை வழங்குகிறது. இந்த வழக்கில், உடன்() செயல்பாடு 'பெயர்கள்' நெடுவரிசையை வரிசைப்படுத்த வேண்டும் என்று குறிப்பிடுகிறது. வரிசைப்படுத்தப்பட்ட DataFrame ஆனது “sorted_asc” மாறியில் சேமிக்கப்படுகிறது, இது வரிசைப்படுத்தப்பட்ட முடிவுகளை அச்சிடுவதற்கு print() செயல்பாட்டில் ஒரு வாதமாக அனுப்பப்படுகிறது.







எனவே, ஏறுவரிசையில் 'பெயர்கள்' நெடுவரிசை மூலம் DataFrame இன் வரிசைப்படுத்தப்பட்ட முடிவுகள் பின்வருவனவற்றில் காட்டப்படும். வரிசைப்படுத்தும் செயல்பாட்டை இறங்கு வரிசையில் பெற, முந்தைய வரிசை() செயல்பாட்டில் நெடுவரிசைப் பெயருடன் எதிர்மறை அடையாளத்தைக் குறிப்பிடலாம்:





எடுத்துக்காட்டு 2: R இல் உள்ள வரிசை() முறை அளவுருக்களைப் பயன்படுத்தி தரவுச் சட்டத்தை வரிசைப்படுத்துதல்

மேலும், ஆர்டர்() செயல்பாடு DataFrame ஐ வரிசைப்படுத்த குறையும் வாதங்களை எடுக்கும். பின்வரும் எடுத்துக்காட்டில், வரிசையை அதிகரிக்கும் அல்லது குறைக்கும் வகையில் வரிசைப்படுத்த ஆர்டர்() செயல்பாட்டை வாதத்துடன் குறிப்பிடுகிறோம்:





df = தகவல்கள். சட்டகம் (

ஐடி = c ( 1 , 3 , 4 , 5 , 2 ) ,

நிச்சயமாக = c ( 'பைத்தான்' , 'ஜாவா' , 'சி++' , 'மோங்கோடிபி' , 'ஆர்' ) )

அச்சு ( 'ஐடி மூலம் குறையும் வரிசையில் வரிசைப்படுத்தப்பட்டது' )

அச்சு ( df [ உத்தரவு ( df$id , குறைகிறது = உண்மை ) , ] )

இங்கே, நாம் முதலில் 'df' மாறியை அறிவிக்கிறோம், அங்கு data.frame() செயல்பாடு மூன்று வெவ்வேறு நெடுவரிசைகளுடன் வரையறுக்கப்படுகிறது. அடுத்து, 'ஐடி' நெடுவரிசையின் அடிப்படையில் டேட்டாஃப்ரேம் குறைந்து வரும் வரிசையில் வரிசைப்படுத்தப்படப் போகிறது என்பதைக் குறிக்க, ஒரு செய்தியை அச்சிடும் அச்சடிப்பு () செயல்பாட்டைப் பயன்படுத்துகிறோம். அதன்பிறகு, பிரிண்ட்() செயல்பாட்டை மீண்டும் வரிசைப்படுத்தும் செயல்பாட்டை செயல்படுத்தி அந்த முடிவுகளை அச்சிடுவோம். அச்சு() செயல்பாட்டின் உள்ளே, 'course' நெடுவரிசையின் அடிப்படையில் 'df' DataFrame ஐ வரிசைப்படுத்த 'order' செயல்பாட்டை அழைக்கிறோம். குறையும் வரிசையில் வரிசைப்படுத்த, 'குறைந்து' வாதம் TRUE என அமைக்கப்பட்டுள்ளது.

பின்வரும் விளக்கப்படத்தில், DataFrame இன் 'ஐடி' நெடுவரிசை இறங்கு வரிசையில் அமைக்கப்பட்டுள்ளது:



இருப்பினும், வரிசையாக்க முடிவுகளை ஏறுவரிசையில் பெற, பின்வருவனவற்றில் காட்டப்பட்டுள்ளபடி, ஒழுங்கு() செயல்பாட்டின் குறையும் வாதத்தை FALSE உடன் அமைக்க வேண்டும்:

அச்சு ( 'ஐடி மூலம் அதிகரிக்கும் வரிசையில் வரிசைப்படுத்தப்பட்டது' )

அச்சு ( df [ உத்தரவு ( df$id , குறைகிறது = பொய் ) , ] )

அங்கு, ஏறுவரிசையில் 'ஐடி' நெடுவரிசை மூலம் DataFrame இன் வரிசைப்படுத்துதலின் வெளியீட்டைப் பெறுகிறோம்.

எடுத்துக்காட்டு 3: R இல் ஏற்பாடு() முறையைப் பயன்படுத்தி DataFrame ஐ வரிசைப்படுத்துதல்

கூடுதலாக, நெடுவரிசைகள் மூலம் டேட்டாஃப்ரேமை வரிசைப்படுத்த ஏற்பாடு() முறையைப் பயன்படுத்தலாம். நாம் ஏறுவரிசை அல்லது இறங்கு வரிசையிலும் வரிசைப்படுத்தலாம். பின்வரும் R குறியீடு ஏற்பாடு() செயல்பாட்டைப் பயன்படுத்துகிறது:

நூலகம் ( 'dplyr' )

மாணவர் = தகவல்கள். சட்டகம் (

ஐடி = c ( 3 , 5 , 2 , 4 , 1 ) ,

மதிப்பெண்கள் = c ( 70 , 90 , 75 , 88 , 92 ) )

அச்சு ( 'ஐடி மூலம் ஆர்டர் வரிசைப்படுத்தல் அதிகரிப்பு' )

அச்சு ( ஏற்பாடு ( மாணவர் , ஐடி ) )

இங்கே, வரிசைப்படுத்துவதற்கான ஏற்பாடு() முறையை அணுக R இன் “dplyr” தொகுப்பை ஏற்றுகிறோம். பின்னர், எங்களிடம் data.frame() செயல்பாடு இரண்டு நெடுவரிசைகளைக் கொண்டுள்ளது மற்றும் DataFrame ஐ “மாணவர்” மாறியாக அமைக்கவும். அடுத்து, கொடுக்கப்பட்ட DataFrame ஐ வரிசைப்படுத்த, print() செயல்பாட்டில் உள்ள “dplyr” தொகுப்பிலிருந்து ஏற்பாடு() செயல்பாட்டைப் பயன்படுத்துகிறோம். ஏற்பாடு() செயல்பாடு “மாணவர்” டேட்டாஃப்ரேமை அதன் முதல் வாதமாக எடுத்துக்கொள்கிறது, அதைத் தொடர்ந்து நெடுவரிசைகளின் “ஐடி” வரிசைப்படுத்தப்படும். இறுதியில் பிரிண்ட்() செயல்பாடு வரிசைப்படுத்தப்பட்ட டேட்டாஃப்ரேமை கன்சோலுக்கு அச்சிடுகிறது.

பின்வரும் வெளியீட்டில் 'ஐடி' நெடுவரிசை ஒரு வரிசையில் வரிசைப்படுத்தப்பட்ட இடத்தை நாம் பார்க்கலாம்:

எடுத்துக்காட்டு 4: R இல் தேதியின்படி DataFrame ஐ வரிசைப்படுத்துதல்

R இல் உள்ள DataFrameஐ தேதி மதிப்புகளால் வரிசைப்படுத்தலாம். இதற்கு, தேதிகளை வடிவமைக்க, வரிசைப்படுத்தப்பட்ட செயல்பாடு as.date() செயல்பாட்டுடன் குறிப்பிடப்பட வேண்டும்.

நிகழ்வு_தேதி = தகவல்கள். சட்டகம் ( நிகழ்வு = c ( '3/4/2023' , '2/2/2023' ,

'10/1/2023' , '3/29/2023' ) ,

கட்டணம் = c ( 3100 , 2200 , 1000 , 2900 ) )

நிகழ்வு_தேதி [ உத்தரவு ( என . தேதி ( நிகழ்வு_தேதி$நிகழ்வு , வடிவம் = '%d/%m/%Y' ) ) , ]

இங்கே, எங்களிடம் 'event_date' DataFrame உள்ளது, அதில் 'நிகழ்வு' நெடுவரிசை 'மாதம்/நாள்/வருடம்' வடிவத்தில் தேதி சரங்களுடன் உள்ளது. இந்த தேதி சரங்களை ஏறுவரிசையில் வரிசைப்படுத்த வேண்டும். நாங்கள் ஆர்டர்() செயல்பாட்டைப் பயன்படுத்துகிறோம், இது DataFrame ஐ 'நிகழ்வு' நெடுவரிசை மூலம் ஏறுவரிசையில் வரிசைப்படுத்துகிறது. 'நிகழ்வு' நெடுவரிசையில் உள்ள தேதி சரங்களை 'as.Date' செயல்பாட்டைப் பயன்படுத்தி உண்மையான தேதிகளுக்கு மாற்றுவதன் மூலமும், 'வடிவமைப்பு' அளவுருவைப் பயன்படுத்தி தேதி சரங்களின் வடிவமைப்பைக் குறிப்பிடுவதன் மூலமும் இதைச் செய்கிறோம்.

எனவே, 'நிகழ்வு' தேதி நெடுவரிசை மூலம் ஏறுவரிசையில் வரிசைப்படுத்தப்பட்ட தரவை நாங்கள் குறிப்பிடுகிறோம்.

எடுத்துக்காட்டு 5: R இல் Setorder() முறையைப் பயன்படுத்தி DataFrame ஐ வரிசைப்படுத்துதல்

இதேபோல், செட்டர்டர்() என்பது டேட்டாஃப்ரேமை வரிசைப்படுத்துவதற்கான மற்றொரு முறையாகும். இது ஏற்பாடு() முறையைப் போலவே வாதத்தை எடுத்து DataFrame ஐ வரிசைப்படுத்துகிறது. Setorder() முறைக்கான R குறியீடு பின்வருமாறு கொடுக்கப்பட்டுள்ளது:

நூலகம் ( 'data.table' )

d1 = தகவல்கள். சட்டகம் ( ஆர்டர் ஐடி = c ( 1 , 4 , 2 , 5 , 3 ) ,

ஆர்டர் பொருள் = c ( 'ஆப்பிள்' , 'ஆரஞ்சு' , 'கிவி' , 'மாங்கனி' , 'வாழை' ) )

அச்சு ( ஒழுங்கு அமைக்க ( d1 , ஆர்டர் பொருள் ) )

இந்த தொகுப்பின் செயல்பாடானது setorder() என்பதால் இங்கு முதலில் data.table library ஐ அமைக்கிறோம். பின்னர், DataFrame ஐ உருவாக்க data.frame() செயல்பாட்டைப் பயன்படுத்துகிறோம். DataFrame நாம் வரிசைப்படுத்தப் பயன்படுத்தும் இரண்டு நெடுவரிசைகளுடன் மட்டுமே குறிப்பிடப்பட்டுள்ளது. இதற்குப் பிறகு, பிரிண்ட்() செயல்பாட்டிற்குள் setorder() செயல்பாட்டை அமைக்கிறோம். setorder() செயல்பாடு “d1” DataFrame ஐ முதல் அளவுருவாகவும், “orderId” நெடுவரிசையை DataFrame வரிசைப்படுத்தப்படும் இரண்டாவது அளவுருவாகவும் எடுத்துக்கொள்கிறது. 'setorder' செயல்பாடு 'orderId' நெடுவரிசையில் உள்ள மதிப்புகளின் அடிப்படையில் தரவு அட்டவணையின் வரிசைகளை ஏறுவரிசையில் மறுசீரமைக்கிறது.

வரிசைப்படுத்தப்பட்ட DataFrame என்பது R இன் பின்வரும் கன்சோலில் உள்ள வெளியீடு ஆகும்:

எடுத்துக்காட்டு 6: R இல் Row.Names() முறையைப் பயன்படுத்தி DataFrame ஐ வரிசைப்படுத்துதல்

row.names() முறையானது DataFrame ஐ R இல் வரிசைப்படுத்துவதற்கான ஒரு வழியாகும். row.names() DataFramesஐ குறிப்பிட்ட வரிசையின்படி வரிசைப்படுத்துகிறது.

df < - தகவல்கள். சட்டகம் ( அணி = c ( 'எக்ஸ்' , 'எக்ஸ்' , 'மற்றும்' , 'மற்றும்' , 'உடன்' ) ,

மதிப்பெண் = c ( 91 , 80 , 86 , 83 , 95 ) )

வரிசை. பெயர்கள் ( df ) < - சி ( 'ஏ' , 'டி' , 'சி' , 'மற்றும்' , 'பி' )

df [ உத்தரவு ( வரிசை. பெயர்கள் ( df ) ) , ]

இங்கே, data.frame() செயல்பாடு 'df' மாறியில் நிறுவப்பட்டது, அங்கு நெடுவரிசைகள் மதிப்புகளுடன் குறிப்பிடப்படுகின்றன. பின்னர், DataFrame இன் வரிசைப் பெயர்கள் row.names() செயல்பாட்டைப் பயன்படுத்தி குறிப்பிடப்படுகின்றன. அதன் பிறகு, DataFrame ஐ வரிசைப் பெயர்களால் வரிசைப்படுத்த ஆர்டர்() செயல்பாட்டை அழைக்கிறோம். வரிசை() செயல்பாடு, டேட்டாஃப்ரேமின் வரிசைகளை மறுசீரமைக்கப் பயன்படுத்தப்படும் வரிசைப்படுத்தப்பட்ட வரிசைகளின் குறியீடுகளை வழங்குகிறது.

வெளியீடு வரிசைப்படுத்தப்பட்ட DataFrame ஐ வரிசைகள் அகரவரிசைப்படி காட்டுகிறது:

முடிவுரை

R இல் டேட்டாஃப்ரேம்களை வரிசைப்படுத்துவதற்கான பல்வேறு செயல்பாடுகளை நாங்கள் பார்த்தோம். ஒவ்வொரு முறைக்கும் ஒரு நன்மை உண்டு மற்றும் வரிசைப்படுத்தல் செயல்பாடு தேவை. R மொழியில் DataFrame ஐ வரிசைப்படுத்த பல முறைகள் அல்லது வழிகள் இருக்கலாம் ஆனால் ஒழுங்கு(), ஏற்பாடு(), மற்றும் setorder() முறைகள் வரிசைப்படுத்துவதற்கு மிகவும் முக்கியமானவை மற்றும் பயன்படுத்த எளிதானவை.