அமேசான் ரெட்ஷிஃப்ட் டேட்டாடைப்ஸ் என்றால் என்ன?

Amecan Retsihpt Tettataips Enral Enna



Amazon Redshift என்பது AWS வழங்கும் கிளவுட் தீர்வாகும், இது தரவுக் கிடங்கின் நோக்கத்தை நிறைவேற்றுகிறது. தரவுக் கிடங்கு என்பது மேகக்கணியில் உள்ள ஒரு பெரிய இடமாகும், இது மிகப்பெரிய அளவிலான தரவைச் சேமிக்கிறது. தரவுக் கிடங்கிற்கும் தரவுத்தளத்திற்கும் உள்ள வேறுபாடு என்னவென்றால், முந்தையது தற்போதைய தரவை மட்டுமல்ல, தரவின் முழுமையான வரலாற்றையும் சேமிக்கிறது.

இந்தக் கட்டுரை AWS வழங்கும் Amazon Redshift மற்றும் இந்தச் சேவை ஆதரிக்கும் தரவு வகைகளைப் பற்றி அறியும்.







Amazon RedShift என்றால் என்ன?

இது தரவுக் கிடங்கிற்கான கிளவுட் தீர்வாகும் 'PostgreSQL' . என்ற தொழில்நுட்பத்தைப் பயன்படுத்துகிறது ‘மாசிவ்லி பாரலல் பிராசசிங் (எம்பிபி)’ மின்னல் வேகத்தில் பெட்டாபைட் தரவுகளை செயலாக்க. இது வரலாற்றுத் தரவு மற்றும் ஸ்ட்ரீமிங் தீர்வுகளின் அடிப்படையில் நிகழ்நேரக் கணிப்புக்கு எளிதான தீர்வை வழங்குகிறது.



பின்வரும் படம் அமேசான் ரெட்ஷிப்டின் வேலை செய்யும் பொறிமுறையைக் காட்டுகிறது:







Amazon Redshift எவ்வாறு செயல்படுகிறது என்பதற்கான இந்த வரைகலை விளக்கம் மிகவும் எளிமையானது மற்றும் தெளிவானது. வெளியீடுகளை உருவாக்குவதற்கும் தரவு சார்ந்த பயன்பாடுகளை உருவாக்குவதற்கும் தரவு எவ்வாறு மீட்டெடுக்கப்படுகிறது மற்றும் மேலும் செயலாக்கப்படுகிறது என்பது பற்றிய தகவலை இது வழங்குகிறது.

Amazon Redshift இன் தரவுக் கிடங்கு கட்டமைப்பையும் கீழே கொடுக்கப்பட்டுள்ள படத்தில் காணலாம்:



இப்போது, ​​​​இந்த சேவையின் பயன்பாடுகள் மற்றும் அம்சங்களைப் பார்ப்போம்.

அம்சங்கள்

ஏற்கனவே குறிப்பிட்டுள்ளபடி, Amazon Redshift ஆனது PostgreSQL ஐ அடிப்படையாகக் கொண்டது மற்றும் மாசிவ்லி பாரலல் ப்ராசசிங் எனப்படும் தொழில்நுட்பத்தைப் பயன்படுத்துகிறது, இது எந்த நேரத்திலும் பெட்டாபைட் தரவுகளை செயலாக்க உதவுகிறது. எனவே, Redshift நல்ல எண்ணிக்கையிலான அம்சங்களையும் பயன்பாடுகளையும் வழங்குகிறது. இந்த அம்சங்களில் சில கீழே உள்ளன:

  • தரவு பாதுகாப்பு மற்றும் குறியாக்கம்.
  • வணிக பகுப்பாய்வு.
  • தரவு சார்ந்த பயன்பாட்டு ஆதரவு.
  • முன்கணிப்பு பகுப்பாய்வு.
  • தானியங்கு பணி மீண்டும்.
  • ஒரே நேரத்தில் தரவு அளவிடுதல்.
  • தரவுக் கிடங்கு.

இந்த சேவையின் சில கூடுதல் அம்சங்களை கீழே கொடுக்கப்பட்டுள்ள படத்தில் காணலாம்:

Redshift வழங்கும் பெரும்பாலான அம்சங்கள் இவைதான், இப்போது இந்தச் சேவையால் ஆதரிக்கப்படும் தரவு வகைகளுக்குச் செல்வோம்.

தரவு வகைகள்

அமேசான் ரெட்ஷிஃப்ட் என்பது ஏராளமான அம்சங்களைக் கொண்ட தரவுக் கிடங்கு தீர்வு. இது கட்டமைக்கப்பட்ட மற்றும் கட்டமைக்கப்படாத தரவு வகைகளை ஆதரிக்கிறது. இது PostgreSQL ஐ அடிப்படையாகக் கொண்டிருப்பதால், எளிய SQL வினவல்கள் மூலம் தரவைக் கையாள முடியும்.

இப்போது, ​​மற்றொரு கேள்வி எழுகிறது, அதாவது, இந்த தரவு வடிவங்கள் ஒருவருக்கொருவர் எவ்வாறு வேறுபடுகின்றன? இந்த இரண்டு தரவு வடிவங்களைப் பற்றி விவாதிப்போம்.

கட்டமைக்கப்பட்ட தரவு

மெஷின் லேர்னிங் அல்காரிதம்களால் எளிதாக மொழிபெயர்க்கப்படும் மிகவும் வடிவமைக்கப்பட்ட தரவு வகை கட்டமைக்கப்பட்ட தரவு எனப்படும். ஒரு SQL தரவுத்தளம் கட்டமைக்கப்பட்ட தரவுகளுடன் வேலை செய்கிறது. தொடர்புடைய தரவுத்தளங்களால் பயன்படுத்தப்படும் தரவு போன்ற கட்டமைக்கப்பட்ட தரவு அட்டவணை வடிவத்தில் உள்ளது

பரவலாகப் பயன்படுத்தப்படும் SQL தரவுத்தள மேலாண்மை அமைப்புகளில் ஒன்று MYSQL ஆகும். அதன் கட்டிடக்கலை கீழே கொடுக்கப்பட்டுள்ள படத்தில் காணலாம்:

கட்டமைக்கப்படாத தரவு

கட்டமைக்கப்படாத தரவு முறை குறைவாக உள்ளது மற்றும் தொடர்புடைய தரவுத்தளங்களில் பயன்படுத்தப்படும் தரவு போன்ற குறைவான தரவை வடிவமைக்கிறது. மோங்கோடிபி என்பது பிரபலமான தொடர்பு இல்லாத தரவுத்தளமாகும். SQL வினவல்கள் தொடர்பு இல்லாத தரவுத்தளங்களில் வேலை செய்யாது, எனவே இந்த தரவுத்தளங்கள் NoSQL தரவுத்தளங்கள் என்றும் அழைக்கப்படுகின்றன.

ஏற்கனவே குறிப்பிட்டுள்ளபடி, மோங்கோடிபி என்பது கட்டமைக்கப்படாத தரவுத்தள மேலாண்மை அமைப்பு மற்றும் அதன் கட்டமைப்பை கீழே கொடுக்கப்பட்டுள்ள படத்தில் காணலாம்:

தரவுத்தளங்களில் பயன்படுத்தப்படும் இரண்டு அடிப்படை தரவு வகைகளை நாங்கள் கடந்துவிட்டோம், இப்போது Amazon Redshift ஆல் ஆதரிக்கப்படும் உண்மையான தரவு வகைகளுக்குச் செல்வோம். இந்த தரவு வகைகள்:

  • எண் தரவு
  • எழுத்துத் தரவு
  • தேதிநேர தரவு
  • பூலியன் தரவு
  • HLLSKETCH தரவு
  • சூப்பர் டேட்டா
  • மாற்றீடு தரவு

இந்த தரவு வகைகளைப் பற்றி விவாதிப்போம்:

எண் தரவு

இந்த தரவு வகை சுய விளக்கமளிக்கும். இது முழு எண்கள், தசமங்கள், மிதக்கும் புள்ளி மற்றும் பிற எண் தரவு வகைகளின் வடிவத்தில் இருக்கும் தரவை ஆதரிக்கிறது.

முழு எண் தரவு வகையின் பண்புகளை கீழே உள்ள படத்தில் காணலாம்:

தசம தரவு வகை பயனரின் துல்லியத்தின் அடிப்படையில் தரவைச் சேமிக்கிறது. அதன் பண்புகள் பின்வருமாறு:

எழுத்துத் தரவு

CHAR மற்றும் VARCHAR தரவு வகைகள் எழுத்து அடிப்படையிலான தரவு வகைகளின் கீழ் வரும். NCHAR மற்றும் NVARCHAR ஆகியவை எழுத்து வகை தரவு வகைகளாகும். CHAR மற்றும் VARCHAR போலல்லாமல், இந்த இரண்டு தரவு வகைகளும் நிலையான நீளம், யூனிகோட் எழுத்துகளை சேமிக்கின்றன. இந்த தரவு வகைகளின் பண்புகளைப் பார்ப்போம், அவை:

  • CHAR, CHARACTER, NCHAR ஆகியவை 4KB வரம்பைக் கொண்டுள்ளன.
  • VARCHAR, NVARCHAR 64KB வரம்பைக் கொண்டுள்ளது.
  • BPCHAR 256 பைட்டுகள் வரம்பைக் கொண்டுள்ளது.
  • TEXT 260 பைட்டுகளின் வரம்பைக் கொண்டுள்ளது.

தேதிநேர தரவு

தேதிநேர தரவு வகைகள் DATE, TIME, TIMETZ, TIMESTAMP, TIMESTAMPTZ. இந்த தரவு வகைகளின் செயல்பாட்டு திறன்கள் பின்வருமாறு:

  • DATE வெறுமனே காலண்டர் தேதிகளை சேமிக்கிறது.
  • TIME எந்த நேர மண்டலத்தையும் குறிப்பிடாமல் நேரத்தைச் சேமிக்கிறது. இது முன்னிருப்பாக UTC ஆகும்.
  • TIMETZ நேர மண்டலத்தைக் குறிக்கும் வகையில் நேரத்தைச் சேமிக்கிறது. இயல்பாக, பயனர் அட்டவணைகள் மற்றும் கணினி அட்டவணைகள் இரண்டிலும் இது UTC ஆகும்.
  • TIMESTAMP ஆனது நேரத்தை மட்டுமல்ல, தேதிகளையும் உள்ளடக்கியது. பயனர் அட்டவணைகள் மற்றும் கணினி அட்டவணைகள் இரண்டிலும் இது முன்னிருப்பாக UTC ஆகும்.
  • TIMESTAMPTZ ஆனது நேரத்தை மட்டுமல்ல, தேதிகளையும் உள்ளடக்கியது. இயல்பாக, பயனர் அட்டவணையில் மட்டுமே இது UTC ஆகும்.

பூலியன் தரவு

பூலியன் தரவு வகை ஒரு பைனரி தரவு வகை, அதாவது இரண்டு மதிப்புகள் மட்டுமே உள்ளன. பூலியன் தரவு வகைக்கான பண்புகள் அட்டவணை கீழே படத்தில் கொடுக்கப்பட்டுள்ளது:

HLLSKETCH தரவு

இந்த தரவு வகை ஓவியங்களைச் சேமிக்கப் பயன்படுகிறது. ரெட்ஷிஃப்ட் ஓவியங்களை அரிதாகவோ அல்லது அடர்த்தியாகவோ குறிப்பிடலாம். இணைப்பைப் பின்தொடர்வதன் மூலம் அடர்த்தியான வடிவம் அதிக செயல்திறனை வழங்கும் போது ஓவியங்கள் அரிதாகத் தொடங்கி படிப்படியாக அடர்த்தியாக மாறும்.

சூப்பர் டேட்டா

இந்த தரவு வகையானது, வரிசைகள், உள்ளமை கட்டமைப்புகள் அல்லது JSON வடிவில் இருக்கும் கட்டமைக்கப்படாத தரவைக் கையாள்கிறது. தரவின் மாதிரி அல்லது வடிவம் இல்லை. இணைப்பை வழிசெலுத்துவதன் மூலம் பயனர்கள் கூடுதல் தகவல்களை ஆராயலாம்.

மாற்றீடு தரவு

இந்த தரவு வகை எழுத்துக்களையும் சேமிக்கிறது. இருப்பினும், நீளம் குறைவாக உள்ளது. அமேசான் ரெட்ஷிஃப்ட் VARBYTE தரவை எந்த முழு எண் வகை அல்லது எழுத்து வகை தரவுகளில் அனுப்ப அனுமதிக்கிறது. இந்த தரவு வகை பற்றிய கூடுதல் தகவல்களைப் பெற, கீழே உள்ள இணைப்பைப் பின்தொடரவும்.

அமேசான் ரெட்ஷிஃப்ட் மற்றும் அது ஆதரிக்கும் தரவு வகைகளுக்கு இதுவே உள்ளது.

முடிவுரை

Amazon Redshift என்பது AWS சேவையாகும், இது அதன் அடிப்படை வடிவத்தில் தரவுக் கிடங்கின் நோக்கத்திற்கு உதவுகிறது, ஆனால் பகுப்பாய்வு மற்றும் கணிப்புக்கான மிகவும் சக்திவாய்ந்த மற்றும் அம்சமான தீர்வாகும். இந்தக் கட்டுரை Redshift மற்றும் அது ஆதரிக்கும் தரவு வகைகளைப் பற்றி விவாதிக்கிறது. இந்த தரவு வகைகள் அவற்றின் பண்புகளுடன் சுருக்கமாக விளக்கப்பட்டுள்ளன.