Dalle-mini என்றால் என்ன, அது எப்படி வேலை செய்கிறது?

Dalle-mini என்பது ஒரு ஆழமான கற்றல் மாதிரியாகும், இது பயனர் உள்ளீட்டு உரையிலிருந்து உயர் தரத்தில் படங்களை உருவாக்க முடியும். இது ஜனவரி 2021 இல் OpenAI வெளியிட்ட DALL-E மாதிரியை அடிப்படையாகக் கொண்டது. DALL-E என்பது ' பிரிக்கப்பட்ட மொழி மற்றும் மறைந்த வெளிப்பாடு ” என்பது ஒரு மின்மாற்றி அடிப்படையிலான நரம்பியல் நெட்வொர்க் ஆகும், இது உரை மற்றும் படங்களை ஒரு பொதுவான மறைந்த இடத்தில் குறியாக்கம் செய்து, பின்னர் அவற்றை மீண்டும் ஒரு முறைக்கு குறியாக்கம் செய்ய முடியும்.

இந்த கட்டுரை பின்வரும் உள்ளடக்கத்தை விளக்கும்:

Dalle-mini என்றால் என்ன?

மினியைக் கொடுங்கள் DALL-E இன் சிறிய மற்றும் வேகமான பதிப்பாகும், இது EleutherAI ஆல் உருவாக்கப்பட்டது, இது ஒரு திறந்த மூல ஆராய்ச்சி கூட்டாகும். DALL-E இன் 12 பில்லியனுடன் ஒப்பிடும்போது, Dalle-mini 6 பில்லியன் அளவுருக்களை மட்டுமே பயன்படுத்துகிறது, மேலும் இது ஒரு GPU இல் இயங்கக்கூடியது. Dalle-mini, உரை உள்ளீட்டிற்கு வேறுபட்ட டோக்கனைசர் மற்றும் சொற்களஞ்சியத்தையும் பயன்படுத்துகிறது, இது வெவ்வேறு மொழிகள் மற்றும் களங்களுடன் மிகவும் இணக்கமாக உள்ளது:

குறிப்பு : பயனர்கள் Dalle-mini ஐப் பயன்படுத்தி இலவசப் படங்களை உருவாக்கலாம் இணைப்பு .

Dalle-mini இன் வேலை என்ன?

Dalle-mini பின்னால் உள்ள முக்கிய யோசனை மின்மாற்றிகளின் சக்தி ஆகும், அவை நரம்பியல் நெட்வொர்க்குகள் ஆகும். அவர்கள் நீண்ட தூர சார்புகள் மற்றும் உரை அல்லது படங்கள் போன்ற தொடர்ச்சியான தரவுகளில் சிக்கலான வடிவங்களைக் கற்றுக்கொள்ள முடியும்.

மின்மாற்றிகள் இரண்டு முக்கிய பகுதிகளைக் கொண்டிருக்கின்றன: ஒரு குறியாக்கி மற்றும் குறிவிலக்கி. முதல் பகுதி ஒரு உள்ளீட்டை (உரை விளக்கம்) எடுத்து அதை மறைக்கப்பட்ட திசையன்களாக மாற்றுகிறது. அதன் பிறகு, டிகோடர் அதை எடுத்து, உள்ளீட்டிற்கு பொருத்தமான ஒரு வெளியீட்டை (ஒரு படம்) உருவாக்குகிறது.

Dalle-mini மற்றும் DALL-E இடையே உள்ள வேறுபாடு என்ன?

Dalle-mini மற்றும் DALL-E ஆகியவை உரை மற்றும் படங்கள் இரண்டிற்கும் பகிரப்பட்ட குறியாக்கி-குறிவிலக்கி கட்டமைப்பைப் பயன்படுத்துகின்றன. அவர்கள் ஒரே நெட்வொர்க்கைப் பயன்படுத்தி இரண்டு முறைகளையும் குறியாக்கம் செய்து டிகோட் செய்யலாம். இது உரை மற்றும் படங்களுக்கு இடையே உள்ள சொற்பொருள் தொடர்பைப் பிடிக்கும் பொதுவான மறைந்த இடத்தைக் கற்றுக்கொள்ள அனுமதிக்கிறது. அதன்பிறகு, உரையிலிருந்து படங்களை உருவாக்குவது அல்லது நேர்மாறாக உருவாக்குவது போன்ற குறுக்கு-மாடல் தலைமுறையைச் செயல்படுத்த அவர்களுக்கு உதவுகிறது.

Dalle-mini எப்படி வேலை செய்கிறது?

உரை விளக்கத்திலிருந்து ஒரு படத்தை உருவாக்க, Dalle-mini முதலில் ஒரு பைட்-ஜோடி குறியாக்க (BPE) வழிமுறையைப் பயன்படுத்தி உரையை டோக்கனைஸ் செய்கிறது, இது உரையை அவற்றின் அதிர்வெண் மற்றும் இணை நிகழ்வின் அடிப்படையில் துணை வார்த்தை அலகுகளாகப் பிரிக்கிறது:

டால்-மினியின் உள் வேலைகளை விரிவாகப் பார்ப்போம்:

Dalle-mini இன் உள் வேலை

'' என்ற வார்த்தை என்று வைத்துக்கொள்வோம். விளையாடுகிறது 'பிரிக்கப்படலாம்' பிளாட் 'மற்றும்' யிங் ”. டோக்கன்கள் பின்னர் 8192 டோக்கன்களின் சொற்களஞ்சியத்தைப் பயன்படுத்தி எண் ஐடிகளுக்கு வரைபடமாக்கப்படுகின்றன. 256 x 64 அளவுள்ள மறைந்த பிரதிநிதித்துவத்தை உருவாக்கும் குறியாக்கியில் ஐடிகள் அளிக்கப்படுகின்றன:

டிகோடர் பின்னர் மறைந்த பிரதிநிதித்துவத்தை எடுத்து 256 x 256 பிக்சல்கள் அளவிலான படத்தை உருவாக்குகிறது. டிகோடர் ஒரு தன்னியக்க செயல்முறையைப் பயன்படுத்துகிறது, அதாவது முந்தைய பிக்சல்கள் மற்றும் மறைந்த பிரதிநிதித்துவத்தின் அடிப்படையில் ஒவ்வொரு பிக்சலையும் ஒவ்வொன்றாக உருவாக்குகிறது.

Dalle-mini ஐப் பயன்படுத்தி உரை விளக்கத்திலிருந்து படத்தை உருவாக்குவது எப்படி?

Dalle-mini ஐப் பயன்படுத்தி ஒரு படத்திலிருந்து உரை விளக்கத்தை உருவாக்க, உரையை ப்ராம்ட் விண்டோவில் உள்ளிடவும். உதாரணமாக, தட்டச்சு செய்யவும் ' சீரற்ற மலர்களின் ஓவியம் 'உடனடியில்' அழுத்தவும் ஓடு ' பொத்தானை:

உள்ளீடு உரைக்கு ஏற்ப தொடர்புடைய படங்களை Dalle-mini உருவாக்கியுள்ளது என்பதை வெளியீடு காட்டுகிறது.

முடிவுரை

Dalle-mini என்பது ஒரு குறிப்பிடத்தக்க மாதிரியாகும், இது குறுக்கு-மாதிரி உருவாக்கத்திற்கான மின்மாற்றிகளின் திறனை நிரூபிக்கிறது. அவர்கள் இயற்கையான மொழி விளக்கங்களிலிருந்து யதார்த்தமான மற்றும் மாறுபட்ட படங்களையும், படங்களிலிருந்து ஒத்திசைவான மற்றும் பொருத்தமான உரைகளையும் உருவாக்க முடியும். ஒரு படம் அல்லது உரையில் பல பொருள்கள் அல்லது பண்புக்கூறுகளை இணைப்பது போன்ற சிக்கலான கலவைகளையும் அவர்கள் கையாள முடியும். இந்தக் கட்டுரை Dalle-mini மற்றும் அதன் செயல்பாட்டை விரிவாக விளக்கியுள்ளது.

Dalle-mini என்றால் என்ன, அது எப்படி வேலை செய்கிறது?