பைதான் 3 இல் செலினியம் அறிமுகம்

Introduction Selenium Python 3



செலினியம் என்பது வலை பயன்பாடுகளைச் சோதிக்கப் பயன்படுத்தப்படும் ஒரு கட்டமைப்பாகும். நீங்கள் விரும்பும் இணையதளத்தில் சோதனைகளை நடத்த, க்ரோம் அல்லது பயர்பாக்ஸ் போன்ற உலாவியை செலினியம் தானியக்கமாக்குகிறது. செலினியம் மிகவும் சக்திவாய்ந்த வலை ஸ்கிராப்பிங் கருவியாகும். செலினியம் ஜாவாஸ்கிரிப்ட் மற்றும் அனைத்து நவீன உலாவி அம்சங்களையும் ஆதரிக்கிறது. இந்த கருவி வலைத்தளங்களிலிருந்து தகவல்களைப் பிரித்தெடுப்பதில் மிகவும் பயனுள்ளதாக இருக்கும்.

இந்த கட்டுரை உங்கள் லினக்ஸ் விநியோகத்தில் (அதாவது, உபுண்டு) செலினியம் அமைப்பது எப்படி, அத்துடன் செலினியம் பைதான் 3 நூலகத்துடன் அடிப்படை வலை ஆட்டோமேஷன் மற்றும் வலை ஸ்கிராப்பிங் ஆகியவற்றை எப்படி செய்வது என்று காண்பிக்கும்.







முன்நிபந்தனைகள்

இந்த கட்டுரையில் பயன்படுத்தப்படும் கட்டளைகள் மற்றும் எடுத்துக்காட்டுகளை முயற்சிக்க, உங்களிடம் பின்வருபவை இருக்க வேண்டும்:



1) உங்கள் கணினியில் ஒரு லினக்ஸ் விநியோகம் (முன்னுரிமை உபுண்டு) நிறுவப்பட்டுள்ளது.
2) உங்கள் கணினியில் பைதான் 3 நிறுவப்பட்டுள்ளது.
3) உங்கள் கணினியில் PIP 3 நிறுவப்பட்டுள்ளது.
4) உங்கள் கணினியில் Google Chrome அல்லது Firefox இணைய உலாவி நிறுவப்பட்டுள்ளது.



இந்த தலைப்புகளில் பல கட்டுரைகளை நீங்கள் காணலாம் LinuxHint.com . உங்களுக்கு மேலும் ஏதேனும் உதவி தேவைப்பட்டால் இந்தக் கட்டுரைகளைப் பார்க்கவும்.





திட்டத்திற்கான பைதான் 3 மெய்நிகர் சூழலைத் தயாரித்தல்

பைதான் மெய்நிகர் சூழல் தனிமைப்படுத்தப்பட்ட பைதான் திட்ட கோப்பகத்தை உருவாக்க பயன்படுகிறது. PIP ஐப் பயன்படுத்தி நீங்கள் நிறுவும் பைதான் தொகுதிகள் உலகளாவிய ரீதியில் அல்லாமல், திட்டக் கோப்பகத்தில் மட்டுமே நிறுவப்படும்.

பைதான் virtualenv பைதான் மெய்நிகர் சூழல்களை நிர்வகிக்க தொகுதி பயன்படுத்தப்படுகிறது.



நீங்கள் பைத்தானை நிறுவலாம் virtualenv பின்வருமாறு பிஐபி 3 ஐ பயன்படுத்தி உலகளாவிய தொகுதி:

$ sudo pip3 நிறுவல் virtualenv

தேவையான அனைத்து தொகுதிகளையும் PIP3 பதிவிறக்கம் செய்து உலகளவில் நிறுவும்.

இந்த கட்டத்தில், பைதான் virtualenv தொகுதி உலகளவில் நிறுவப்பட வேண்டும்.

திட்ட கோப்பகத்தை உருவாக்கவும் பைதான்-செலினியம்-அடிப்படை/ உங்கள் தற்போதைய பணி அடைவில், பின்வருமாறு:

$ mkdir -pv பைதான்-செலினியம்-அடிப்படை/இயக்கிகள்

நீங்கள் புதிதாக உருவாக்கிய திட்டக் கோப்பகத்திற்குச் செல்லவும் பைதான்-செலினியம்-அடிப்படை/ , பின்வருமாறு:

$குறுவட்டுபைதான்-செலினியம்-அடிப்படை/

பின்வரும் கட்டளையுடன் உங்கள் திட்ட கோப்பகத்தில் ஒரு பைதான் மெய்நிகர் சூழலை உருவாக்கவும்:

$ virtualenv.பொறாமை

பைதான் மெய்நிகர் சூழல் இப்போது உங்கள் திட்டக் கோப்பகத்தில் உருவாக்கப்பட வேண்டும்.

பின்வரும் கட்டளை வழியாக உங்கள் திட்ட கோப்பகத்தில் பைதான் மெய்நிகர் சூழலை செயல்படுத்தவும்:

$ ஆதாரம்.பொறாமை/பின்/செயல்படுத்தவும்

நீங்கள் பார்க்க முடியும் என, இந்த திட்ட கோப்பகத்திற்காக பைதான் மெய்நிகர் சூழல் செயல்படுத்தப்படுகிறது.

செலினியம் பைதான் நூலகத்தை நிறுவுதல்

செலினியம் பைதான் நூலகம் அதிகாரப்பூர்வ பைதான் பைபிஐ களஞ்சியத்தில் கிடைக்கிறது.

பின்வருமாறு PIP 3 ஐப் பயன்படுத்தி இந்த நூலகத்தை நிறுவலாம்:

$ pip3 செலினியம் நிறுவவும்

செலினியம் பைதான் நூலகம் இப்போது நிறுவப்பட வேண்டும்.

இப்போது செலினியம் பைதான் நூலகம் நிறுவப்பட்ட பிறகு, நீங்கள் செய்ய வேண்டிய அடுத்த விஷயம் உங்களுக்கு பிடித்த வலை உலாவிக்கு ஒரு வலை இயக்கியை நிறுவ வேண்டும். இந்த கட்டுரையில், செலினியம் ஃபயர்பாக்ஸ் மற்றும் குரோம் வலை இயக்கிகளை எவ்வாறு நிறுவுவது என்பதை நான் உங்களுக்குக் காண்பிப்பேன்.

பயர்பாக்ஸ் கெக்கோ டிரைவரை நிறுவுதல்

பயர்பாக்ஸ் கெக்கோ டிரைவர் செலினியம் பயன்படுத்தி பயர்பாக்ஸ் வலை உலாவியை கட்டுப்படுத்த அல்லது தானியங்கி செய்ய உங்களை அனுமதிக்கிறது.

பயர்பாக்ஸ் கெக்கோ டிரைவரை பதிவிறக்கம் செய்ய, செல்க கிட்ஹப் மொஸில்லா/கெக்கோட்ரைவர் பக்கத்தை வெளியிடுகிறது ஒரு இணைய உலாவியில் இருந்து.

நீங்கள் பார்க்க முடியும் என, v0.26.0 இந்த கட்டுரை எழுதப்பட்ட நேரத்தில் பயர்பாக்ஸ் கெக்கோ டிரைவரின் சமீபத்திய பதிப்பாகும்.

பயர்பாக்ஸ் கெக்கோ டிரைவரை பதிவிறக்கம் செய்ய, உங்கள் இயக்க முறைமையின் கட்டமைப்பைப் பொறுத்து லினக்ஸ் கெக்கோட்ரைவர் tar.gz காப்பகத்தை சிறிது கீழே உருட்டி கிளிக் செய்யவும்.

நீங்கள் 32-பிட் இயங்குதளத்தைப் பயன்படுத்துகிறீர்கள் என்றால், கிளிக் செய்யவும் geckodriver-v0.26.0-linux32.tar.gz இணைப்பு

நீங்கள் 64-பிட் இயங்குதளத்தைப் பயன்படுத்துகிறீர்கள் என்றால், கிளிக் செய்யவும் geckodriver-v0.26.0-linuxx64.tar.gz இணைப்பு

என் விஷயத்தில், நான் பயர்பாக்ஸ் கெக்கோ டிரைவரின் 64-பிட் பதிப்பைப் பதிவிறக்குகிறேன்.

காப்பகத்தை சேமிக்க உங்கள் உலாவி உங்களைத் தூண்டும். தேர்ந்தெடுக்கவும் கோப்பை சேமி பின்னர் கிளிக் செய்யவும் சரி .

பயர்பாக்ஸ் கெக்கோ டிரைவர் காப்பகத்தை பதிவிறக்கம் செய்ய வேண்டும் ~/பதிவிறக்கங்கள் அடைவு

பிரித்தெடுக்கவும் geckodriver-v0.26.0-linux64.tar.gz இருந்து காப்பகம் ~/பதிவிறக்கங்கள் அடைவு ஓட்டுனர்கள்/ பின்வரும் கட்டளையை உள்ளிடுவதன் மூலம் உங்கள் திட்டத்தின் அடைவு:

$தார் -xzf/பதிவிறக்கங்கள்/geckodriver-v0.26.0-linux64.tar.gz-சிஓட்டுனர்கள்/

பயர்பாக்ஸ் கெக்கோ டிரைவர் காப்பகம் பிரித்தெடுக்கப்பட்டவுடன், ஒரு புதியது கெக்கோ டிரைவர் பைனரி கோப்பு உருவாக்கப்பட வேண்டும் ஓட்டுனர்கள்/ உங்கள் திட்டத்தின் அடைவு, கீழே உள்ள ஸ்கிரீன்ஷாட்டில் நீங்கள் பார்க்க முடியும்.

செலினியம் பயர்பாக்ஸ் கெக்கோ டிரைவரை சோதிக்கிறது

இந்த பிரிவில், பயர்பாக்ஸ் கெக்கோ டிரைவர் வேலை செய்கிறாரா என்பதை சோதிக்க உங்கள் முதல் செலினியம் பைதான் ஸ்கிரிப்டை எவ்வாறு அமைப்பது என்பதை நான் உங்களுக்குக் காண்பிப்பேன்.

முதலில், திட்ட கோப்பகத்தைத் திறக்கவும் பைதான்-செலினியம்-அடிப்படை/ உங்களுக்கு பிடித்த ஐடிஇ அல்லது எடிட்டருடன். இந்த கட்டுரையில், நான் விஷுவல் ஸ்டுடியோ குறியீட்டைப் பயன்படுத்துவேன்.

புதிய பைதான் ஸ்கிரிப்டை உருவாக்கவும் ex01.py , மற்றும் ஸ்கிரிப்டில் பின்வரும் வரிகளை தட்டச்சு செய்யவும்.

இருந்துசெலினியம்இறக்குமதிவெப் டிரைவர்
இருந்துசெலினியம்வெப் டிரைவர்.பொதுவான.விசைகள் இறக்குமதிவிசைகள்
இருந்து நேரம் இறக்குமதிதூங்கு
உலாவி=வெப் டிரைவர்.பயர்பாக்ஸ்(இயங்கக்கூடிய பாதை='./drivers/geckodriver')
உலாவிபெறு('http://www.google.com')
தூங்கு(5)
உலாவிவிட்டுவிட()

நீங்கள் முடித்தவுடன், சேமிக்கவும் ex01.py பைதான் ஸ்கிரிப்ட்.

இந்தக் கட்டுரையின் அடுத்த பகுதியில் குறியீட்டை விளக்குகிறேன்.

பின்வரும் வரியில் இருந்து ஃபயர்பாக்ஸ் கெக்கோ டிரைவரை பயன்படுத்த செலினியம் கட்டமைக்கப்படுகிறது ஓட்டுனர்கள்/ உங்கள் திட்டத்தின் அடைவு.

பயர்பாக்ஸ் கெக்கோ டிரைவர் செலினியத்துடன் வேலை செய்கிறாரா என்பதை சோதிக்க, பின்வருவனவற்றை இயக்கவும் ex01.py பைதான் ஸ்கிரிப்ட்:

$ python3 ex01.பை

பயர்பாக்ஸ் வலை உலாவி தானாகவே Google.com க்குச் சென்று 5 வினாடிகளுக்குப் பிறகு தன்னை மூட வேண்டும். இது நடந்தால், செலினியம் பயர்பாக்ஸ் கெக்கோ டிரைவர் சரியாக வேலை செய்கிறது.

Chrome இணைய இயக்கியை நிறுவுதல்

க்ரோம் வெப் டிரைவர் செலினியம் பயன்படுத்தி கூகுள் குரோம் இணைய உலாவியை கட்டுப்படுத்த அல்லது தானியங்கி செய்ய உங்களை அனுமதிக்கிறது.

உங்கள் Google Chrome இணைய உலாவியின் அதே பதிப்பை Chrome வலை இயக்கியின் பதிவிறக்கத்தையும் நீங்கள் பதிவிறக்க வேண்டும்.

உங்கள் Google Chrome இணைய உலாவியின் பதிப்பு எண்ணைக் கண்டுபிடிக்க, வருகை குரோம்: // அமைப்புகள்/உதவி Google Chrome இல். பதிப்பு எண் அதில் இருக்க வேண்டும் Chrome பற்றி பிரிவு, கீழே உள்ள ஸ்கிரீன்ஷாட்டில் நீங்கள் பார்க்க முடியும்.

என் விஷயத்தில், பதிப்பு எண் 83.0.4103.116 . பதிப்பு எண்ணின் முதல் மூன்று பாகங்கள் ( 83.0.4103 , என் விஷயத்தில்) குரோம் வலை இயக்கி பதிப்பு எண்ணின் முதல் மூன்று பகுதிகளுடன் பொருந்த வேண்டும்.

குரோம் வலை இயக்கியைப் பதிவிறக்க, இதைப் பார்வையிடவும் அதிகாரப்பூர்வ Chrome இயக்கி பதிவிறக்க பக்கம் .

இல் தற்போதைய வெளியீடுகள் பிரிவு, கூகிள் குரோம் வலை உலாவியின் தற்போதைய வெளியீடுகளுக்கான குரோம் வலை இயக்கி கிடைக்கும், நீங்கள் கீழே உள்ள ஸ்கிரீன்ஷாட்டில் பார்க்கலாம்.

நீங்கள் பயன்படுத்தும் கூகுள் குரோம் பதிப்பு இல்லை என்றால் தற்போதைய வெளியீடுகள் பிரிவு, கொஞ்சம் கீழே உருட்டவும், நீங்கள் விரும்பிய பதிப்பை நீங்கள் கண்டுபிடிக்க வேண்டும்.

நீங்கள் சரியான Chrome இணைய இயக்கி பதிப்பைக் கிளிக் செய்தவுடன், அது பின்வரும் பக்கத்திற்கு உங்களை அழைத்துச் செல்லும். என்பதை கிளிக் செய்யவும் chromedriver_linux64.zip இணைப்பு, கீழே உள்ள ஸ்கிரீன்ஷாட்டில் குறிப்பிடப்பட்டுள்ளது.

Chrome வலை இயக்கி காப்பகம் இப்போது பதிவிறக்கம் செய்யப்பட வேண்டும்.

குரோம் வெப் டிரைவர் காப்பகம் இப்போது பதிவிறக்கம் செய்யப்பட வேண்டும் ~/பதிவிறக்கங்கள் அடைவு

நீங்கள் பிரித்தெடுக்கலாம் chromedriver-linux64.zip இருந்து காப்பகம் ~/பதிவிறக்கங்கள் அடைவு ஓட்டுனர்கள்/ பின்வரும் கட்டளையுடன் உங்கள் திட்டத்தின் அடைவு:

$ unzip/பதிவிறக்கங்கள்/chromedriver_linux64.ஜிப்-டி டிரைவர்கள்/

குரோம் வலை இயக்கி காப்பகம் பிரித்தெடுக்கப்பட்டவுடன், புதியது குரோமெட்ரைவர் பைனரி கோப்பு உருவாக்கப்பட வேண்டும் ஓட்டுனர்கள்/ உங்கள் திட்டத்தின் அடைவு, கீழே உள்ள ஸ்கிரீன்ஷாட்டில் நீங்கள் பார்க்க முடியும்.

செலினியம் குரோம் வலை இயக்கி சோதனை

இந்த பிரிவில், Chrome வலை இயக்கி வேலை செய்கிறதா என்பதை சோதிக்க உங்கள் முதல் செலினியம் பைதான் ஸ்கிரிப்டை எவ்வாறு அமைப்பது என்பதை நான் உங்களுக்குக் காண்பிப்பேன்.

முதலில், புதிய பைதான் ஸ்கிரிப்டை உருவாக்கவும் ex02.py மற்றும் ஸ்கிரிப்டில் பின்வரும் வரிகளின் குறியீடுகளை தட்டச்சு செய்யவும்.

இருந்துசெலினியம்இறக்குமதிவெப் டிரைவர்
இருந்துசெலினியம்வெப் டிரைவர்.பொதுவான.விசைகள் இறக்குமதிவிசைகள்
இருந்து நேரம் இறக்குமதிதூங்கு
உலாவி=வெப் டிரைவர்.குரோம்(இயங்கக்கூடிய பாதை='./drivers/chromedriver')
உலாவிபெறு('http://www.google.com')
தூங்கு(5)
உலாவிவிட்டுவிட()

நீங்கள் முடித்தவுடன், சேமிக்கவும் ex02.py பைதான் ஸ்கிரிப்ட்.

இந்தக் கட்டுரையின் அடுத்த பகுதியில் குறியீட்டை விளக்குகிறேன்.

பின்வரும் வரிசையில் இருந்து க்ரோம் வெப் டிரைவரை பயன்படுத்த செலினியம் கட்டமைக்கப்படுகிறது ஓட்டுனர்கள்/ உங்கள் திட்டத்தின் அடைவு.

க்ரோம் வெப் டிரைவர் செலினியத்துடன் வேலை செய்கிறாரா என்பதை சோதிக்க, இயக்கவும் ex02.py பைதான் ஸ்கிரிப்ட், பின்வருமாறு:

$ python3 ex01.பை

கூகுள் குரோம் இணைய உலாவி தானாகவே கூகுள்.காம் சென்று 5 வினாடிகளுக்கு பிறகு தன்னை மூட வேண்டும். இது நடந்தால், செலினியம் பயர்பாக்ஸ் கெக்கோ டிரைவர் சரியாக வேலை செய்கிறது.

செலினியத்துடன் வலை ஸ்கிராப்பிங்கின் அடிப்படைகள்

நான் இனிமேல் பயர்பாக்ஸ் இணைய உலாவியைப் பயன்படுத்துகிறேன். நீங்கள் விரும்பினால், நீங்கள் Chrome ஐயும் பயன்படுத்தலாம்.

ஒரு அடிப்படை செலினியம் பைதான் ஸ்கிரிப்ட் கீழே உள்ள ஸ்கிரீன்ஷாட்டில் காட்டப்பட்டுள்ள ஸ்கிரிப்ட் போல இருக்க வேண்டும்.

முதலில், செலினியம் இறக்குமதி வெப் டிரைவர் இருந்து செலினியம் தொகுதி

அடுத்து, இறக்குமதி விசைகள் இருந்து செலினியம்.வெப்ட்ரைவர்.காம் மோன்.கீஸ் . நீங்கள் செலினியத்திலிருந்து தானியங்கி செய்யும் உலாவிக்கு விசைப்பலகை விசை அழுத்தங்களை அனுப்ப இது உதவும்.

பின்வரும் வரி a ஐ உருவாக்குகிறது உலாவி பயர்பாக்ஸ் கெக்கோ டிரைவர் (வெப்ட்ரைவர்) பயன்படுத்தி பயர்பாக்ஸ் வலை உலாவிக்கான பொருள். இந்த பொருளைப் பயன்படுத்தி பயர்பாக்ஸ் உலாவி செயல்களை நீங்கள் கட்டுப்படுத்தலாம்.

ஒரு வலைத்தளம் அல்லது URL ஐ ஏற்ற (நான் வலைத்தளத்தை ஏற்றுவேன் https://www.duckduckgo.com ), அழைக்கவும் பெறு() இன் முறை உலாவி உங்கள் பயர்பாக்ஸ் உலாவியில் பொருள்.

செலினியம் பயன்படுத்தி, நீங்கள் உங்கள் சோதனைகளை எழுதலாம், வலை ஸ்கிராப்பிங் செய்யலாம், இறுதியாக, பயன்படுத்தி உலாவியை மூடலாம் விட்டுவிட() இன் முறை உலாவி பொருள்

மேலே ஒரு செலினியம் பைதான் ஸ்கிரிப்டின் அடிப்படை அமைப்பு உள்ளது. இந்த வரிகளை உங்கள் செலினியம் பைதான் ஸ்கிரிப்ட்களில் எழுதுவீர்கள்.

எடுத்துக்காட்டு 1: ஒரு வலைப்பக்கத்தின் தலைப்பை அச்சிடுதல்

செலினியம் பயன்படுத்தி விவாதிக்கப்பட்ட எளிதான உதாரணம் இதுவாகும். இந்த எடுத்துக்காட்டில், நாங்கள் பார்வையிடும் வலைப்பக்கத்தின் தலைப்பை அச்சிடுவோம்.

புதிய கோப்பை உருவாக்கவும் ex04.py மேலும் பின்வரும் குறியீடுகளின் வரிகளை அதில் தட்டச்சு செய்யவும்.

இருந்துசெலினியம்இறக்குமதிவெப் டிரைவர்
இருந்துசெலினியம்வெப் டிரைவர்.பொதுவான.விசைகள் இறக்குமதிவிசைகள்

உலாவி=வெப் டிரைவர்.பயர்பாக்ஸ்(இயங்கக்கூடிய பாதை='./drivers/geckodriver')

உலாவிபெறு('https://www.duckduckgo.com')
அச்சு('தலைப்பு: %s'% உலாவி.தலைப்பு)
உலாவிவிட்டுவிட()

நீங்கள் முடித்தவுடன், கோப்பை சேமிக்கவும்.

இங்கே, தி உலாவி.தலைப்பு பார்வையிடப்பட்ட வலைப்பக்கத்தின் தலைப்பை அணுக மற்றும் பயன்படுத்தப்படுகிறது அச்சு () கன்சோலில் தலைப்பை அச்சிட செயல்பாடு பயன்படுத்தப்படும்.

இயங்கிய பிறகு ex04.py ஸ்கிரிப்ட், இது வேண்டும்:

1) பயர்பாக்ஸைத் திறக்கவும்
2) நீங்கள் விரும்பிய வலைப்பக்கத்தை ஏற்றவும்
3) பக்கத்தின் தலைப்பைப் பெறுங்கள்
4) தலைப்பை கன்சோலில் அச்சிடவும்
5) இறுதியாக, உலாவியை மூடவும்

நீங்கள் பார்க்க முடியும் என, தி ex04.py ஸ்கிரிப்ட் வலைப்பக்கத்தின் தலைப்பை கன்சோலில் நன்றாக அச்சிட்டது.

$ python3 ex04.பை

எடுத்துக்காட்டு 2: பல வலைப்பக்கங்களின் தலைப்புகளை அச்சிடுதல்

முந்தைய உதாரணத்தைப் போலவே, பைதான் வளையத்தைப் பயன்படுத்தி பல வலைப்பக்கங்களின் தலைப்பை அச்சிட அதே முறையைப் பயன்படுத்தலாம்.

இது எப்படி வேலை செய்கிறது என்பதைப் புரிந்து கொள்ள, புதிய பைதான் ஸ்கிரிப்டை உருவாக்கவும் ex05.py ஸ்கிரிப்டில் பின்வரும் குறியீட்டு வரிகளை தட்டச்சு செய்க:

இருந்துசெலினியம்இறக்குமதிவெப் டிரைவர்
இருந்துசெலினியம்வெப் டிரைவர்.பொதுவான.விசைகள் இறக்குமதிவிசைகள்

உலாவி=வெப் டிரைவர்.பயர்பாக்ஸ்(இயங்கக்கூடிய பாதை='./drivers/geckodriver')


URL கள்= ['https://www.duckduckgo.com', 'https://linuxhint.com', 'https://yahoo.com']
க்கானURLஇல்URL கள்:
உலாவிபெறு(URL)
அச்சு('தலைப்பு: %s'% உலாவி.தலைப்பு)
உலாவிவிட்டுவிட()

நீங்கள் முடித்தவுடன், பைதான் ஸ்கிரிப்டை சேமிக்கவும் ex05.py .

இங்கே, தி URL கள் பட்டியல் ஒவ்வொரு வலைப்பக்கத்தின் URL ஐ வைத்திருக்கிறது.

TO க்கான லூப் மூலம் மீண்டும் செய்ய பயன்படுத்தப்படுகிறது URL கள் பொருட்களை பட்டியலிடுங்கள்.

ஒவ்வொரு மறு செய்கையிலும், செலினியம் உலாவியைப் பார்வையிடச் சொல்கிறது URL மற்றும் வலைப்பக்கத்தின் தலைப்பைப் பெறுங்கள். வலைப்பக்கத்தின் தலைப்பை செலினியம் பிரித்தெடுத்தவுடன், அது கன்சோலில் அச்சிடப்படும்.

பைதான் ஸ்கிரிப்டை இயக்கவும் ex05.py , மற்றும் ஒவ்வொரு வலைப்பக்கத்தின் தலைப்பையும் நீங்கள் பார்க்க வேண்டும் URL கள் பட்டியல்

$ python3 ex05.பை

செலினியம் ஒரே வேலையை பல வலைப்பக்கங்கள் அல்லது வலைத்தளங்களுடன் எவ்வாறு செய்ய முடியும் என்பதற்கு இது ஒரு எடுத்துக்காட்டு.

எடுத்துக்காட்டு 3: ஒரு வலைப்பக்கத்திலிருந்து தரவைப் பிரித்தெடுத்தல்

இந்த எடுத்துக்காட்டில், செலினியம் பயன்படுத்தி வலைப்பக்கங்களிலிருந்து தரவைப் பிரித்தெடுக்கும் அடிப்படைகளை நான் உங்களுக்குக் காண்பிப்பேன். இது வெப் ஸ்கிராப்பிங் என்றும் அழைக்கப்படுகிறது.

முதலில், வருகை Random.org பயர்பாக்ஸிலிருந்து இணைப்பு. கீழேயுள்ள ஸ்கிரீன்ஷாட்டில் நீங்கள் பார்க்கிறபடி, பக்கம் சீரற்ற சரத்தை உருவாக்க வேண்டும்.

சீரற்ற சரம் தரவை செலினியம் பயன்படுத்தி பிரித்தெடுக்க, நீங்கள் தரவின் HTML பிரதிநிதித்துவத்தையும் அறிந்திருக்க வேண்டும்.

சீரற்ற சரம் தரவு HTML இல் எவ்வாறு குறிப்பிடப்படுகிறது என்பதைப் பார்க்க, சீரற்ற சரம் தரவைத் தேர்ந்தெடுத்து வலது சுட்டி பொத்தானை (RMB) அழுத்தவும் மற்றும் கிளிக் செய்யவும் உறுப்பை ஆய்வு (கே) , கீழே உள்ள ஸ்கிரீன்ஷாட்டில் குறிப்பிடப்பட்டுள்ளபடி.

தரவின் HTML பிரதிநிதித்துவம் இதில் காட்டப்பட வேண்டும் இன்ஸ்பெக்டர் தாவல், கீழே உள்ள ஸ்கிரீன்ஷாட்டில் நீங்கள் பார்க்க முடியும்.

நீங்கள் அதையும் கிளிக் செய்யலாம் ஐகானை ஆய்வு செய்யவும் ( ) பக்கத்திலிருந்து தரவை ஆய்வு செய்ய.

ஆய்வு ஐகானைக் கிளிக் செய்யவும் () மற்றும் நீங்கள் பிரித்தெடுக்க விரும்பும் சீரற்ற சரம் தரவின் மீது வட்டமிடுங்கள். தரவின் HTML பிரதிநிதித்துவம் முன்பு போல் காட்டப்பட வேண்டும்.

நீங்கள் பார்க்க முடியும் என, சீரற்ற சரம் தரவு ஒரு HTML இல் மூடப்பட்டிருக்கும் க்கான குறிச்சொல் மற்றும் வகுப்பைக் கொண்டுள்ளது தகவல்கள் .

இப்போது நாம் பிரித்தெடுக்க விரும்பும் தரவின் HTML பிரதிநிதித்துவம் நமக்குத் தெரியும், செலினியம் பயன்படுத்தி தரவைப் பிரித்தெடுக்க ஒரு பைதான் ஸ்கிரிப்டை உருவாக்குவோம்.

புதிய பைதான் ஸ்கிரிப்டை உருவாக்கவும் ex06.py ஸ்கிரிப்டில் பின்வரும் குறியீடுகளின் வரிகளை தட்டச்சு செய்யவும்

இருந்துசெலினியம்இறக்குமதிவெப் டிரைவர்
இருந்துசெலினியம்வெப் டிரைவர்.பொதுவான.விசைகள் இறக்குமதிவிசைகள்

உலாவி=வெப் டிரைவர்.பயர்பாக்ஸ்(இயங்கக்கூடிய பாதை='./drivers/geckodriver')

உலாவிபெறு('https://www.random.org/strings/?num=1&len=20&digits
= on & upperalpha = on & loweralpha = on & unique = on & format = html & rnd = new '
)

தரவு உறுப்பு=உலாவிகண்டுபிடிக்க_எலமெண்ட்_சிஎஸ்_செலக்டர் மூலம்('pre.data')
அச்சு(தரவு உறுப்பு.உரை)
உலாவிவிட்டுவிட()

நீங்கள் முடித்தவுடன், சேமிக்கவும் ex06.py பைதான் ஸ்கிரிப்ட்.

இங்கே, தி browser.get () முறை பயர்பாக்ஸ் உலாவியில் வலைப்பக்கத்தை ஏற்றுகிறது.

தி browser.find_element_by_css_selector () முறை குறிப்பிட்ட உறுப்புக்காக பக்கத்தின் HTML குறியீட்டைத் தேடி அதைத் தருகிறது.

இந்த வழக்கில், உறுப்பு இருக்கும் முன் தரவு , தி க்கான வர்க்கப் பெயரைக் கொண்ட குறிச்சொல் தகவல்கள் .

கீழே, தி முன் தரவு உறுப்பு சேமிக்கப்பட்டுள்ளது தரவு உறுப்பு மாறி.

ஸ்கிரிப்ட் தேர்ந்தெடுக்கப்பட்ட உரை உள்ளடக்கத்தை அச்சிடுகிறது முன் தரவு உறுப்பு

நீங்கள் இயக்கினால் ex06.py பைதான் ஸ்கிரிப்ட், இது கீழேயுள்ள ஸ்கிரீன்ஷாட்டில் நீங்கள் காணும் வகையில், வலைப்பக்கத்திலிருந்து சீரற்ற சரம் தரவைப் பிரித்தெடுக்க வேண்டும்.

$ python3 ex06.பை

நீங்கள் பார்க்க முடியும் என, ஒவ்வொரு முறையும் நான் இயக்குகிறேன் ex06.py பைதான் ஸ்கிரிப்ட், இது வலைப்பக்கத்திலிருந்து வேறுபட்ட சீரற்ற சரம் தரவைப் பிரித்தெடுக்கிறது.

எடுத்துக்காட்டு 4: வலைப்பக்கத்திலிருந்து தரவின் பட்டியலைப் பிரித்தெடுத்தல்

முந்தைய உதாரணம், செலினியம் பயன்படுத்தி ஒரு வலைப்பக்கத்திலிருந்து ஒரு ஒற்றை தரவு உறுப்பை எவ்வாறு பிரித்தெடுப்பது என்பதைக் காட்டியது. இந்த எடுத்துக்காட்டில், ஒரு வலைப்பக்கத்திலிருந்து தரவுகளின் பட்டியலைப் பிரித்தெடுக்க செலினியம் எவ்வாறு பயன்படுத்துவது என்பதை நான் உங்களுக்குக் காண்பிப்பேன்.

முதலில், வருகை random-name-generator.info உங்கள் பயர்பாக்ஸ் இணைய உலாவியில் இருந்து. கீழேயுள்ள ஸ்கிரீன்ஷாட்டில் நீங்கள் பார்க்கும் போது, ​​ஒவ்வொரு முறையும் நீங்கள் பக்கத்தை மீண்டும் ஏற்றும்போது இந்த வலைத்தளம் பத்து சீரற்ற பெயர்களை உருவாக்கும். இந்த சீரற்ற பெயர்களை செலினியம் பயன்படுத்தி பிரித்தெடுப்பதே எங்கள் குறிக்கோள்.

நீங்கள் இன்னும் நெருக்கமாக பெயர் பட்டியலை ஆய்வு செய்தால், அது ஒரு ஆர்டர் செய்யப்பட்ட பட்டியல் என்பதை நீங்கள் காணலாம் ( இறக்க குறிச்சொல்). தி இறக்க குறிச்சொல் வகுப்பின் பெயரையும் உள்ளடக்கியது பெயர் பட்டியல் . ஒவ்வொரு சீரற்ற பெயர்களும் பட்டியல் உருப்படியாக குறிப்பிடப்படுகின்றன ( இல் டேக்) உள்ளே இறக்க குறிச்சொல்.

இந்த சீரற்ற பெயர்களை பிரித்தெடுக்க, புதிய பைதான் ஸ்கிரிப்டை உருவாக்கவும் ex07.py ஸ்கிரிப்டில் பின்வரும் குறியீடுகளின் வரிகளை தட்டச்சு செய்யவும்.

இருந்துசெலினியம்இறக்குமதிவெப் டிரைவர்
இருந்துசெலினியம்வெப் டிரைவர்.பொதுவான.விசைகள் இறக்குமதிவிசைகள்

உலாவி=வெப் டிரைவர்.பயர்பாக்ஸ்(இயங்கக்கூடிய பாதை='./drivers/geckodriver')

உலாவிபெறு('http://random-name-generator.info/')

பெயர் பட்டியல்=உலாவிசிஎக்ஸ்_செலெக்டர் மூலம்_தொகுப்புகளைக் கண்டறியவும்('ol.nameList li')

க்கானபெயர்இல்பெயர் பட்டியல்:
அச்சு(பெயர்உரை)

உலாவிவிட்டுவிட()

நீங்கள் முடித்தவுடன், சேமிக்கவும் ex07.py பைதான் ஸ்கிரிப்ட்.

இங்கே, தி browser.get () முறை பயர்பாக்ஸ் உலாவியில் சீரற்ற பெயர் ஜெனரேட்டர் வலைப்பக்கத்தை ஏற்றுகிறது.

தி browser.find_elements_by_css_selector () முறை CSS தேர்வாளரைப் பயன்படுத்துகிறது ol.nameList லி அனைத்தையும் கண்டுபிடிக்க இல் உள்ளே உள்ள கூறுகள் இறக்க வகுப்பு பெயரைக் கொண்ட டேக் பெயர் பட்டியல் . நான் தேர்ந்தெடுத்த அனைத்தையும் சேமித்து வைத்துள்ளேன் இல் உள்ள கூறுகள் பெயர் பட்டியல் மாறி.

TO க்கான லூப் மூலம் மீண்டும் செய்ய பயன்படுத்தப்படுகிறது பெயர் பட்டியல் பட்டியல் இல் கூறுகள் ஒவ்வொரு மறு செய்கையிலும், உள்ளடக்கம் இல் உறுப்பு கன்சோலில் அச்சிடப்பட்டுள்ளது.

நீங்கள் இயக்கினால் ex07.py பைதான் ஸ்கிரிப்ட், இது அனைத்து சீரற்ற பெயர்களையும் வலைப்பக்கத்திலிருந்து பெற்று திரையில் அச்சிடும், கீழே உள்ள ஸ்கிரீன்ஷாட்டில் நீங்கள் பார்க்க முடியும்.

$ python3 ex07.பை

நீங்கள் ஸ்கிரிப்டை இரண்டாவது முறையாக இயக்கினால், கீழேயுள்ள ஸ்கிரீன்ஷாட்டில் நீங்கள் காணக்கூடியபடி, சீரற்ற பயனர் பெயர்களின் புதிய பட்டியலை அது கொடுக்க வேண்டும்.

எடுத்துக்காட்டு 5: சமர்ப்பிக்கும் படிவம் - DuckDuckGo இல் தேடுகிறது

இந்த உதாரணம் முதல் உதாரணத்தைப் போலவே எளிமையானது. இந்த எடுத்துக்காட்டில், நான் DuckDuckGo தேடுபொறியைப் பார்வையிடுவேன் செலினியம் hq செலினியம் பயன்படுத்தி.

முதலில், வருகை டக் டக் கோ தேடுபொறி பயர்பாக்ஸ் வலை உலாவியில் இருந்து.

தேடல் உள்ளீட்டு புலத்தை நீங்கள் ஆய்வு செய்தால், அதில் ஐடி இருக்க வேண்டும் Search_form_input_homepage , கீழே உள்ள ஸ்கிரீன்ஷாட்டில் நீங்கள் பார்க்க முடியும்.

இப்போது, ​​புதிய பைதான் ஸ்கிரிப்டை உருவாக்கவும் ex08.py ஸ்கிரிப்டில் பின்வரும் குறியீடுகளின் வரிகளை தட்டச்சு செய்யவும்.

இருந்துசெலினியம்இறக்குமதிவெப் டிரைவர்
இருந்துசெலினியம்வெப் டிரைவர்.பொதுவான.விசைகள் இறக்குமதிவிசைகள்
உலாவி=வெப் டிரைவர்.பயர்பாக்ஸ்(இயங்கக்கூடிய பாதை='./drivers/geckodriver')
உலாவிபெறு('https://duckduckgo.com/')
தேடல் உள்ளீடு=உலாவிகண்டுபிடிப்பு_உருவாக்கம்('search_form_input_homepage')
தேடல் உள்ளீடு.அனுப்பு_கீகள்('செலினியம் hq'+ விசைகள்.உள்ளிடுக)

நீங்கள் முடித்தவுடன், சேமிக்கவும் ex08.py பைதான் ஸ்கிரிப்ட்.

இங்கே, தி browser.get () இந்த முறை பயர்பாக்ஸ் இணைய உலாவியில் டக் டக் கோ தேடுபொறியின் முகப்புப்பக்கத்தை ஏற்றுகிறது.

தி browser.find_element_by_id () முறை ஐடியுடன் உள்ளீட்டு உறுப்பைத் தேர்ந்தெடுக்கிறது Search_form_input_homepage மற்றும் அதை சேமித்து வைக்கிறது தேடல் உள்ளீடு மாறி.

தி searchInput.send_keys () உள்ளீட்டு புலத்திற்கு விசை அழுத்த தரவு அனுப்ப இந்த முறை பயன்படுத்தப்படுகிறது. இந்த எடுத்துக்காட்டில், அது சரத்தை அனுப்புகிறது செலினியம் hq , மற்றும் Enter விசையை பயன்படுத்தி அழுத்தப்படுகிறது விசைகள் நிலையான

DuckDuckGo தேடுபொறி Enter விசையை பெற்றவுடன் ( விசைகள் ), அது முடிவைத் தேடி காட்டுகிறது.

இயக்கவும் ex08.py பைதான் ஸ்கிரிப்ட், பின்வருமாறு:

$ python3 ex08.பை

நீங்கள் பார்க்க முடியும் என, பயர்பாக்ஸ் இணைய உலாவி டக் டக் கோ தேடுபொறியைப் பார்வையிட்டது.

அது தானாகவே தட்டச்சு செய்தது செலினியம் hq தேடல் உரை பெட்டியில்.

உலாவி பெற்றவுடன் Enter விசையை அழுத்தவும் ( விசைகள் ), அது தேடல் முடிவைக் காட்டுகிறது.

எடுத்துக்காட்டு 6: W3Schools.com இல் ஒரு படிவத்தை சமர்ப்பித்தல்

உதாரணம் 5 இல், DuckDuckGo தேடுபொறி படிவத்தை சமர்ப்பிப்பது எளிது. நீங்கள் செய்ய வேண்டியது Enter விசையை அழுத்தினால் போதும். ஆனால் அனைத்து படிவ சமர்ப்பிப்புகளுக்கும் இது இருக்காது. இந்த எடுத்துக்காட்டில், மிகவும் சிக்கலான படிவத்தைக் கையாளுவதை நான் உங்களுக்குக் காண்பிப்பேன்.

முதலில், வருகை W3Schools.com இன் HTML படிவங்கள் பக்கம் பயர்பாக்ஸ் வலை உலாவியில் இருந்து. பக்கம் ஏற்றப்பட்டவுடன், நீங்கள் ஒரு எடுத்துக்காட்டு படிவத்தைப் பார்க்க வேண்டும். இந்த எடுத்துக்காட்டில் நாங்கள் சமர்ப்பிக்கும் படிவம் இது.

நீங்கள் படிவத்தை ஆய்வு செய்தால், தி முதல் பெயர் உள்ளீட்டு புலத்தில் ஐடி இருக்க வேண்டும் பெயர் , தி கடைசி பெயர் உள்ளீட்டு புலத்தில் ஐடி இருக்க வேண்டும் பெயர் , மற்றும் இந்த சமர்ப்பி பொத்தான் வேண்டும் வகை சமர்ப்பிக்க , கீழே உள்ள ஸ்கிரீன்ஷாட்டில் நீங்கள் பார்க்க முடியும்.

செலினியம் பயன்படுத்தி இந்த படிவத்தை சமர்ப்பிக்க, புதிய பைதான் ஸ்கிரிப்டை உருவாக்கவும் ex09.py ஸ்கிரிப்டில் பின்வரும் குறியீடுகளின் வரிகளை தட்டச்சு செய்யவும்.

இருந்துசெலினியம்இறக்குமதிவெப் டிரைவர்
இருந்துசெலினியம்வெப் டிரைவர்.பொதுவான.விசைகள் இறக்குமதிவிசைகள்
உலாவி=வெப் டிரைவர்.பயர்பாக்ஸ்(இயங்கக்கூடிய பாதை='./drivers/geckodriver')
உலாவிபெறு('https://www.w3schools.com/html/html_forms.asp')
பெயர்=உலாவிகண்டுபிடிப்பு_உருவாக்கம்('பெயர்')
பெயர்.தெளிவான()
பெயர்.அனுப்பு_கீகள்('ஷாஹாரியார்')
பெயர்=உலாவிகண்டுபிடிப்பு_உருவாக்கம்('பெயர்')
பெயர்தெளிவான()
பெயர்அனுப்பு_கீகள்('ஷோவன்')
சமர்ப்பி பட்டன்=உலாவிகண்டுபிடிக்க_எலமெண்ட்_சிஎஸ்_செலக்டர் மூலம்('உள்ளீடு [type =' submit ']')
சமர்ப்பி பட்டன்.அனுப்பு_கீகள்(விசைகள்.உள்ளிடுக)

நீங்கள் முடித்தவுடன், சேமிக்கவும் ex09.py பைதான் ஸ்கிரிப்ட்.

இங்கே, தி browser.get () முறை பயர்பாக்ஸ் வலை உலாவியில் W3schools HTML படிவங்கள் பக்கத்தைத் திறக்கிறது.

தி browser.find_element_by_id () முறை ஐடி மூலம் உள்ளீட்டு புலங்களைக் கண்டுபிடிக்கும் பெயர் மற்றும் பெயர் அது அவற்றை சேமித்து வைக்கிறது பெயர் மற்றும் பெயர் மாறிகள், முறையே.

தி fname.clear () மற்றும் lname.clear () இயல்புநிலை முதல் பெயரை அழிக்கும் முறைகள் (ஜான்) பெயர் மதிப்பு மற்றும் கடைசி பெயர் (டூ) பெயர் உள்ளீட்டு புலங்களிலிருந்து மதிப்பு.

தி fname.send_keys () மற்றும் lname.send_keys () முறைகள் வகை ஷாஹாரியார் மற்றும் ஷோவன் இல் முதல் பெயர் மற்றும் கடைசி பெயர் உள்ளீட்டு புலங்கள், முறையே.

தி browser.find_element_by_css_selector () முறை தேர்ந்தெடுக்கிறது சமர்ப்பி பொத்தான் படிவத்தில் மற்றும் அதை சேமித்து வைக்கிறது சமர்ப்பி பட்டன் மாறி.

தி submitButton.send_keys () முறை Enter விசை அழுத்தத்தை அனுப்புகிறது ( விசைகள் ) க்கு சமர்ப்பி பொத்தான் படிவத்தின். இந்த நடவடிக்கை படிவத்தை சமர்ப்பிக்கிறது.

இயக்கவும் ex09.py பைதான் ஸ்கிரிப்ட், பின்வருமாறு:

$ python3 ex09.பை

நீங்கள் பார்க்க முடியும் என, படிவம் தானாக சரியான உள்ளீடுகளுடன் சமர்ப்பிக்கப்பட்டது.

முடிவுரை

இந்த கட்டுரை பைத்தானில் உள்ள செலினியம் உலாவி சோதனை, வலை ஆட்டோமேஷன் மற்றும் வலை ஸ்கிராப்பிங் நூலகங்களுடன் தொடங்க உதவும். மேலும் தகவலுக்கு, பார்க்கவும் அதிகாரப்பூர்வ செலினியம் பைதான் ஆவணம் .