Cara Mendapatkan URL Saat Ini dengan Selenium

How Get Current Url With Selenium



Selenium adalah alat untuk pengujian browser, otomatisasi web, dan pengikisan web. Saat mengerjakan proyek Selenium Anda, Anda mungkin perlu mengetahui URL halaman yang ditampilkan oleh browser web yang dikontrol Selenium Anda. Informasi ini mungkin berguna untuk melacak URL tempat Anda mengekstrak beberapa data sehingga Anda dapat memperbarui data secara otomatis menggunakan beberapa skrip.

Pada artikel ini, saya akan menunjukkan cara mendapatkan URL browser saat ini dengan Selenium. Jadi, mari kita mulai.







Prasyarat:

Untuk mencoba perintah dan contoh artikel ini, Anda harus memiliki,



1) Distribusi Linux (sebaiknya Ubuntu) diinstal pada komputer Anda.
2) Python 3 diinstal di komputer Anda.
3) PIP 3 diinstal pada komputer Anda.
4) Python virtualenv paket yang diinstal pada komputer Anda.
5) Mozilla Firefox atau browser web Google Chrome terpasang di komputer Anda.
6) Harus tahu cara menginstal Firefox Gecko Driver atau Chrome Web Driver.



Untuk memenuhi syarat 4, 5, dan 6 silahkan baca artikel saya Pengenalan Selenium dengan Python 3 di Linuxhint.com.





Anda dapat menemukan banyak artikel tentang topik lain di LinuxHint.com . Pastikan untuk memeriksanya jika Anda memerlukan bantuan.

Menyiapkan Direktori Proyek:

Untuk menjaga semuanya tetap teratur, buat direktori proyek baru selenium-url/ sebagai berikut:



$mkdir -pvselenium-url/pengemudi

Navigasikan ke selenium-url/ direktori proyek sebagai berikut:

$CDselenium-url/

Buat lingkungan virtual Python di direktori proyek sebagai berikut:

$virtualenv .venv

Aktifkan lingkungan virtual sebagai berikut:

$sumber.venv/NS/mengaktifkan

Instal pustaka Selenium Python di lingkungan virtual Anda menggunakan PIP3 sebagai berikut:

$pip3 instal selenium

Unduh dan instal semua driver web yang diperlukan di pengemudi/ direktori proyek. Saya telah menjelaskan proses mengunduh dan menginstal driver web di artikel saya Pengenalan Selenium dengan Python 3 . Jika Anda memerlukan bantuan, cari di LinuxHint.com untuk artikel itu.

Saya akan menggunakan browser web Google Chrome untuk demonstrasi di artikel ini. Jadi, saya akan menggunakan chromedriver biner dengan Selenium. Anda harus menggunakan pengemudi tokek biner jika Anda ingin menggunakan browser web Firefox.

Buat skrip Python ex01.py di direktori proyek Anda dan ketik baris kode berikut di dalamnya.

dariseleniumimporwebdriver
dariselenium.webdriver.umum.kunci imporKunci
pilihan=webdriver.Opsi Chrome()
pilihan.tanpa kepala = benar
peramban=webdriver.Chrome(executable_path='./driver/chromedriver',pilihan=pilihan)
peramban.Dapatkan('https://duckduckgo.com/')
mencetak(peramban.url_saat ini)
peramban.Menutup()

Setelah selesai, simpan ex01.py skrip piton.

Di sini, baris 1 dan baris 2 mengimpor semua komponen yang diperlukan dari pustaka Python Selenium.

Baris 4 membuat objek Opsi Chrome, dan baris 5 mengaktifkan mode tanpa kepala untuk browser web Chrome.

Baris 7 membuat Chrome peramban objek menggunakan chromedriver biner dari pengemudi/ direktori proyek.

Baris 9 memberitahu browser untuk memuat situs web duckduckgo.com.

Baris 10 mencetak URL browser saat ini. Di Sini, browser.current_url properti digunakan untuk mengakses URL browser saat ini.

Baris 12 menutup browser.

Jalankan skrip Python ex01.py sebagai berikut:

$ python3 ex01.py

Seperti yang Anda lihat, URL saat ini ( https://duckduckgo.com ) dicetak di konsol.

Pada contoh sebelumnya, saya telah mengunjungi situs web duckduckgo.com dan mencetak URL saat ini di konsol. Ini mengembalikan URL halaman yang kita kunjungi. Tidak terlalu mewah karena kita sudah mengetahui URL halaman. Sekarang, mari cari sesuatu di DuckDuckGo dan coba cetak URL halaman hasil pencarian di konsol.

Buat skrip Python ex02.py di direktori proyek Anda dan ketik baris kode berikut di dalamnya.

dariseleniumimporwebdriver
dariselenium.webdriver.umum.kunci imporKunci
pilihan=webdriver.Opsi Chrome()
pilihan.tanpa kepala = benar
peramban=webdriver.Chrome(executable_path='./driver/chromedriver',pilihan=pilihan)
peramban.Dapatkan('https://duckduckgo.com/')
mencetak(peramban.url_saat ini)
cariInput=peramban.temukan_elemen_oleh_id('search_form_input_homepage')
cariMasukan.send_keys('selenium terbaik'+ Kunci.MEMASUKI)
mencetak(peramban.url_saat ini)
peramban.Menutup()

Setelah selesai, simpan ex02.py skrip piton.

Di sini, baris 1-10 sama dengan di ex01.py . Jadi, saya tidak menjelaskannya lagi.

Baris 12 menemukan kotak teks pencarian dan menyimpannya di cariInput variabel.

Baris 13 mengirimkan permintaan pencarian selenium terbaik dalam cariInput kotak teks dan menekan tombol kunci menggunakan Kunci.ENTER .

Setelah halaman pencarian dimuat, browser.current_url digunakan untuk mengakses URL saat ini yang diperbarui.

Baris 15 mencetak URL terkini yang diperbarui di konsol.

Baris 17 menutup browser.

Jalankan ex02.py Script Python sebagai berikut:

$ python3 ex02.py

Seperti yang Anda lihat, skrip Python ex02.py mencetak 2 URL.

Yang pertama adalah URL beranda mesin pencari DuckDuckGo.

Yang kedua adalah URL saat ini yang diperbarui setelah melakukan pencarian di mesin pencari DuckDuckGo menggunakan kueri selenium terbaik .

Kesimpulan:

Pada artikel ini, saya telah menunjukkan kepada Anda cara mendapatkan URL browser web saat ini menggunakan perpustakaan Selenium Python. Sekarang, Anda harus dapat membuat proyek Selenium Anda lebih menarik.