Cara membaca file excel (xlsx) dengan python

How Read Excel File Python



NS .xlsx adalah perpanjangan dari dokumen excel yang dapat menyimpan sejumlah besar data dalam bentuk tabel, dan berbagai jenis perhitungan aritmatika dan logika dapat dilakukan dengan mudah dalam spreadsheet excel. Terkadang diperlukan untuk membaca data dari dokumen excel menggunakan skrip Python untuk tujuan pemrograman. Banyak modul yang ada di Python untuk membaca dokumen excel. Beberapa modul yang berguna adalah xlrd , openpyxl , dan panda . Cara menggunakan modul ini untuk membaca file excel dengan Python telah ditunjukkan dalam tutorial ini.

Prasyarat:

File excel dummy dengan ekstensi .xlsx akan diminta untuk memeriksa contoh tutorial ini. Anda dapat menggunakan file excel yang ada atau membuat yang baru. Di sini, file excel baru bernama penjualan.xlsx file telah dibuat dengan data berikut. File ini telah digunakan untuk membaca dengan menggunakan modul python yang berbeda di bagian selanjutnya dari tutorial ini.







penjualan.xlsx



Tanggal Penjualan Pramuniaga Jumlah
05/12/18 Sila Ahmad 60000
12/06/19 Saya Hossain 50.000
08/09/20 Sarmin Jahan 45000
04/07/21 Mahmudul Hasan 30000

Contoh-1: Membaca file excel menggunakan xlrd

Modul xlrd tidak diinstal dengan Python secara default. Jadi, Anda harus menginstal modul sebelum menggunakannya. Versi terbaru dari modul ini tidak mendukung file excel dengan ekstensi .xlsx. Jadi, Anda harus menginstal modul versi 1.2.0 ini untuk membaca file xlsx. Jalankan perintah berikut dari terminal untuk menginstal versi yang diperlukan dari xlrd .



$pipInstall xlrd== 1.2.0

Setelah menyelesaikan proses instalasi, buat file python dengan skrip berikut untuk membaca: penjualan.xlsx file menggunakan xlrd modul. buka_buku kerja() fungsi yang digunakan dalam skrip membuka file xlsx untuk membaca. File excel ini hanya berisi satu lembar. Sehingga buku kerja.sheet_by_index() fungsi telah digunakan dalam skrip dengan nilai argumen 0. Selanjutnya, nested 'untuk' loop telah digunakan untuk membaca nilai sel lembar kerja menggunakan nilai baris dan kolom. Dua fungsi range() telah digunakan dalam skrip untuk menentukan ukuran baris dan kolom berdasarkan data lembar. NS nilai_sel() fungsi telah digunakan untuk membaca nilai sel tertentu dari lembar di setiap iterasi dari loop. Setiap bidang dalam output akan dipisahkan oleh satu ruang tab.





# Impor modul xlrd
impor xlrd

# Buka Buku Kerja
buku kerja = xlrd.open_workbook('penjualan.xlsx')

#Buka lembar kerja
lembar kerja = buku kerja.sheet_by_index(0)

# Ulangi baris dan kolom
untukSayadi dalamjangkauan(0,5):
untukJdi dalamjangkauan(0,3):
# Cetak nilai sel dengan ruang tab
mencetak(lembar kerja.cell_value(aku j),akhir='T')
mencetak('')

Keluaran:

Output berikut akan muncul setelah menjalankan skrip di atas.



Contoh-2: Baca file excel menggunakan openpyxl

NS openpyxl adalah modul python lain untuk membaca file xlsx, dan juga tidak diinstal dengan Python secara default. Jalankan perintah berikut dari terminal untuk menginstal modul ini sebelum menggunakannya.

$pipInstallopenpyxl

Setelah menyelesaikan proses instalasi, buat file python dengan skrip berikut untuk membaca: penjualan.xlsx mengajukan. Seperti modul xlrd, openpyxl modul memiliki beban_buku kerja() berfungsi untuk membuka file xlsx untuk dibaca. NS penjualan.xlsx file digunakan sebagai nilai argumen dari fungsi ini. Objek dari wookbook.active telah dibuat dalam skrip untuk membaca nilai-nilai max_row dan max_column properti. Properti ini telah digunakan dalam loop for bersarang untuk membaca konten penjualan.xlsx mengajukan. Fungsi range() telah digunakan untuk membaca baris sheet, dan fungsi iter_cols() telah digunakan untuk membaca kolom sheet. Setiap bidang dalam output akan dipisahkan oleh dua spasi tab.

# Impor modul openyxl
impor openpyxl

# Tentukan variabel untuk memuat wookbook
wookbook = openpyxl.load_workbook('penjualan.xlsx')

# Tentukan variabel untuk membaca lembar aktif:
lembar kerja = wookbook.active

# Ulangi loop untuk membaca nilai sel
untukSayadi dalamjangkauan(0, lembar kerja.max_row):
untuk dengan di dalamlembar kerja.iter_cols(1, lembar kerja.max_column):
mencetak(dengan[Saya].nilai,akhir='TT')
mencetak('')

Keluaran:

Output berikut akan muncul setelah menjalankan skrip di atas.

Contoh-3: Membaca file excel menggunakan pandas

Modul pandas tidak diinstal dengan python seperti modul sebelumnya. Jadi, jika Anda tidak menginstalnya sebelumnya, maka Anda harus menginstalnya. Jalankan perintah berikut untuk menginstal panda dari terminal.

$pipInstallpanda

Setelah menyelesaikan proses instalasi, buat file python dengan skrip berikut untuk membaca: penjualan.xlsx mengajukan. NS baca_excel() fungsi pandas digunakan untuk membaca file xlsx. Fungsi ini telah digunakan dalam skrip untuk membaca penjualan.xlsx mengajukan. NS Bingkai Data() fungsi telah digunakan di sini untuk membaca konten file xlsx dalam bingkai data dan menyimpan nilai dalam variabel bernama data . Nilai data telah dicetak kemudian.

# Impor panda
impor pandasebagaipd

# Muat file xlsx
excel_data = pd.read_excel('penjualan.xlsx')
# Baca nilai file dalam kerangka data
data = pd.DataFrame(excel_data,kolom=['Tanggal Penjualan','Pramuniaga','Jumlah'])
# Cetak konten
mencetak('Isi filenya adalah: ', data)

Keluaran:

Output berikut akan muncul setelah menjalankan skrip di atas. Output dari skrip ini berbeda dari dua contoh sebelumnya. Nomor baris dicetak di kolom pertama, di mana nilai baris dihitung dari 0. Nilai tanggal disejajarkan secara terpusat. Nama-nama wiraniaga disejajarkan dengan benar. Jumlahnya rata kiri.

Kesimpulan:

Pengguna python perlu bekerja dengan file xlsx untuk tujuan pemrograman yang berbeda. Tiga cara berbeda untuk membaca file xlsx telah ditunjukkan dalam tutorial ini dengan menggunakan tiga modul python. Setiap modul memiliki fungsi dan properti yang berbeda untuk membaca file xlsx. Tutorial ini akan membantu pengguna python membaca file xlsx dengan mudah menggunakan skrip python setelah membaca tutorial ini.