XLSX ke CSV dengan Python

Xlsx Ke Csv Dengan Python



Dalam beberapa tahun terakhir, Python telah meningkat sebagai salah satu bahasa pemrograman yang dominan. Komunitas Python telah berkembang secara signifikan sebagai akibat dari popularitas dan utilitas Python. Kami akan membahas secara mendetail dalam artikel ini tentang cara menggunakan Python untuk mengonversi XLSX ke CSV. Kami menyadari bahwa file excel sering digunakan untuk melakukan analisis keuangan, mengatur data, entri data, akuntansi, manajemen data, membuat bagan dan grafik, dll. Namun, kami lebih suka menggunakan file CSV untuk impor dan ekspor data. Salah satu pendekatannya adalah mentransfer data terstruktur menggunakan file teks biasa.

Apa itu File Xslx?

Saat membuat spreadsheet di versi terbaru Excel, Microsoft menggunakan file XLSX sebagai jenis file default. Mirip dengan jenis file DOCX Word, kita dapat membuka file XLSX menggunakan berbagai aplikasi/program.

Apa itu File CSV?

Format file CSV adalah yang dapat kita gunakan untuk menyimpan nilai data tabular dalam spreadsheet dan database. Data tabular, teks atau teks, disimpan sebagai teks biasa dalam file CSV. Catatan dalam file CSV adalah nilai data yang disimpan di setiap baris file. Setiap record dapat memiliki lebih dari satu field yang dipisahkan dengan koma.







Perbedaan Kunci Antara File XLSX dan CSV

Pengguna sering menggunakan CSV dan XLSX secara bergantian, dan mereka umumnya tidak mengetahui perbedaan di antara keduanya, apa karakteristik dasarnya, dan cara kerjanya. Ini hanya berfungsi sebagai sumber informasi bagi pengguna. Hampir setiap bisnis dan perusahaan menggunakan keduanya untuk membantu pengguna dalam mengelola, memperbarui, dan menyimpan data untuk pengguna. Berikut adalah beberapa perbedaan utama antara file XLSX dan CSV yang harus Anda ketahui:



  • Format CSV menyimpan data tabular ke file teks pembatas dengan ekstensi .csv. Padahal, file excel atau XLSX adalah spreadsheet yang menyimpan file dalam format miliknya, yaitu. xls atau XLSX.
  • File Excel adalah file biner yang berisi data pada setiap lembar kerja dalam buku kerja. Sedangkan CSV adalah format teks biasa dan sederhana dengan urutan nilai data yang dipisahkan oleh koma.
  • Operasi data tidak dapat dilakukan pada file CSV. Namun, mereka dapat dilakukan pada file Excel.
  • File CSV lebih cepat dan menggunakan lebih sedikit memori daripada file XLSX. Namun, Excel menggunakan lebih banyak memori saat mengimpor data.
  • Jika kami membandingkan CSV dengan Excel, kami dapat membuka file CSV di editor teks Windows apa pun sementara file Excel tidak bisa.

Bagaimana File XLSX Dapat Dikonversi ke CSV Menggunakan Python?

File XLSX dapat diubah menjadi file CSV dengan Python menggunakan berbagai metode. Python menyertakan berbagai modul dan fungsi yang dapat membantu kita menyelesaikan tugas ini. Di sini, kita akan membahas beberapa metode yang dapat digunakan untuk mengonversi file XLSX menjadi file CSV dengan Python.



Prasyarat untuk Melakukan Konversi Excel ke CSV

Menginstal persyaratan adalah langkah pertama. Kami menggunakan modul seperti menggabungkan Pandas, CSV, dan Openpyxl, dll. Dalam tutorial ini. Paket Pandas Python memungkinkan manipulasi dan analisis data. Pandas adalah perpustakaan terkenal di kalangan programmer Python. File Excel dapat dibaca dan ditulis menggunakan paket Python yang dikenal sebagai Openpyxl. Kami tidak akan berurusan dengan perpustakaan ini secara langsung. Panda malah menggunakan Openpyxl secara internal.





Menggunakan repositori PyPI, kita dapat menginstal kedua paket:

Metode 1: Mengonversi XLSX ke CSV Menggunakan Modul Pandas

Contoh 1: Mengonversi Satu File XLSX ke CSV



Pandas adalah modul sumber terbuka yang dibuat untuk bahasa pemrograman Python untuk memanipulasi dan menganalisis data. Untuk bekerja dengan deret waktu dan tabel numerik, Pandas menyediakan berbagai fungsi dan fitur. Menggunakan panda, kumpulan data kecil dan besar dapat dibaca, difilter, dan disusun ulang. Dan hasilnya dapat dihasilkan dalam berbagai format seperti Excel, JSON, dan CSV. Kami menggunakan metode read_excel() dari Pandas untuk membaca file excel, dan metode to_csv() untuk mengubah DataFrame menjadi file CSV.

Kami mencetak file .csv kami sebagai DataFrame seperti yang dapat dilihat di output. Skrip sebelumnya mengonversi file XLSX kami menjadi CSV dan membuat file 'salary.csv' di direktori saat ini.

Contoh 2: Mengonversi File XLSX (dengan Beberapa Lembar) ke CSV

Dalam contoh berikut, pertama-tama kita membaca nama sheet file Excel. Nama masing-masing lembar kemudian diulang dan disimpan sebagai file CSV yang berbeda. Skrip menyimpan CSV di lokasi yang sama.

Kami menggunakan sampel file XLSX yang memiliki dua atau lebih lembar kerja atau spreadsheet.

Seperti yang bisa dilihat, file XLSX kami terdiri dari dua lembar (sheet1 dan sheet2). Sekarang, kami menulis kode untuk mengonversi file XLSX ini menjadi CSV.

Keluaran:

Skrip berhasil mengonversi file XLSX dengan dua lembar menjadi satu file CSV dengan satu lembar.

Contoh 3: Mengubah Beberapa File XLSX menjadi File CSV Terpisah

Pertimbangkan skenario di mana Anda perlu mengonversi beberapa file Excel di direktori kerja Anda menjadi CSV. Anda bisa menggunakan metode ini. Kami mulai dengan mengasumsikan bahwa setiap file hanya berisi satu lembar. Kemudian, kami memperluas metode kami untuk menangani banyak file dan beberapa lembar. Kode Python berikut menggunakan modul standar glob. Kami mencocokkan jalur file menggunakan pola dengan Glob. Itu cocok dengan semua file dengan ekstensi .xlsx di direktori kerja. Setelah itu, kami mengembangkan fungsi yang membaca file Excel dan menyimpannya sebagai file CSV. Kami memanggil fungsi ini di setiap jalur file yang ditemukan.

Skrip sebelumnya ini mengonversi semua file xlsx di direktori saat ini menjadi file CSV.

Sekarang, kami mengonversi file XLSX dengan banyak spreadsheet menjadi CSV. Ini kemungkinan besar adalah bagian yang sulit. Tiga file Excel ada di direktori kerja kami. Juga, beberapa di antaranya terdiri dari lebih dari satu lembar. Kami bertujuan untuk:

  1. Buat direktori untuk setiap file spreadsheet,
  2. Konversi lembar file excel ke CSV dan harus disimpan di direktori yang baru dibuat.

Skrip mengubah XLSX dengan satu dan beberapa lembar menjadi file CSV terpisah dan menyimpannya di direktori baru dengan nama yang sama.

Untuk mengambil setiap file Excel yang terletak di direktori saat ini, fungsi glob digunakan. Setelah itu, folder dibuat untuk setiap file XLSX menggunakan fungsi os.mkdir. File CSV kemudian dibuat untuk setiap sheet di dalam direktori baru dengan mengulangi nama sheet.

Metode 2: Mengonversi XLSX ke CSV Menggunakan Modul Openpyxl dan CSV

Dalam metode ini, kami akan menggunakan modul openpyxl dan CSV untuk mengonversi file XLSX menjadi CSV. Untuk membaca dan menulis file xlsx, xlsm, xltx, dan xltm 2010, modul Python openpyxl dapat digunakan. Modul CSV menyertakan kelas yang memungkinkan pembacaan dan penulisan data tabular berformat CSV.

Untuk membaca atau memuat file xlsx kita, kita menggunakan fungsi load_workbook() dari modul openpyxl. Anda dapat menggunakan fungsi ini jika Anda perlu menulis atau membaca file XLSX/Excel yang ada dengan Python. Setelah aktivasi excel, kami menggunakan fungsi csv.writer() untuk membuat file CSV kami. Kemudian, for-loop digunakan untuk menyimpan data dalam sel data file CSV. Kami mengonversi file example.xlsx kami menjadi myfile.csv seperti yang terlihat pada gambar berikut:

Kesimpulan

Dalam tutorial ini, kami memberi Anda pengenalan singkat tentang file XLSX dan file CSV. Kami menjelaskan perbedaan utama antara kedua format file. Kami membahas dua metode dengan banyak contoh untuk mengajarkan bagaimana file XLSX dengan satu atau beberapa lembar dapat diubah menjadi file CSV. Kami menerapkan contoh untuk mengonversi beberapa file XLSX menjadi file CSV secara bersamaan. Mungkin sederhana atau sulit untuk mengonversi data dari Excel ke CSV. Jika Anda hanya memiliki satu file dengan jumlah lembar yang sedikit, itu sederhana. Tetapi jika tidak, itu bisa sulit.