Panda Isi Nan dengan 0

Panda Isi Nan Dengan 0



Ilmu data biasanya melibatkan data yang hilang. Baik seluruh baris dapat dibuang atau nilai dapat ditambahkan ke kombinasi baris-kolom. Menjatuhkan baris/kolom tidak masuk akal karena menghilangkan metrik tertentu untuk setiap baris. NaN, yang merupakan singkatan dari 'Not a Number', adalah salah satu cara umum untuk menunjukkan nilai yang hilang dari sekumpulan data. Untuk mendapatkan hasil yang diinginkan, penanganan NaN cukup penting. Jadi, mari kita cari tahu cara mengubah nilai NaN di baris atau kolom Pandas DataFrame menjadi 0.

Panda Isi Nilai NaN

Jika kolom dalam bingkai data Anda memiliki nilai NaN atau Tidak Ada, Anda dapat menggunakan fungsi “fillna()” atau “replace()” untuk mengisinya dengan nol (0).

mengisi()







Nilai NA/NaN diisi dengan pendekatan yang disediakan menggunakan fungsi “fillna()”. Ini dapat digunakan dengan mempertimbangkan sintaks berikut:



Jika Anda ingin mengisi nilai NaN untuk satu kolom, sintaksnya adalah sebagai berikut:




Saat Anda diminta untuk mengisi nilai NaN untuk DataFrame lengkap, sintaksnya adalah sebagai berikut:






Mengganti()

Untuk mengganti satu kolom nilai NaN, sintaks yang disediakan adalah sebagai berikut:




Sedangkan, untuk mengganti seluruh nilai NaN DataFrame, kita harus menggunakan sintaks yang disebutkan berikut:


Dalam tulisan ini, kita sekarang akan mengeksplorasi dan mempelajari implementasi praktis dari kedua metode ini untuk mengisi nilai NaN di Pandas DataFrame kita.

Contoh 1: Isi Nilai NaN Menggunakan Metode Pandas “Fillna()”

Ilustrasi ini menunjukkan penerapan fungsi Pandas “DataFrame.fillna()” untuk mengisi nilai NaN dalam DataFrame yang diberikan dengan 0. Anda dapat mengisi nilai yang hilang dalam satu kolom atau mengisinya untuk seluruh DataFrame. Di sini, kita akan melihat kedua teknik ini.

Untuk menerapkan strategi ini, kita perlu mendapatkan platform yang sesuai untuk pelaksanaan program. Jadi, kami memutuskan untuk menggunakan alat 'Spyder'. Kami memulai kode Python kami dengan mengimpor toolkit 'pandas' ke dalam program karena kami perlu menggunakan fitur Pandas untuk membangun DataFrame serta untuk mengisi nilai yang hilang di DataFrame itu. 'pd' digunakan sebagai alias 'panda' di seluruh program.

Sekarang, kami memiliki akses ke fitur Pandas. Pertama-tama kita menggunakan fungsi “pd.DataFrame()” untuk menghasilkan DataFrame kita. Kami memanggil metode ini dan menginisialisasinya dengan tiga kolom. Judul kolom-kolom tersebut adalah “M1”, “M2”, dan “M3”. Nilai pada kolom “M1” adalah “1”, “Tidak Ada”, “5”, “9”, dan “3”. Entri dalam 'M2' adalah 'Tidak Ada', '3', '8', '4', dan '6'. Sedangkan “M3” menyimpan data sebagai “1”, “2”, “3”, “5”, dan “Tidak Ada”. Kami memerlukan objek DataFrame tempat kami dapat menyimpan DataFrame ini saat metode “pd.DataFrame()” dipanggil. Kami membuat objek DataFrame 'hilang' dan menetapkannya dengan hasil yang kami dapatkan dari fungsi 'pd.DataFrame()'. Kemudian, kami menggunakan metode “print()” Python untuk menampilkan DataFrame di konsol Python.


Saat kita menjalankan potongan kode ini, DataFrame dengan tiga kolom dapat dilihat di terminal. Di sini, kita dapat mengamati bahwa ketiga kolom berisi nilai nol di dalamnya.


Kami membuat DataFrame dengan beberapa nilai nol untuk menerapkan fungsi “fillna()” Pandas untuk mengisi nilai yang hilang dengan 0. Mari pelajari bagaimana kita bisa melakukannya.

Setelah menampilkan DataFrame, kami memanggil fungsi “fillna()” Pandas. Di sini, kita akan belajar mengisi nilai yang hilang dalam satu kolom. Sintaks untuk ini sudah disebutkan di awal tutorial. Kami memberikan nama DataFrame dan menentukan judul kolom tertentu dengan fungsi “.fillna()”. Di antara tanda kurung metode ini, kami memberikan nilai yang akan diletakkan di tempat nol. Nama DataFrame 'hilang' dan kolom yang kami pilih di sini adalah 'M2'. Nilai yang diberikan di antara kurung kurawal 'fillna()' adalah '0'. Terakhir, kami memanggil fungsi 'print()' untuk melihat DataFrame yang diperbarui.


Di sini, Anda dapat melihat bahwa kolom 'M2' dari DataFrame tidak memiliki nilai yang hilang sekarang karena nilai NaN diisi dengan 0.


Untuk mengisi nilai NaN untuk seluruh DataFrame dengan metode yang sama, kami memanggil 'fillna()'. Ini cukup sederhana. Kami memberikan nama DataFrame dengan fungsi 'fillna()' dan menetapkan nilai fungsi '0' di antara tanda kurung. Akhirnya, fungsi “print()” menunjukkan kepada kita DataFrame yang terisi.


Ini memberi kami DataFrame tanpa nilai NaN karena semua nilai diisi ulang dengan 0 sekarang.

Contoh 2: Isi Nilai NaN Menggunakan Metode Pandas “Replace()”

Bagian artikel ini menunjukkan metode lain untuk mengisi nilai NaN dalam DataFrame. Kita akan menggunakan fungsi “replace()” dari Pandas untuk mengisi nilai dalam satu kolom dan dalam DataFrame lengkap.

Kami mulai menulis kode di alat 'Spyder'. Pertama, kami mengimpor perpustakaan yang diperlukan. Di sini, kami memuat perpustakaan Pandas untuk mengaktifkan program Python untuk menggunakan metode Pandas. Pustaka kedua yang kami muat adalah NumPy dan alias menjadi 'np'. NumPy menangani data yang hilang dengan metode “replace()”.

Kemudian, kami membuat DataFrame yang memiliki tiga kolom – “sekrup”, “kuku” dan “bor”. Nilai di setiap kolom diberikan masing-masing. Kolom 'sekrup' memiliki nilai '112', '234', 'Tidak Ada', dan '650'. Kolom 'kuku' memiliki '123', '145', 'Tidak Ada', dan '711'. Terakhir, kolom 'bor' memiliki nilai '312', 'Tidak Ada', '500', dan 'Tidak Ada'. DataFrame disimpan dalam objek DataFrame 'alat' dan ditampilkan menggunakan metode 'print()'.


DataFrame dengan empat nilai NaN dalam record dapat dilihat pada gambar output berikut:


Sekarang, kita menggunakan metode Pandas “replace()” untuk mengisi nilai null dalam satu kolom DataFrame. Untuk tugas tersebut, kami memanggil fungsi “replace()”. Kami menyediakan 'alat' nama DataFrame dan 'sekrup' kolom dengan metode '.replace()'. Di antara kurung kurawalnya, kami menetapkan nilai '0' untuk entri 'np.nan' di DataFrame. Metode “print()” digunakan untuk menampilkan output.


DataFrame yang dihasilkan menunjukkan kepada kita kolom pertama dengan entri NaN diganti dengan 0 di kolom 'sekrup'.


Sekarang, kita akan belajar mengisi nilai-nilai di seluruh DataFrame. Kami memanggil metode “replace()” dengan nama DataFrame dan memberikan nilai yang ingin kami ganti dengan entri np.nan. Terakhir, kami mencetak DataFrame yang diperbarui dengan fungsi “print()”.


Ini menghasilkan DataFrame yang dihasilkan tanpa catatan yang hilang.

Kesimpulan

Berurusan dengan entri yang hilang dalam DataFrame adalah hal mendasar dan merupakan persyaratan yang diperlukan untuk mengurangi kompleksitas dan menangani data secara menantang dalam proses analisis data. Pandas memberi kita beberapa opsi untuk mengatasi masalah ini. Kami membawa dua strategi praktis dalam panduan ini. Kami mempraktekkan kedua teknik dengan bantuan alat 'Spyder' untuk mengeksekusi kode sampel untuk membuat hal-hal sedikit dimengerti dan lebih mudah bagi Anda. Memperoleh pengetahuan tentang fungsi-fungsi ini akan mempertajam keterampilan Panda Anda.