Pandas Dataframe Unik

Pandas Dataframe Unik



Pustaka Python paling populer yang digunakan dalam ilmu data disebut Pandas. Ini menawarkan pemrogram Python kinerja tinggi, mudah digunakan, dan alat analisis data. Setelah Anda memahami fungsi dasar dan cara menggunakannya, Pandas adalah alat yang ampuh untuk mengubah data. Dalam 'panda' metode standar untuk menyimpan data dalam bentuk tabel adalah DataFrames. Kita dapat menggunakan beberapa metode “pandas” untuk mendapatkan nilai unik di kolom DataFrame “pandas”. Saat kita perlu mendapatkan nilai unik di kolom DataFrame dan tidak ingin ada duplikasi nilai di kolom DataFrame 'pandas', kita bisa menggunakan metode yang disediakan 'pandas' untuk melakukan ini. Mari kita lihat metode tersebut dalam panduan ini, bersama dengan beberapa contoh dan output untuk mendapatkan nilai unik di kolom 'panda' DataFrame.

Metode untuk Mendapatkan Nilai Unik di Kolom DataFrame 'panda'

Kita dapat menggunakan dua metode untuk mendapatkan nilai unik di kolom DataFrame 'panda'. Kami menjatuhkan nilai duplikat dan hanya mendapatkan nilai unik di kolom DataFrames. Metode yang disediakan 'panda' untuk melakukan tugas ini adalah:







  • Dengan memanfaatkan metode unique().
  • Dengan memanfaatkan metode drop_dupliactes().

Sekarang, kita akan menggunakan kedua metode dalam kode “pandas” untuk mendapatkan nilai unik di kolom DataFrame “pandas”.



Contoh #01

Aplikasi 'Spyder' digunakan di sini untuk menghasilkan kode 'panda' ini untuk memanfaatkan metode yang membantu kami mendapatkan nilai unik di kolom DataFrame 'panda'. Kita harus mengimpor modul 'pandas', yang diperlukan untuk kode 'pandas', sebelum membuat DataFrame. Dengan menggunakan istilah “import” dan menempatkan “pandas as pd”, kita mengimpor modul-modul ini.



Sekarang, dengan bantuan 'pd', kita dapat dengan cepat mendapatkan fungsi atau metode 'pandas'. Kami kemudian menempatkan 'Subject_data' di mana kami menambahkan 'Nama' dan di 'Nama', kami menambahkan data nama yaitu 'Roman, William, Peter, Smith, John, Milli, Thomas, dan James'. Kemudian, kita tambahkan data mata pelajaran pada “Subj” yaitu “Matematika, Ekonomi, Sains, Matematika, Statistika, Statistika, Statistika, dan Komputer”. Kemudian, kita ubah “Subject_data” ini menjadi DataFrame “Subject_df” dengan menggunakan metode “pd.DataFrame()”. Kami menempatkan 'Subject_df' di metode 'print()' sehingga akan ditampilkan di terminal.





Sekarang, kami ingin mendapatkan nilai unik di kolom DataFrame 'pandas' 'Subj'. Untuk tujuan ini, kami menggunakan metode “unik ()” di sini dan kami menambahkan nama kolom dan juga nama DataFrame seperti yang ditunjukkan di bawah ini. Kami menambahkan metode ini di 'print()' sehingga hasilnya juga akan ditampilkan di terminal.



Sekarang, kita menekan tombol “Shift+Enter” untuk mendapatkan hasil dari kode ini dan itu dirender di terminal dan juga ditampilkan di sini, yang berisi DataFrame dengan semua nilai. Ini adalah DataFrame asli yang telah kami tambahkan dalam kode dan di bawahnya menampilkan nilai unik dari kolom 'Subj'. Ini menjatuhkan nilai duplikat dan menampilkan nilai unik dari kolom 'Subj' dari DataFrame.

Contoh #02

Kami membuat 'Sample_list' yang berisi beberapa informasi. Kami memasukkan 'Layla, 21, 28, 31, 14, dan 39' yang akan muncul sebagai kolom pertama ketika kami mengubah daftar ini ke dalam DataFrame. Kemudian, kita tambahkan “Lusy, 31, 25, 34, 26, dan 21” sebagai baris kedua dari DataFrame. Setelah ini, kami memiliki 'Peter, 38, 20, 20, 35, dan 24' dan 'Layla 38, 23, 39 24, 23' yang akan menjadi baris ketiga dan keempat dari DataFrame. Kami juga memasukkan tiga data lagi yaitu “Stella, 21, 24, 24, 28, 31”, “Layla, 33, 32, 26, 30, 25” dan juga “Peter, 21, 21, 31, 21, 29” .

Sekarang, kita mengubah “Sample_list” menjadi “DF_Sample” yang merupakan nama DataFrame di sini dengan meletakkan fungsi “pd.DataFrame()”. Juga, kami menetapkan nama kolom DataFrame ini dan nama-nama ini adalah 'Nama, Ass_1, Ass_2, Ass_3, Ass_4, dan Ass_5'. Kemudian, kami menggunakan 'print()' yang membantu dalam menampilkan DataFrame 'DF_Sample'. Sekarang, kami menggunakan metode lain dalam contoh ini untuk mendapatkan nilai unik di kolom DataFrame. Metode ini adalah metode 'drop_duplicates()' dari 'panda'.

Dalam metode “drop_duplicates()”, kita menetapkan nama kolom tempat kita ingin mendapatkan nilai unik di kolom DataFrame. Kami mendapatkan nilai unik dari kolom 'Nama' dengan menjatuhkan nilai duplikat di kolom ini dengan bantuan metode 'drop_duplicates()' dan juga merender nilai unik ini menggunakan fungsi 'print()' di sini.

Nama-nama yang diduplikasi akan dibuang dan nilai unik diberikan setelah menerapkan metode “drop_duplicates()”. Anda dapat mencatat bahwa nama 'Layla' muncul di tiga sel kolom 'Nama'. Tetapi ketika metode “drop_duplicates()” diterapkan ke kolom ini, semua nilai duplikat akan dihapus dan satu nama “Layla” muncul di layar. Setelah menjatuhkan nilai duplikat, DataFrame baru muncul yang berisi nilai unik di kolom 'Nama' ini. Dengan cara ini, kita dapat menghapus nilai duplikat dan mendapatkan nilai unik di kolom DataFrame dengan bantuan metode “drop_duplicates()”.

Contoh #03

DataFrame yang sama digunakan lagi dan sekarang kami menerapkan metode 'unik()' di sini. Dengan metode 'unik()' kami menempatkan nama kolom serta nama DataFrame di mana kami ingin menerapkan metode 'unik()' ini untuk mendapatkan nilai unik. Ini hanya akan membuat nilai unik dari kolom itu dan tidak akan menampilkan nilai-nilai ini dalam bentuk DataFrame.

Di sini, DataFrame berisi tujuh nilai di kolom 'Nama' tetapi ketika kita menerapkan metode 'unik()' ke kolom ini, hanya empat nilai yang muncul dan ini adalah nilai unik dari kolom itu. Itu tidak membuat nilai duplikat.

Contoh #04

DataFrame yang kita buat dalam contoh ini adalah 'F_G_df'. Kami memasukkan 'My_fruits' dan 'my_Vegs' di DataFrame ini. Kolom “My_fruits” berisi “Apple, Orange, Apple, Pear, Lychee, Apple, Apple, Pear, dan Apple”. Selanjutnya, kita memiliki “My_Vegs” yang berisi nama-nama sayuran yaitu “Chilli, Bringle, Carrot, Potato, Potato, Carrot, Onion, Garlic, dan Ginger”. DataFrame ini hanya berisi dua kolom.

Sekarang, kita mendapatkan nilai unik di kedua kolom  dengan bantuan metode “unique()”. Kami menyebutkan nama DataFrame. Kemudian, letakkan kolom pertama nama kolom. Setelah ini, kami menggunakan metode append(). Di append ini, kita kembali menempatkan nama DataFrame dan nama kolom kedua dan menempatkan metode “unique()”. Ini akan mendapatkan nilai unik dari kedua kolom dan kemudian menambahkan nilai unik dari kedua kolom dan menampilkannya di layar.

DataFrame dirender terlebih dahulu berisi semua nilai. Setelah ini, metode “unique()” diterapkan dan nilai unik dari kedua kolom ditampilkan di bawah. Dalam kode ini, kita mendapatkan nilai unik di beberapa kolom DataFrame dengan menggunakan metode “unique()”.

Kesimpulan

Penjelasan lengkap untuk mendapatkan nilai unik di kolom DataFrame dapat ditemukan di panduan ini. Kita telah membahas metode “unique()” dan “drop_duplicates()” yang membantu kita mendapatkan nilai unik dari kolom DataFrame. Kami telah menjelajahi cara menggunakan metode ini dalam kode 'pandas' dengan menggunakan metode ini di sini dalam kode kami. Kami telah mengilustrasikan berbagai contoh dalam panduan ini dan telah menunjukkan kepada Anda cara mendapatkan nilai unik dari satu kolom dengan menggunakan metode 'unik()' serta metode 'drop_duplicates()'. Kami juga telah menjelajahi cara mendapatkan nilai unik di beberapa kolom dengan memanfaatkan metode “unik()” dalam panduan ini.