Panda Bergabung vs Gabung

Panda Bergabung Vs Gabung



'Panda' adalah alat berkinerja tinggi untuk lingkungan python. Ini adalah kode sumber 'terbuka' untuk analisis data. Penggabungan panda dan metode penggabungan panda digunakan untuk menggabungkan dua kerangka data menjadi satu kerangka data. Dalam kedua metode pandas, perbedaannya adalah fungsi pandas 'join' bergabung dengan kerangka data menggunakan indeks. Sementara fungsi pandas 'merge' bergabung dengan kerangka data dengan menggunakan metode indeks dan kolom di mana kita dapat memilih sendiri kolom yang diinginkan. Metode penggabungan panda sebagian besar digunakan dibandingkan dengan metode penggabungan panda. Perangkat lunak yang akan kita gunakan untuk implementasinya adalah perangkat lunak “spyder”, yang berada di lingkungan python yang akan memberi kita manfaat untuk implementasi kode metode panda join() dan fungsi metode pandas merge().

Sintaks Metode Pandas Join()

“df1. Ikuti ( df2 )

The 'df' dalam sintaks di atas adalah singkatan dari 'dataframe'. Ada dua dataframe dalam sintaks dengan fungsi “dot join”, yaitu untuk memanggil metode. Ini adalah metode panda untuk menggabungkan dua kerangka data. Ia bekerja dengan menggunakan indeks untuk menggabungkan kerangka data menjadi satu.







Sintaks Metode Penggabungan Panda ()

“df1. menggabungkan ( df2 , pada = 'nama kolom' )

Sintaks metode penggabungan panda memiliki dua kerangka data sebagai 'df1' dan 'df2'. Fungsi 'dot merge' memanggil metode menggabungkan kedua kerangka data dengan tampilan kolom terbalik.



Kami akan membahas cara menggabungkan dua kerangka data berikut untuk menggunakan metode panda merge dan pandas join:



  • Pandas Join metode tumpang tindih.
  • Panda bergabung dengan metode menggunakan reset indeks.
  • Metode penggabungan panda (kolom “kiri dan kanan”).
  • Metode penggabungan Panda secara eksplisit.

Membuat Dataframe untuk Implementasi Pandas Merge dan Pandas Join Method

Pertama, kita harus membuat bingkai data. Untuk itu, kita akan menggunakan alat 'spyder'. Setelah membukanya, mulailah menulis kode. Impor panda sebagai 'pd' untuk asosiasi perpustakaan panda. Kami memiliki variabel kerangka data sebagai 'x', 'y', 'p', dan 'q secara bersamaan dan 'a' dengan nilai '1' dan 'b' dengan nilai yang ditetapkan sebagai '2'.





Outputnya adalah 'df' yang dibuat dengan nilai yang ditetapkan. Kita bisa membuatnya sebesar datanya.



Membuat Kerangka Data Lain

Kita harus membuat kerangka data lain, untuk memahami metode penggabungan panda dan penggabungan panda dengan jelas. Di sini, kami telah membuat 'df' sama dengan 'df' di atas, hanya nilai variabel yang ditetapkan berbeda. Kami memiliki 'h', 'j', 's' dan 'd', sedangkan menetapkan nilai 'b' dengan nilai '8' dan 'Y' dengan nilai '3'.

Outputnya menunjukkan 'df' sederhana yang dibuat.

Contoh #01: Metode Gabung Pandas (tumpang tindih)

Sekarang, kita akan melihat bagaimana menggabungkan dua dataframe dengan metode pandas join. Untuk metode ini, kita dapat memilih kolom pilihan yang ingin kita kerjakan dari dataframe. Kami telah mengambil contoh dengan kolom 'kiri' yang tumpang tindih dari 'df', sehingga kami dapat memperbaikinya dengan 'akhiran' untuk mengatasi tumpang tindih data. Disini variabel yang digunakan adalah “x”, “z”, “v”, “d”. “p”, “o”, “l”, dan “y” dengan nilai yang ditetapkan sebagai “3”, “6”, “7”, dan “9”. The '.join' memanggil metode, dengan align diatur ke kiri bergabung dengan akhiran 'df' kanan. ”. Kata “suffix” yang digunakan dalam kode tersebut karena pada dataframe terdapat dua kolom yang namanya sama yaitu “key” dan tidak akan tumpang tindih dengan data.

Output tidak menampilkan data yang tumpang tindih dengan metode menggabungkan dua 'df' menggunakan metode panda join.

Contoh # 02: Metode Gabung Panda Menggunakan Reset Indeks

Dalam contoh ini, kita akan secara terpisah menentukan kolom dengan parameter 'on' untuk digunakan sebagai 'kunci' dalam metode join yang membantu menggabungkan dua kerangka data. hal gabungan dilakukan dengan parameter ini. Juga, indeks salah satu dari dua 'df' harus serupa untuk bergabung dengan mereka. Jenis data yang serupa atau data yang digunakan untuk tujuan yang sama dapat digabungkan untuk diproses. Ini akan menggunakan indeks masih, menggunakan dari kanan. Variabelnya adalah “s”, “t”, “u”, “v”, “n”, ‘w”, “k”, dan “q”. Nilai yang diberikan adalah “3”, “6”, “7” dan “9”. 'reset dot index' adalah metode panda untuk mereset indeks 'df'. Indeks reset menetapkan semua bilangan bulat dari daftar kerangka data Anda dari 0 hingga data kerangka data diperpanjang.

Berikut adalah output yang ditampilkan dengan metode join index “key” dari pandas.

Contoh #03: Metode Penggabungan Pandas (kolom “kiri dan kanan”)

Metode penggabungan melakukan operasi yang serupa dengan metode gabung pandas. Kedua metode tersebut untuk menggabungkan data pada kerangka data yang serupa. Metode penggabungan lebih fleksibel yang membutuhkan penentuan kunci. Kami juga dapat menentukannya di kolom kiri dan kanan tergantung pada pekerjaan kerangka data Anda. Variabel dalam kode tersebut adalah “s”, “d”, “g”, “f”, “k”, “j”, “b” dan “q”. nilai yang diberikan adalah '9', '5', '6' dan '7'. Implementasi luar “join” dilakukan pada kedua “df” dengan menggunakan parameter “how” dari fungsi metode penggabungan pandas.

Output yang kita lihat menunjukkan data gabungan dari dua kerangka data. 'NaN' mewakili 'bukan angka' yang berarti bahwa di mana tidak ada nomor yang ditetapkan dalam data, 'NaN' ditampilkan di sana.

Contoh #04: Metode Penggabungan Secara Eksplisit

Di sini, dalam contoh ini, metode penggabungan adalah penghancuran indeks dan nilai indeks tidak diasumsikan pada kerangka data. Kami akan melakukan metode ini sesuai dengan pekerjaan yang perlu dilakukan, di mana yang menentukan secara eksplisit adalah untuk menindaklanjuti. Ini akan menggabungkan data berdasarkan indeks kiri atau indeks kanan dengan parameter. Variabel dalam kerangka data ini adalah “t”, “r”, “I”, “u”, “h”, “o”, “e”, dan “e”. Nilai yang ditetapkan adalah '2', '4', '6' dan '4'. Contoh metode penggabungan pandas di atas dengan pemilihan kolom sesuai kebutuhan adalah metode yang paling rapi dan berharga untuk menggabungkan dua kerangka data. Memeriksa di akhir baris kode tentang kunci gabungan yang unik dalam kumpulan data.

Pada output di bawah ini, indeks tidak ditampilkan tanpa indeks tetapi fungsinya dilakukan berdasarkan indeks kanan dan kiri.

Kesimpulan

Metode merge() dan join() keduanya merupakan metode yang sangat nyaman dan efektif. Kedua fungsi ini digunakan untuk menggabungkan dua kerangka data yang terpisah pada kerangka data yang sama tetapi memiliki kegunaan yang berbeda tergantung pada kasusnya. Dalam artikel ini, kita telah mempelajari perbedaan utama antara metode penggabungan dan penggabungan panda. Setelah melakukan contoh dan memahami metode gabung pandas, kami akan menyimpulkannya dengan pengetahuan bahwa, jika kami ingin lebih fleksibel dan gaya database bergabung, lebih baik menggunakan metode penggabungan pandas. Di sisi lain, jika kita ingin menggabungkan kerangka data dengan indeks secara ekstensif, kita dapat menggunakan fungsi metode pandas join() .