Kolom Jumlah Panda

Kolom Jumlah Panda



“Artikel ini akan menunjukkan cara menjumlahkan semua atau kolom tertentu dalam Pandas DataFrame menggunakan Python. Fungsi DataFrame.sum() akan digunakan bersama dengan beberapa parameter bermanfaat dalam banyak contoh tutorial ini.”

Saat tutorial ini selesai, Anda mungkin tahu caranya:







    • Temukan jumlah Kolom kerangka data di Pandas.
    • Menambahkan kolom kerangka data bersama-sama
    • Tambahkan Kolom ke Dataframe Pandas yang memenuhi Kondisi yang ditentukan.
    • Tentukan jumlah setelah mengelompokkan data dari kerangka data.

Bagaimana Cara Menentukan Jumlah Kolom Dataframe?

Fungsi 'dataframe.sum()' di Pandas mengembalikan jumlah total untuk sumbu yang ditentukan. Jika input adalah sumbu indeks, fungsi menambahkan nilai setiap kolom satu per satu, lalu melakukan hal yang sama untuk setiap kolom, mengembalikan rangkaian yang menyimpan jumlah data/nilai di setiap kolom. Selain itu, ini mendukung penghitungan jumlah kerangka data dengan mengabaikan nilai yang hilang.



Sintaks: DataFrame.sum(axis = None, skipna = None, level = None, numeric_only = Tidak ada, min_count = 0, **kwargs)



Di mana,





sumbu: {kolom (1), indeks (0)}

memesan: Abaikan nilai NA/null saat menghitung hasilnya.



tingkat: Jika sumbu yang ditentukan adalah hierarki (multi-indeks), hitung ke tingkat indeks tertentu sebelum mengonversi ke Seri.

numerik_saja: Hanya kolom float, int, dan boolean yang dapat diterima. Jika Tidak Ada, coba gunakan semuanya; jika tidak, hanya data numerik. Untuk Seri, tidak diterapkan.

jumlah_min: Jumlah nilai yang mungkin diperlukan untuk menyelesaikan operasi. Hasilnya akan menjadi NA jika ada lebih sedikit nilai non-NA daripada min_count.

Pengembalian: DataFrame (jika level ditentukan) atau Series.

Contoh #01: Tentukan Jumlah Kolom Dataframe dan Semua Kolom

Kami telah membutuhkan kerangka data terlebih dahulu dengan tipe data yang valid, yaitu, int, float, dll., kolom atau kolom yang dapat kami temukan jumlah datanya. Dataframe akan dibuat dengan menggunakan fungsi pd.DataFrame() .


Kami telah membuat kerangka data yang diperlukan dari kamus python di dalam fungsi pd.DataFrame() . Dalam kerangka data yang dibuat di atas, ada empat kolom “Nama”, “hari1”, “hari2”, dan “hari3”. Dari empat kolom, tiga kolom yaitu “hari1”, “hari2”, dan “hari3” adalah kolom numerik dengan nilai data (4, 4, 3, 2, 4, 6, 5, 3), (2, 4, 5, 2, 3, 4, 6, 2), dan (7, 4, 3, 5, 6, 2, 1, 4) masing-masing. Kami hanya dapat menemukan jumlah untuk tiga kolom ini. Jumlah untuk kedua seri (yaitu, kolom) dan seluruh kerangka data dapat ditentukan menggunakan metode sum() . Mari kita mulai dengan mengajarkan cara menjumlahkan semua data dalam kolom Pandas.


Untuk menentukan jumlah, kami menggunakan metode sum() pada kolom “hari2”. Fungsi telah mengembalikan nilai penjumlahan 28. Mirip dengan ini, kita dapat menentukan jumlah dari setiap kolom Dataframe. Cukup menggunakan metode sum() di seluruh kerangka data akan menyelesaikan ini.


Seperti yang dapat dilihat, jumlah kolom “hari1” adalah 31; untuk “hari2”, nilai penjumlahannya adalah 28, sedangkan untuk kolom “hari3”, nilai penjumlahannya adalah 32.

Contoh # 02: Menggunakan Fungsi sum() untuk Menjumlahkan Nilai Kolom Dataframe Bersama

Seperti yang Anda lihat dari output contoh sebelumnya, fungsi tersebut tidak mengembalikan data kolom bingkai data aktual yang membentuk penjumlahan. Namun, dengan menetapkan metode “DataFrame.sum()”  ke kolom DataFrame, Anda dapat mengakses setiap kolom di DataFrame, termasuk kolom jumlah. Pertama, kita membuat kerangka data lain untuk contoh ini.


Menggunakan pd.DataFrame() kerangka data kita telah dibuat. Kami telah membuat kerangka data dengan tiga kolom: item, harga, dan pajak. Item kolom yang berisi nilai string (“pena”, “spidol”, “penggaris”, “penghapus”, “pensil”, “papan klip”, “penjepret”, “pin”), harga kolom yang menyimpan nilai (20, 15, 10, 3, 5, 30, 35, 10), dan kolom “pajak” terdiri dari nilai (8, 5, 3, 3, 4, 10, 5, 2). Sekarang mari kita tambahkan nilai kolom harga dan pajak dan simpan hasilnya di kolom baru dengan mempertahankan kolom kerangka data asli.


Seperti yang dapat diperhatikan bersama dengan kolom baru 'total', kolom asli dari kerangka data yang diberikan juga dikembalikan oleh fungsi. Kolom “total” menyimpan jumlah nilai kolom “price” dan “tax” terhadap setiap data “item”.

Contoh # 03: Menggunakan Fungsi sum() untuk Menentukan Jumlah Kolom Dataframe yang Ditentukan

Untuk menjumlahkan beberapa kolom dari kerangka data bersama-sama, kita dapat menentukan daftar dengan label kolom dan kemudian menerapkan metode sum() pada daftar untuk menemukan jumlahnya. Seperti contoh sebelumnya, pertama-tama kita akan membuat kerangka data.


Kami telah membuat kerangka data kami dengan empat kolom 'siswa', 'nilai1', 'nilai2', dan 'nilai3'. Kolom “siswa” menyimpan data (“Larry”, “James”, “Rob”, “Arya”, “Max”, “Ben”, “Gwen”, “Bill”), dan kolom “marks1” menyimpan data nilai (8, 9, 6, 8, 10, 7, 9, 9), sedangkan kolom “tanda2” dan “tanda3” menyimpan nilai numerik (6, 6, 8, 6, 7, 9, 10, 9 ) dan (7, 6, 9, 7, 8, 7, 10, 10) masing-masing.


Pertama, kita telah membuat objek daftar dengan label kolom “siswa”, “nilai1”, dan “nilai3”. Kemudian metode sum() diterapkan ke daftar. Fungsi tersebut telah menjumlahkan nilai kolom mark1 dan mark3 hanya karena kolom “siswa” adalah non-numerik, sehingga fungsi sum() tidak dapat menemukan jumlah nilai kolom “siswa”. Kami telah menyimpan jumlah nilai kolom 'marks1' dan 'marks3' di kolom 'sum'.

Contoh # 04: Tambahkan Kolom Pandas Dataframe Yang Memenuhi Kondisi Tertentu

Dalam contoh ini, kami akan menambahkan nilai kolom yang ditentukan jika memenuhi kondisi yang ditentukan.


Ada 5 kolom dalam kerangka data yang baru dibuat, yaitu, “perusahaan”, “penjualan_minggu1”, “penjualan_minggu2”, “penjualan_minggu3”, dan “cabang”. Sekarang, misalkan kita tidak ingin menambahkan nilai kolom terakhir saat kita menambahkan atau menemukan jumlah nilai dari baris kerangka data yang diberikan. Katakanlah kita hanya ingin menambahkan nilai kolom dengan kata 'minggu' di labelnya. Pemahaman daftar dapat dibuat untuk menentukan apakah kata 'minggu' ada dalam label kolom atau tidak.


Sekarang kami telah mengambil kolom yang memiliki kata 'minggu' di labelnya. Kita dapat meringkas kolom yang berisi kata “minggu” menggunakan argumen axis=1 dalam fungsi sum().


Dengan cara ini, kita dapat dengan aman menjumlahkan data di seluruh kolom berdasarkan baris tanpa menyertakan kolom apa pun yang tidak kita inginkan.

Contoh # 5: Tentukan Jumlah Setelah Pengelompokan Data dari Dataframe

Kami juga dapat menemukan jumlah kolom kerangka data setelah mengelompokkan data dari satu atau lebih kolom. Metode groupby() akan digunakan untuk mengelompokkan data ke dalam kategori di dalam kolom. Mari kita buat kerangka data sehingga kita dapat mengelompokkan data dari salah satu kolomnya.


Sekarang kita akan mengelompokkan data di kolom “umur” dan menjumlahkan nilai kolom “score1” dan “score2” untuk setiap kategori grup.


Kita dapat melihat bahwa menjumlahkan data dalam kerangka data setelah terlebih dahulu mengelompokkan nilai data menurut usia menghasilkan jumlah kolom berdasarkan pengelompokan usia.

Kesimpulan

Dalam tutorial ini, kami mencoba mengajari Anda cara menghitung jumlah di seluruh kerangka data menggunakan metode penjumlahan Pandas. Kami telah membahas penambahan nilai baris dan kolom dalam contoh posting ini. Selain itu, Anda mempelajari cara menambahkan kolom secara kondisional dan cara menjumlahkan nilai setelah mengelompokkan kolom kerangka data. Sekarang Anda mungkin dapat menjumlahkan kolom kerangka data bersama-sama atau menjumlahkan nilai dalam kolom kerangka data sendiri.