Dapatkan Jumlah Kolom di R DataFrame

Dapatkan Jumlah Kolom Di R Dataframe



Di R, mendapatkan jumlah kolom adalah operasi dasar yang diperlukan dalam banyak situasi saat bekerja dengan DataFrames. Saat membuat subset, menganalisis, memanipulasi, menerbitkan, dan memvisualisasikan data, jumlah kolom adalah informasi penting yang perlu diketahui. Oleh karena itu, R memberikan pendekatan berbeda untuk mendapatkan total kolom dari DataFrame yang ditentukan. Pada artikel ini, kita akan membahas beberapa pendekatan yang membantu kita mendapatkan jumlah kolom dari DataFrame.

Contoh 1: Menggunakan Fungsi Ncol()

ncol() adalah fungsi yang paling sering digunakan untuk mendapatkan total kolom DataFrames.







df <- data.frame('y1' = c(10, 12, 14, 19),

'y2' = c(15, 22, 24, 29),
'y3' = c(25, 32, 34, 39))


n <- ncol(df)

cat('-----Jumlah kolom dalam Data Frame :', n)

Dalam contoh ini, pertama-tama kita membuat DataFrame 'df' dengan tiga kolom yang diberi label sebagai 'y1', 'y2', dan 'y3' menggunakan fungsi data.frame() di R. Elemen di setiap kolom ditentukan menggunakan fungsi c() yang membuat vektor elemen. Kemudian, dengan menggunakan variabel “n”, fungsi ncol() digunakan untuk menentukan jumlah kolom dalam DataFrame “df”. Terakhir, dengan pesan deskriptif dan variabel “n”, fungsi cat() yang disediakan akan mencetak hasilnya di konsol.



Seperti yang diharapkan, keluaran yang diambil menunjukkan bahwa DataFrame yang ditentukan memiliki tiga kolom:







Contoh 2: Hitung Total Kolom untuk Bingkai Data Kosong

Selanjutnya, kami menerapkan fungsi ncol() ke DataFrame kosong yang juga mendapatkan nilai dari total kolom tetapi nilainya nol.

empty_df <- data.frame()

n <- ncol(kosong_df)

cat('---Kolom dalam Bingkai Data :', n)

Dalam contoh ini, kami menghasilkan DataFrame kosong, 'empty_df', dengan memanggil data.frame() tanpa menentukan kolom atau baris apa pun. Selanjutnya, kita menggunakan fungsi ncol() yang digunakan untuk mencari jumlah kolom pada DataFrame. Fungsi ncol() diatur dengan DataFrame 'empty_df' di sini untuk mendapatkan total kolom. Karena DataFrame 'empty_df' kosong, tidak ada kolom. Jadi, output dari ncol(empty_df) adalah 0. Hasilnya ditampilkan oleh fungsi cat() yang diterapkan di sini.



Output menunjukkan nilai '0' seperti yang diharapkan karena DataFrame kosong.

Contoh 3: Menggunakan Fungsi Select_If() dengan Fungsi Length()

Jika kita ingin mengambil jumlah kolom dari tipe tertentu, kita harus menggunakan fungsi select_if() bersamaan dengan fungsi length() dari R. Fungsi ini digunakan yang digabungkan untuk mendapatkan total kolom dari setiap tipe . Kode untuk menggunakan fungsi-fungsi ini diimplementasikan sebagai berikut:

perpustakaan (dplyr)

x1<-LETTERS[1:10]

x2<-rpois(10,2)

x3<-rpois(10,5)

x4<-sample(c('Musim Panas', 'Musim Dingin'),10,replace=TRUE)

df1<-data.frame(x1,x2,x3,x4)

df1

panjang(select_if(df1,is.numerik))

Dalam contoh ini, pertama-tama kita memuat paket dplyr sehingga kita dapat mengakses fungsi select_if() dan fungsi length(). Kemudian, kami membuat empat variabel – “x1”, “x2”, “x3” dan “x4”, masing-masing. Di sini, 'x1' berisi 10 huruf besar pertama dari abjad Inggris. Variabel 'x2' dan 'x3' dihasilkan menggunakan fungsi rpois() untuk membuat dua vektor terpisah dari 10 angka acak dengan parameter 2 dan 5, masing-masing. Variabel “x4” adalah vektor faktor dengan 10 elemen yang diambil sampelnya secara acak dari vektor c (“Musim Panas”, “Musim Dingin”).

Kemudian, kami mencoba membuat DataFrame 'df1' di mana semua variabel diteruskan dalam fungsi data.frame() . Terakhir, kita memanggil fungsi length() untuk menentukan panjang DataFrame “df1” yang dibuat menggunakan fungsi select_if() dari paket dplyr. Fungsi select_if() memilih kolom dari DataFrame “df1” sebagai argumen dan fungsi is.numeric() hanya memilih kolom yang berisi nilai numerik. Kemudian, fungsi length() mendapatkan total kolom yang dipilih oleh select_if() yang merupakan output dari keseluruhan kode.

Panjang kolom ditampilkan dalam output berikut yang menunjukkan total kolom DataFrame:

Contoh 4: Menggunakan Fungsi Sapply()

Sebaliknya, jika kita hanya ingin menghitung nilai kolom yang hilang, kita memiliki fungsi sapply(). Fungsi sapply() mengulang setiap kolom DataFrame untuk beroperasi secara khusus. Fungsi sapply() pertama kali diteruskan dengan DataFrame sebagai argumen. Kemudian, dibutuhkan operasi yang akan dilakukan pada DataFrame tersebut. Implementasi fungsi sapply() untuk mendapatkan jumlah nilai NA di kolom DataFrame disediakan sebagai berikut:

new_df <- data.frame(c1 = c(10, 11, NA, 13, NA),

c2 = c('N', NA, 'A', 'M', 'E'),
c3 = c(NA, 92, NA, NA, 95))

sapply(new_df, function(x) sum(is.na(x)))

Dalam contoh ini, kami menghasilkan DataFrame 'new_df' dengan tiga kolom - 'c1', 'c2', dan 'c3'. Kolom pertama, 'c1' dan 'c3', berisi nilai numerik termasuk beberapa nilai yang hilang yang diwakili oleh NA. Kolom kedua, 'c2', berisi karakter termasuk beberapa nilai yang hilang yang juga diwakili oleh NA. Kemudian, kita menerapkan fungsi sapply() ke DataFrame “new_df” dan menghitung jumlah nilai yang hilang di setiap kolom menggunakan ekspresi sum() di dalam fungsi sapply().

Fungsi is.na() adalah ekspresi yang ditentukan ke fungsi sum() yang mengembalikan vektor logis yang menunjukkan apakah setiap elemen dalam kolom hilang atau tidak. Fungsi sum() menjumlahkan nilai BENAR untuk menghitung jumlah nilai yang hilang di setiap kolom.

Oleh karena itu, output menampilkan nilai NA total di setiap kolom:

Contoh 5: Menggunakan Fungsi Dim()

Selain itu, kami ingin mendapatkan total kolom bersama dengan baris DataFrame. Kemudian, fungsi dim() menyediakan dimensi DataFrame. Fungsi dim() mengambil objek sebagai argumen yang dimensinya ingin kita ambil. Berikut kode untuk menggunakan fungsi dim() :

d1 <- data.frame(team=c('t1', 't2', 't3', 't4'),

poin=c(8, 10, 7, 4))

redup (d1)

Dalam contoh ini, pertama-tama kita mendefinisikan DataFrame 'd1' yang dihasilkan menggunakan fungsi data.frame() di mana dua kolom ditetapkan sebagai 'tim' dan 'poin'. Setelah itu, kita memanggil fungsi dim() di atas DataFrame “d1”. Fungsi dim() mengembalikan jumlah baris dan kolom DataFrame. Oleh karena itu, saat kita menjalankan dim(d1), ia mengembalikan vektor dengan dua elemen – yang pertama mencerminkan jumlah baris dalam DataFrame “d1” dan yang kedua mewakili jumlah kolom.

Output mewakili dimensi DataFrame di mana nilai '4' menunjukkan total kolom dan nilai '2' mewakili baris:

Kesimpulan

Kami sekarang belajar bahwa menghitung jumlah kolom di R adalah operasi sederhana dan penting yang dapat dilakukan pada DataFrame. Di antara semua fungsi, fungsi ncol() adalah cara yang paling nyaman. Sekarang, kita sudah familiar dengan berbagai cara untuk mendapatkan jumlah kolom dari DataFrame yang diberikan.