Cara Menganalisis Data Teks di R: Dasar-dasar Manipulasi String

Cara Menganalisis Data Teks Di R Dasar Dasar Manipulasi String



String adalah tipe data terpopuler kedua dalam pemrograman R, dan manipulasi string adalah tugas penting dalam R. Operasi manipulasi string di R terdiri dari beberapa fungsi untuk menggunakan dan mengubah data teks, termasuk mengubah dan mengurai string. Pada artikel ini, kita akan mendalami beberapa fungsi yang membantu kita dalam manipulasi string. Fungsi-fungsi ini ada di dalam R dan digunakan untuk berbagai tujuan untuk melakukan tugas string.

Contoh 1: Dapatkan Posisi Pola dari String Menggunakan Fungsi Grep() di R

Untuk mengekstrak posisi pola tertentu dari string, fungsi grep() dari R digunakan.

grep('i+', c('fix', 'split', 'corn n', 'paint'), perl=TRUE, value=FALSE)

Di sini, kami menggunakan fungsi grep() di mana pola “+i” ditentukan sebagai argumen untuk dicocokkan dalam vektor string. Kami mengatur vektor karakter yang berisi empat string. Setelah itu, kami menetapkan argumen “perl” dengan nilai TRUE yang menunjukkan bahwa R menggunakan pustaka ekspresi reguler yang kompatibel dengan Perl, dan parameter “nilai” ditentukan dengan nilai “FALSE” yang digunakan untuk mengambil indeks elemen dalam vektor yang cocok dengan polanya.







Posisi pola “+i” dari setiap string karakter vektor ditampilkan pada output berikut:





Contoh 2: Cocokkan Pola Menggunakan Fungsi Gregexpr() di R

Selanjutnya, kita mengambil posisi indeks beserta panjang string tertentu di R menggunakan fungsi gregexpr().





char_vec <- c('BAHASA PEMROGRAMAN','RSCRIPT')
gregexpr('GRAMM', char_vec, useBytes = BENAR)

Di sini, kita menyetel variabel “char_vect” di mana string disediakan dengan karakter berbeda. Setelah itu, kita mendefinisikan fungsi gregexpr() yang mengambil pola string “GRAMM” untuk dicocokkan dengan string yang disimpan di “char_vec”. Kemudian, kita atur parameter useBytes dengan nilai “TRUE”. Parameter ini menunjukkan bahwa pencocokan harus dicapai byte demi byte, bukan karakter demi karakter.

Output berikut yang diambil dari fungsi gregexpr() mewakili indeks dan panjang kedua string vektor:



Contoh 3: Hitung Total Karakter dalam String Menggunakan Fungsi Nchar() di R

Metode nchar() yang kami implementasikan berikut ini juga memungkinkan kami menentukan berapa banyak karakter dalam string:

Res <- nchar('Hitung setiap karakter')
cetak(Res)

Di sini, kita memanggil metode nchar() yang diatur dalam variabel “Res”. Metode nchar() dilengkapi dengan string karakter panjang yang dihitung oleh metode nchar() dan memberikan jumlah karakter penghitung dalam string yang ditentukan. Kemudian, kita meneruskan variabel “Res” ke metode print() untuk melihat hasil dari metode nchar().

Hasilnya diterima dalam output berikut yang menunjukkan bahwa string yang ditentukan berisi 20 karakter:

Contoh 4: Ekstrak Substring dari String Menggunakan Fungsi Substring() di R

Kami menggunakan metode substring() dengan argumen “mulai” dan “berhenti” untuk mengekstrak substring tertentu dari string.

str<- substring('PAGI', 2, 4)
mencetak(str)

Di sini, kita memiliki variabel “str” tempat metode substring() dipanggil. Metode substring() mengambil string “PAGI” sebagai argumen pertama dan nilai “2” sebagai argumen kedua yang menunjukkan bahwa karakter kedua dari string akan diekstraksi, dan nilai argumen “4” menunjukkan bahwa karakter keempat harus diekstraksi. Metode substring() mengekstrak karakter dari string di antara posisi yang ditentukan.

Output berikut menampilkan substring yang diekstraksi yang terletak di antara posisi kedua dan keempat dalam string:

Contoh 5: Gabungkan String Menggunakan Fungsi Paste() di R

Fungsi paste() di R juga digunakan untuk manipulasi string yang menggabungkan string tertentu dengan memisahkan pembatas.

pesan1 <- 'Isi'
pesan2 <- 'Menulis'

tempel (pesan1, pesan2)

Di sini, kami menentukan string masing-masing ke variabel “msg1” dan “msg2”. Kemudian, kita menggunakan metode paste() dari R untuk menggabungkan string yang disediakan menjadi satu string. Metode paste() mengambil variabel string sebagai argumen dan mengembalikan string tunggal dengan spasi default di antara string.

Setelah metode paste() dijalankan, output mewakili string tunggal dengan spasi di dalamnya.

Contoh 6: Memodifikasi String Menggunakan Fungsi Substring() di R

Selanjutnya, kita juga dapat memperbarui string dengan menambahkan substring atau karakter apa pun ke dalam string menggunakan fungsi substring() menggunakan skrip berikut:

str1 <- 'Pahlawan'
substring(str1, 5, 6) <- 'ic'

cat('    String yang Dimodifikasi:', str1)

Kami menetapkan string 'Pahlawan' di dalam variabel 'str1'. Kemudian, kami menerapkan metode substring() di mana “str1” ditentukan bersama dengan nilai indeks “mulai” dan “berhenti” substring. Metode substring() ditugaskan dengan substring “iz” yang ditempatkan pada posisi yang ditentukan dalam fungsi untuk string yang diberikan. Setelah itu, kami menggunakan fungsi cat() dari R yang mewakili nilai string yang diperbarui.

Output yang menampilkan string diperbarui dengan yang baru menggunakan metode substring():

Contoh 7: Format String Menggunakan Fungsi Format() di R

Namun, operasi manipulasi string di R juga mencakup pemformatan string yang sesuai. Untuk ini, kami menggunakan fungsi format() di mana string dapat disejajarkan dan mengatur lebar string tertentu.

penempatan1 <- format('Program', lebar = 10, justify = 'l')
penempatan2 <- format('Program', lebar = 10, justify = 'r')
penempatan3 <- format('Program', lebar = 10, justify = 'c')

cetak(penempatan1)
cetak(penempatan2)
cetak(penempatan3)

Di sini, kami menetapkan variabel “penempatan1” yang disediakan dengan metode format(). Kami meneruskan string “program” untuk diformat ke metode format(). Lebarnya diatur, dan perataan string diatur ke kiri menggunakan argumen “justify”. Demikian pula, kita membuat dua variabel lagi, “penempatan2” dan “penempatan2”, dan menerapkan metode format() untuk memformat string yang disediakan sesuai dengan itu.

Outputnya menampilkan tiga gaya pemformatan untuk string yang sama pada gambar berikut termasuk perataan kiri, kanan, dan tengah:

Contoh 8: Ubah String menjadi Huruf Kecil dan Huruf Besar di R

Selain itu, kita juga dapat mengubah string dalam huruf kecil dan huruf besar menggunakan fungsi tolower() dan toupper() sebagai berikut:

s1 <- 'MAKANAN YANG BAIK HIDUP YANG BAIK'
hasil1 <- lebih rendah(s1)

mencetak(hasil1)

s2 <- 'Bahasa pemrograman r di'
hasil2 <- puncak(s2)

mencetak(hasil2)

Di sini kami menyediakan string yang berisi karakter huruf besar dan kecil. Setelah itu, string disimpan dalam variabel “s1”. Kemudian, kita memanggil metode tolower() dan meneruskan string “s1” di dalamnya untuk mengubah semua karakter di dalam string menjadi huruf kecil. Kemudian kita mencetak hasil dari metode tolower() yang disimpan dalam variabel “result1”. Selanjutnya, kita menetapkan string lain dalam variabel “s2” yang berisi semua karakter dalam huruf kecil. Kami menerapkan metode toupper() pada string “s2” ini untuk mengubah string yang ada menjadi huruf besar.

Outputnya menampilkan kedua string dalam kasus tertentu pada gambar berikut:

Kesimpulan

Kami mempelajari berbagai cara untuk mengelola dan menganalisis string yang disebut manipulasi string. Kami mengekstrak posisi karakter dari string, menggabungkan string yang berbeda, dan mengubah string ke dalam case yang ditentukan. Selain itu, kami memformat string, memodifikasi string, dan berbagai operasi lainnya dilakukan di sini untuk memanipulasi string.