Apa itu Arsitektur Sistem Gudang Data Amazon Redshift?

Apa Itu Arsitektur Sistem Gudang Data Amazon Redshift



Hosting dan pengelolaan data dalam database dan gudang data selalu menjadi tugas yang sibuk dan menyusahkan. Dibutuhkan banyak sumber daya dan daya komputasi untuk memahami data. Amazon Web Services memiliki solusi terpadu untuk tujuan ini. Ia memiliki layanan bernama Amazon Redshift yang sepenuhnya mengelola gudang data pengguna.

Artikel ini akan menjelaskan secara detail Amazon Redshift beserta arsitektur data warehouse-nya. Seluruh komponen arsitektur sistem gudang data Redshift akan dijelaskan secara detail.







Apa itu Amazon Redshift?

IT adalah layanan pergudangan data yang disediakan oleh Amazon. Ini secara efisien mengelola dan menganalisis kumpulan data besar untuk analisis dan pelaporan. Itu dibangun di atas model penyimpanan berbentuk kolom. Ia menggunakan cluster node komputasi yang dikendalikan oleh node pemimpin untuk menyediakan pemrosesan data berkinerja tinggi.



Dibutuhkan data dari berbagai sumber dan mengumpulkannya untuk membuat gudang data. Ini menawarkan berbagai fitur, seperti berbagi data dan analisis waktu nyata. Lihat gambar di bawah untuk memahami fitur dan kemampuan Amazon Redshift:







Mari kita menuju ke arsitektur sistem gudang datanya sekarang.

Apa itu Arsitektur Sistem Gudang Data Amazon Redshift?

Arsitektur sistem ini memiliki tiga bagian inti. Bagian-bagian tersebut adalah:



  • Penyimpanan
  • Percepatan
  • Komputasi

Mari kita pahami tujuannya:

Penyimpanan
Bagian penyimpanan berkaitan dengan layanan penyimpanan yang dimiliki Redshift. Ia memiliki opsi layanan penyimpanan terkelola sendiri serta opsi bucket S3.

Percepatan
Bagian akselerasi bergantung pada layanan penyimpanan yang digunakan dan daya komputasi yang digunakan. Penyimpanan yang dikelola Redshift lebih cepat dibandingkan opsi penyimpanan lainnya

Komputasi
Bagian komputasi hanya berkaitan dengan daya komputasi yang digunakan. Komputasi dilakukan dengan cluster dan cluster memiliki node. Node pada gilirannya memiliki irisan.

Untuk lebih memahami seluruh elemen dan komponen arsitektur ini, lihat gambar di bawah ini:

Mari kita pahami komponen-komponennya satu per satu.

Apa Komponen Arsitektur Amazon Redshift?

Berikut ini adalah komponen arsitektur Amazon Redshift:

  • Cluster
  • Node
  • Irisan Node
  • Penyimpanan
  • Jaringan Internal
  • Basis Data

Mari kita bahas satu per satu:

Cluster
Cluster adalah unit fundamental dan inti. Ini terdiri dari sejumlah node. Jika sebuah klaster terdiri dari beberapa node komputasi, node pemimpin tambahan akan berperan untuk mengoordinasikan aktivitas node komputasi ini dan mengelola komunikasi eksternal.

Node

Node dalam cluster terdiri dari dua jenis. Ini adalah:

  • Node Pemimpin
  • Node Komputasi

Mari kita pahami satu per satu:

Node Pemimpin
Ia mengelola komunikasi dengan program klien dan mengoordinasikan interaksi dengan node komputasi. Node pemimpin memainkan peran penting dalam menjalankan kueri yang kompleks. Ini mengkompilasi kode berdasarkan rencana eksekusi yang didistribusikan ke node komputasi dan menetapkan bagian data ke setiap node komputasi individu.

Node Komputasi
Node komputasi adalah tulang punggung arsitektur Amazon Redshift. Mereka melakukan penyimpanan dan pemrosesan data. Ini memiliki sumber daya khusus, seperti memori dan CPU.

Irisan Node
Node komputasi dibagi lagi menjadi beberapa irisan. Irisan ini bekerja sama untuk memproses beban kerja yang ditugaskan dan mencapai paralelisme untuk meningkatkan pemrosesan kueri.

Penyimpanan
Penyimpanan data dalam Amazon Redshift dikelola oleh “Redshift Managed Storage (RMS)”. Ia memiliki kemampuan untuk menskalakan penyimpanan secara mandiri menggunakan penyimpanan “Amazon S3”. RMS menggunakan penyimpanan lokal berbasis SSD berkinerja tinggi sebagai cache tingkat-1 yang mengoptimalkan kinerja.

Jaringan Internal
Jaringan internal di Amazon Redshift ini membantu komunikasi yang cepat dan aman antara node pemimpin dan node komputasi. Jaringan ini tidak dapat diakses langsung oleh aplikasi klien.

Basis Data
Cluster memiliki satu atau lebih database. Data dari database ini ada di node komputasi. Aplikasi klien berkomunikasi dengan node pemimpin. Node komputasi mengelola eksekusi kueri di seluruh node komputasi.

Ini semua tentang Amazon Redshift dan elemen arsitekturnya. Artikel ini telah menjelaskan secara komprehensif komponen kerja Amazon Redshift

Kesimpulan

Arsitektur Amazon Redshift adalah alasan di balik kemampuannya. Node pemimpin mengontrol dan mengelola node komputasi dan bantuan irisan node dalam pemrosesan paralel. Redshift Managed Storage menggunakan penyimpanan berbasis SSD untuk meningkatkan kinerja. Artikel ini telah menjelaskan Arsitektur Sistem Gudang Data Amazon Redshift.