Apa itu Tipe Data Amazon Redshift?

Apa Itu Tipe Data Amazon Redshift



Amazon Redshift adalah solusi cloud yang ditawarkan oleh AWS yang memenuhi tujuan gudang data. Gudang data adalah ruang besar di cloud yang menyimpan data dalam jumlah besar. Perbedaan antara gudang data dan database adalah bahwa yang pertama tidak hanya menyimpan data saat ini tetapi juga riwayat data yang lengkap.

Artikel ini akan mempelajari tentang Amazon Redshift oleh AWS dan tipe data yang didukung layanan ini.







Apa itu Amazon RedShift?

Ini adalah solusi cloud untuk pergudangan data yang didasarkan pada 'PostgreSQL' . Ini menggunakan teknologi yang disebut 'Pemrosesan Paralel Masif (MPP)' untuk memproses petabyte data dengan kecepatan kilat. Ini memberikan solusi mudah untuk prediksi real-time berdasarkan data historis dan solusi streaming.



Gambar berikut menunjukkan mekanisme kerja Amazon Redshift:







Penjelasan grafis tentang cara kerja Amazon Redshift ini sangat sederhana dan jelas. Ini memberi kami informasi tentang bagaimana data diambil dan diproses lebih lanjut untuk menghasilkan keluaran dan membuat aplikasi berbasis data.

Arsitektur gudang data Amazon Redshift juga dapat dilihat pada gambar di bawah ini:



Sekarang, kita akan menuju ke penggunaan dan fitur layanan ini.

Fitur

Seperti yang telah disebutkan, Amazon Redshift didasarkan pada PostgreSQL dan menggunakan teknologi yang disebut Massively Parallel Processing yang memungkinkannya memproses data berukuran petabyte dalam waktu singkat. Oleh karena itu, Redshift menawarkan banyak fitur dan kegunaan. Beberapa fitur tersebut adalah di bawah ini:

  • Keamanan dan Enkripsi Data.
  • Analisis bisnis.
  • Dukungan Aplikasi Berbasis Data.
  • Analisis Prediktif.
  • Pengulangan Tugas Otomatis.
  • Penskalaan Data Bersamaan.
  • Gudang Data.

Beberapa fitur tambahan dari layanan ini dapat dilihat pada gambar di bawah ini:

Ini adalah sebagian besar fitur yang ditawarkan Redshift dan sekarang kami akan beralih ke tipe data yang didukung oleh layanan ini.

Tipe Data

Amazon Redshift adalah solusi pergudangan data dengan banyak fitur. Ini mendukung tipe data terstruktur dan tidak terstruktur. Karena didasarkan pada PostgreSQL, data dapat dimanipulasi melalui kueri SQL sederhana.

Sekarang, muncul pertanyaan lain, yaitu bagaimana format data ini berbeda satu sama lain? Mari kita bahas kedua format data ini.

Data Terstruktur

Tipe data berformat tinggi yang mudah diterjemahkan oleh algoritme pembelajaran mesin disebut data terstruktur. Database SQL berfungsi dengan data terstruktur. Data terstruktur dalam bentuk tabel seperti data yang digunakan oleh database relasional

Salah satu sistem manajemen basis data SQL yang banyak digunakan adalah MYSQL. Arsitekturnya dapat dilihat di bawah ini pada gambar yang diberikan:

Data Tidak Terstruktur

Data tidak terstruktur adalah pola kurang dan format data kurang seperti data yang digunakan dalam database non-relasional. MongoDB adalah database non-relasional yang terkenal. Kueri SQL tidak berfungsi pada database non-relasional, jadi database ini juga disebut database NoSQL.

Seperti yang telah disebutkan, MongoDB adalah sistem manajemen basis data tidak terstruktur dan arsitekturnya dapat dilihat di bawah pada gambar berikut:

Kita telah membahas dua tipe data dasar yang digunakan dalam database dan sekarang kita akan menuju ke tipe data aktual yang didukung oleh Amazon Redshift. Tipe data ini adalah:

  • Data Numerik
  • Data Karakter
  • Data Tanggal dan Waktu
  • Data Boolean
  • Data HLSKETCH
  • Data SUPER
  • PENGGANTIAN Data

Mari kita bahas tipe data ini:

Data Numerik

Tipe data ini cukup jelas. Ini mendukung data yang berupa bilangan bulat, desimal, floating point, dan tipe data numerik lainnya.

Ciri-ciri tipe data integer dapat dilihat pada gambar di bawah ini:

Tipe data desimal menyimpan data berdasarkan presisi dari pengguna. Ciri-cirinya adalah sebagai berikut:

Data Karakter

Tipe data CHAR dan VARCHAR termasuk dalam kategori tipe data berbasis karakter. NCHAR dan NVARCHAR juga merupakan tipe data tipe karakter. Tidak seperti CHAR dan VARCHAR, kedua tipe data ini menyimpan karakter Unicode dengan panjang tetap. Mari kita lihat properti dari tipe data ini, seperti:

  • CHAR, CHARACTER, NCHAR memiliki jangkauan 4KB.
  • VARCHAR, NVARCHAR memiliki jangkauan 64KB.
  • BPCHAR memiliki jangkauan 256 Bytes.
  • TEXT memiliki jangkauan 260 Bytes.

Data Tanggal dan Waktu

Tipe data datetime adalah DATE, TIME, TIMETZ, TIMESTAMP, TIMESTAMPTZ. Kemampuan fungsional dari tipe data ini adalah sebagai berikut:

  • DATE hanya menyimpan tanggal kalender.
  • TIME menyimpan waktu tanpa merujuk ke zona waktu mana pun. Ini adalah UTC, secara default.
  • TIMETZ menyimpan waktu dengan mengacu pada zona waktu. Ini adalah UTC di tabel pengguna dan tabel sistem, secara default.
  • TIMESTAMP tidak hanya mencakup waktu tetapi juga tanggal. Ini adalah UTC di tabel pengguna dan tabel sistem, secara default.
  • TIMESTAMPTZ tidak hanya mencakup waktu tetapi juga tanggal. Ini adalah UTC hanya di tabel pengguna, secara default.

Data Boolean

Tipe data Boolean adalah tipe data biner, artinya hanya ada dua nilai. Tabel karakteristik untuk tipe data Boolean diberikan di bawah ini pada gambar:

Data HLSKETCH

Tipe data ini digunakan untuk menyimpan sketsa. Pergeseran merah dapat mewakili sketsa dalam bentuk jarang atau padat. Sketsa mulai jarang dan secara bertahap menjadi padat ketika format padat memberikan efisiensi lebih dengan mengikuti tautan.

Data SUPER

Tipe data ini berurusan dengan data tidak terstruktur yang bisa dalam bentuk array, struktur bersarang, atau JSON. Tidak ada model atau format data. Pengguna dapat menjelajahi lebih banyak informasi dengan menavigasi tautan.

PENGGANTIAN Data

Tipe data ini juga menyimpan karakter. Namun, panjangnya terbatas. Amazon Redshift memungkinkan transmisi data VARBYTE ke data tipe integer atau tipe karakter apa pun. Untuk mendapatkan informasi lebih lanjut tentang tipe data ini, ikuti tautan di bawah ini.

Ini semua yang ada untuk Amazon Redshift dan tipe data yang didukungnya.

Kesimpulan

Amazon Redshift adalah layanan AWS yang dalam bentuk dasarnya melayani tujuan gudang data tetapi merupakan solusi yang sangat andal dan berfitur untuk analitik dan prediksi. Artikel ini telah membahas Redshift dan tipe data yang didukungnya. Jenis data ini dijelaskan secara singkat beserta karakteristiknya.