15 tahun yang lalu para analis industri membicarakan teknologi database canggih yang mampu menampung data sebesar 1GB, hari ini, mereka mulai mendiskusikan database komersiil yang mendukung kapasitas dalam skala Petabyte (1.000 Terabyte, 1 Juta Gigabyte atau 1 milyar Megabyte). Yahoo sudah memiliki database berukuran lebih dari 1 Petabyte berbasis
PostgreSQL yang telah dimodifikasi. Sebagai contoh, Greenplum memiliki dua klien yang akan memiliki database berukuran lebih dari 1 Petabyte dalam dua bulan ini. Selain itu,
Netezza,
DATAllegro,
Dataupia dan
SAS juga sudah memiliki database dalam skala Petabyte. (via
Slashdot)
Information Week baru-baru ini mempublikasikan artikel yang membeberkan detil implementasi database Yahoo. Secara ringkasnya:
- Database web analytics Yahoo sudah lebih dari 1 Petabyte, dan akan mencapai 10 Petabyte tahun depan.
- Database web analytics Yahoo menggunakan PostgreSQL (bukan MySQL) yang telah dimodifikasi menjadi column based storage — lebih lambat dalam transaksi menulis, tetapi jauh lebih cepat melakukan transaksi baca.
- Yahoo berpendapat solusi column based storage komersiil masih belum siap pakai untuk database berukuran 100 Terabyte+.
- Yahoo mengatakan mereka mendapatkan keunggulan kecepatan yang besar dari mengoptimisasi sistem mereka untuk aplikasi spesifik.
Saya juga berusaha untuk menemukan ukuran database Google, tetapi tampaknya ukuran ini sangat dirahasiakan, walaupun mereka pernah mempublikasikan risetnya yang bernama
Bigtable. Google juga merupakan salah satu pemakai MySQL terbesar, walaupun belum jelas apakah aplikasi ini yang memperkuat indeks pencarian Google.
Komentar