Digitalisasi Dunia

Google Bard Berubah Jadi Gemini: Solusi AI yang Lebih Canggih

Astra Digital Assets Astra Digital 2· 27 Februari 2024
Astra Digital Assets

Google Bard pertama kali diluncurkan pada tanggal 6 Februari 2023 oleh CEO Google dan Alphabet, Sundar Pichai. Bard saat itu diluncurkan sebagai generative AI yang fokus pada kemampuan menulis dan menghasilkan teks. 

 

Selang setahun setelahnya, pada Februari 2024, Bard berevolusi menjadi Gemini, layanan AI Google yang kini mencakup berbagai kemampuan, seperti coding, penalaran logis, dan kolaborasi dalam proyek kreatif. Gemini kini tersedia dalam 40 bahasa dan dapat diakses di lebih dari 230 negara.

 

yKK5ccnpCObmb47xEGC_hxzP5g7tDsNCC8R7x-UxeEY0Asxskw9sC7Cftje__uSZlK14vEaX0wNVl4dDnwS5gGtYai3AskBDGXfXRwHMX-4iyzq6KikREwOI0zJWU9UtGFTYXKcoS6o6KnHmyFhjQlE

 

Berbagai Versi Gemini

Gemini pertama kali diluncurkan dengan sebutan Gemini 1.0. Secara umum, Google membagi Gemini menjadi 3 jenis:

  • Gemini Ultra — Gemini yang paling besar dan paling canggih. Model yang dibuat khusus untuk menangani tugas-tugas yang sangat kompleks dan data multimodal. Contoh pengaplikasiannya seperti penelitian dan pengembangan AI, pembuatan konten kreatif yang kompleks, serta analisis data yang rumit dengan kombinasi teks panjang (dokumen ratusan halaman), maupun gabungan antara data teks dengan gambar/video.
  • Gemini Pro — Gemini yang menyeimbangkan antara performa dan efisiensi, dan mampu menyelesaikan berbagai macam tugas. Contoh pengaplikasian adalah dalam penggunaan sehari-hari, seperti merangkum artikel, penerjemahan bahasa, atau pembuatan paragraf singkat. 
  • Gemini Nano — Gemini dengan versi paling efisien, yang disediakan untuk menyelesaikan tugas-tugas dalam perangkat dengan daya komputasi rendah. Contoh pengaplikasiannya adalah dalam perangkat mobile, di mana saat ini Gemini Nano sudah diimplementasikan di smartphone Google Pixel 8 Pro.

 

SD4CrUYnXFDjFnnqz15o6Bbi_rJhfWsuXUDb1xL5BSn8eJrtaM-5Bbburcvoqa1v3BRPCy6ZhOwS__Ink2h-RgMuz1Op9DspIk4dNmx00eRnEmZkmVFzDTKAaYI30TfeO_ZAj-XeMHKZnVuQE3ByOrI

 

Saat tulisan ini dibuat, Gemini versi 1.0 sudah dapat diakses oleh masyarakat umum lewat tautan https://gemini.google.com/app. Ada 2 jenis Gemini yang dapat diakses, yaitu:

  • Gemini Basic (Gemini 1.0 Pro): penggunaan Gemini secara gratis, hanya bisa untuk penggunaan dalam penelusuran web saja.
  • Gemini Advanced (Gemini 1.0 Ultra): penggunaan Gemini secara berbayar, dengan kemampuan yang lebih baik untuk memproses instruksi yang kompleks, memberikan analisis dan insight yang lebih komprehensif, dapat memberikan saran dan penjelasan terkait coding, serta dapat menjadi partner brainstorming dalam proses pembuatan konten kreatif. Gemini Advanced juga sudah terintegrasi dengan Google Workspace, sehingga bisa digunakan langsung dari Google Docs, Spreadsheet, Slides, dan lainnya. Untuk menikmati Gemini versi ini, pengguna harus berlangganan paket Google One AI Premium Plan mulai dari Rp309.000/bulan.

 

U6s1k7tyJFJbD8l0Jc1PfbmhqKluh6QtR2O2J2HQqvNolge56GSCLihaNS4peaJg0omJJTW2jY_poDylxA0IhKhLcPDyDYbc66qMuEB2zZEA2S2AlfuuW92WBYLDdweoGaiFhoE9nlZitc7SlnZyKRo

 

Gemini 1.5

Hanya selang kurang lebih satu minggu dari peluncuran Gemini 1.0 Ultra, Google kembali memberikan pengumuman telah hadirnya Gemini 1.5, juga pada bulan Februari 2024. Google pun menyatakan bahwa peningkatan ini membuat Gemini 1.5 Pro sudah "sekuat" Gemini 1.0 Ultra. Yuk, kenali apa saja perubahannya!

 

1. Ukuran “Context Window”

Sebuah model AI “context window” terbuat dari token, yang merupakan blok penyusun yang digunakan untuk memproses informasi. Token dapat berupa keseluruhan bagian atau subbagian dari kata, gambar, video, audio, atau kode. Semakin besar jendela konteks suatu model, semakin banyak informasi yang dapat diambil dan diproses dari sebuah prompt — menjadikan output-nya lebih konsisten, relevan, dan berguna.

  • Gemini 1.0: Dapat memproses hingga 32.000 token informasi. Hal ini sudah cukup mengesankan, namun masih terbatas dalam hal kedalaman pemahaman untuk menyelesaikan tugas-tugas yang lebih panjang atau sangat kompleks.
  • Gemini 1.5: Sudah dapat memproses hingga 1.000.000 token. Artinya, Gemini 1.5 dapat memahami lebih banyak informasi, sehingga output yang diberikan lebih komprehensif, beragam, dan akurat. Sebagai gambaran, Gemini 1.5 Pro dapat memproses video berdurasi 1 jam, audio berdurasi 11 jam, coding dengan lebih dari 30.000 baris atau lebih dari 700.000 kata, dalam satu prompt bersamaan.

 

s_aiVZ9MNxw8pbahmx1HPbGkYCNmhbL4FAsAm7y-o5froiax8SRJBm8smSWtFRkj7eCYX2In07LvTEAO1KBFXdQT3Rx0TcKbfQcULEp1ABwctAcCaQ8MaJ_COs60AR0n1Ur-STr5BP0sfHn6vgZ3CBw

 

2. Arsitektur

  • Gemini 1.0: Menggunakan arsitektur Transformer standar, yang memproses informasi sebagai “jaringan saraf tunggal” (single neural network).
  • Gemini 1.5: Memperkenalkan arsitektur Mixture-of-Experts (MoE). Arsitektur ini memungkinkan pembagian proses menjadi “jaringan-jaringan saraf” khusus yang lebih kecil, yang dipecah berdasarkan tugas. Hal ini mengakibatkan:
    • Peningkatan Efisiensi: Respons lebih cepat dengan daya komputasi yang dibutuhkan lebih sedikit.
    • Output Berkualitas Lebih Tinggi: Gemini 1.5 dapat menyesuaikan respons dengan lebih baik berdasarkan prompt yang diberikan.

 

3. Kemampuan Multimodal

  • Gemini 1.0: Kuat dalam tugas berbasis teks dan dapat menangani beberapa modalitas lainnya.
  • Gemini 1.5: Secara signifikan meningkatkan kemampuan memproses dan memahami audio dan video, di mana Gemini 1.5 dapat menganalisis klip audio, menyalinnya, atau "menonton" video dan mendeskripsikan kontennya. Selain itu, Gemini 1.5 juga dapat menjadi mitra pengkodean yang jauh lebih baik.

 

Secara singkat, perbedaan ini membuat Gemini 1.5 dapat:

  • Menangani instruksi yang lebih panjang dan rumit: sangat cocok untuk menangani penelitian, analisis, atau meringkas teks dalam jumlah besar.
  • Memahami konteks dan hubungan dalam informasi kompleks: Meningkatkan kemampuan menulis kreatif, bertukar pikiran, dan pemecahan masalah.
  • Menjadi mitra kolaboratif untuk proyek multimedia: Berguna untuk penulisan naskah, bekerja dengan konten video atau audio, atau proyek yang memerlukan pembuatan teks kreatif lainnya.

 

Saat ini, Google menawarkan pratinjau terbatas Gemini 1.5 Pro kepada developers dan perusahaan melalui AI Studio dan Vertex AI. Baca selengkapnya tentang ini di blog Google For Developers dan blog Google Cloud.

HUBUNGI KAMI

Ada pertanyaan?
Kami terbuka untuk berdiskusi dan melihat bagaimana kami bisa membantu Anda mewujudkan ide-ide yang ada.