ikuti Young di Google News

Gemini AI : Model AI Google Yang Terbesar dan Paling Mumpuni

Gemini AI teknologi yang menjanjikan dengan potensi untuk mengubah cara kita berinteraksi dengan komputer. Ini dapat membuat komputer lebih cerdas.
Google Gemini AI
Google Gemini AI

Apa Itu Gemini AI Google?

Gemini AI adalah rangkaian model bahasa besar multimodal yang dikembangkan oleh Google DeepMind. Ini berfungsi sebagai penerus LaMDA dan PaLM 2.

Janji akan dunia yang diberdayakan secara bertanggung jawab oleh AI terus mendorong pekerjaan di Google DeepMind. Sejak lama, Google ingin membangun model AI generasi baru, yang terinspirasi oleh cara manusia memahami dan berinteraksi dengan dunia. AI yang tidak terasa seperti perangkat lunak cerdas, melainkan lebih seperti sesuatu yang berguna dan intuitif — seorang penolong atau asisten ahli.

Google selangkah lebih dekat dengan visi ini dengan memperkenalkan Gemini,  model paling mumpuni dan umum yang pernah google buat.

Gemini adalah hasil upaya kolaboratif berskala besar yang dilakukan tim di seluruh Google, termasuk kolega di Google Research. Teknologi ini dibangun dari awal menjadi multimodal, yang berarti dapat menggeneralisasi dan memahami dengan lancar, beroperasi di seluruh dan menggabungkan berbagai jenis informasi termasuk teks, kode, audio, gambar, dan video.

Gemini juga merupakan model google yang paling fleksibel — mampu menjalankan segala hal secara efisien mulai dari pusat data hingga perangkat seluler. Kemampuan canggihnya akan secara signifikan meningkatkan cara pengembang dan pelanggan perusahaan membangun dan meningkatkan skala dengan AI.

Google telah mengoptimalkan Gemini 1.0, versi pertama google, Gemini AI terdiri dari tiga model:

  1. Gemini Ultra adalah model terbesar dan paling kuat dari ketiganya. Ini memiliki 1,6 triliun parameter dan dapat dilatih pada dataset besar teks dan kode.
  2. Gemini Pro adalah model berukuran menengah. Ini memiliki 100 miliar parameter dan dapat dilatih pada dataset teks yang lebih kecil.
  3. Gemini Nano adalah model terkecil dan paling efisien. Ini memiliki 10 miliar parameter dan dapat dilatih pada dataset teks yang sangat kecil.
Gemini AI dapat melakukan berbagai tugas, termasuk:
  1. Memahami dan menjawab pertanyaan. Gemini AI dapat memahami pertanyaan yang kompleks dan memberikan jawaban yang akurat dan informatif.
  2. Menghasilkan format teks kreatif. Gemini AI dapat menghasilkan format teks kreatif, seperti puisi, kode, skrip, karya musik, email, surat, dll.
  3. Menerjemahkan bahasa. Gemini AI dapat menerjemahkan bahasa dengan akurat dan lancar.
  4. Menulis berbagai jenis konten. Gemini AI dapat menulis berbagai jenis konten, seperti artikel, laporan, blog, dll.
Gemini AI masih dalam pengembangan, tetapi telah menunjukkan potensi yang sangat besar. Ini dapat digunakan untuk berbagai aplikasi, termasuk:
  • Aplikasi asisten virtual. Gemini AI dapat digunakan untuk membuat asisten virtual yang lebih cerdas dan informatif.
  • Aplikasi terjemahan. Gemini AI dapat digunakan untuk meningkatkan kualitas terjemahan mesin.
  • Aplikasi pendidikan. Gemini AI dapat digunakan untuk membuat alat pembelajaran yang lebih interaktif dan menarik.
  • Aplikasi bisnis. Gemini AI dapat digunakan untuk meningkatkan efisiensi dan produktivitas bisnis.

Pertunjukan tercanggih

Google telah menguji model Gemini secara ketat dan mengevaluasi kinerjanya dalam berbagai tugas. Dari pemahaman gambar alami, audio dan video hingga penalaran matematis, kinerja Gemini Ultra melampaui hasil canggih saat ini pada 30 dari 32 tolok ukur akademik yang banyak digunakan dalam penelitian dan pengembangan Large Language Model (LLM).

Dengan skor 90,0%, Gemini Ultra adalah model pertama yang mengungguli pakar manusia dalam MMLU (Massive Multitask Language Understanding), yang menggunakan kombinasi 57 mata pelajaran seperti matematika, fisika, sejarah, hukum, kedokteran, dan etika untuk menguji kedua dunia  pengetahuan dan kemampuan memecahkan masalah.

Pendekatan benchmark baru Google terhadap MMLU memungkinkan Gemini menggunakan kemampuan penalarannya untuk berpikir lebih hati-hati sebelum menjawab pertanyaan sulit, sehingga menghasilkan peningkatan signifikan dibandingkan hanya menggunakan kesan pertamanya.

Gemini AI : Model AI Google Yang Terbesar dan Paling Mumpuni
Gemini melampaui kinerja canggih pada berbagai tolok ukur termasuk teks dan pengkodean.

Gemini Ultra juga mencapai skor mutakhir sebesar 59,4% pada tolok ukur MMMU baru, yang terdiri dari tugas-tugas multimodal yang mencakup domain berbeda yang memerlukan penalaran yang disengaja.

Dengan tolok ukur gambar yang Google uji, Gemini Ultra mengungguli model canggih sebelumnya, tanpa bantuan sistem pengenalan karakter optik (OCR) yang mengekstrak teks dari gambar untuk diproses lebih lanjut. Tolok ukur ini menyoroti multimodalitas asli Gemini dan menunjukkan tanda-tanda awal kemampuan penalaran Gemini yang lebih kompleks.

Lihat detail lebih lanjut di laporan teknis Gemini Google.

Gemini melampaui kinerja tercanggih dalam berbagai tolok ukur multimodal.
Gemini melampaui kinerja tercanggih dalam berbagai tolok ukur multimodal.

Gemini Memiliki Kemampuan Generasi Berikutnya

Hingga saat ini, pendekatan standar untuk membuat model multimodal melibatkan pelatihan komponen terpisah untuk modalitas berbeda dan kemudian menyatukannya untuk meniru beberapa fungsi ini secara kasar. Model-model ini terkadang pandai melakukan tugas-tugas tertentu, seperti mendeskripsikan gambar, tetapi kesulitan dengan penalaran yang lebih konseptual dan kompleks.

Google merancang Gemini untuk menjadi multimodal asli, yang telah dilatih sejak awal mengenai berbagai modalitas. Kemudian kami menyempurnakannya dengan data multimoda tambahan untuk lebih menyempurnakan efektivitasnya. Hal ini membantu Gemini memahami dan mempertimbangkan semua jenis masukan dari awal dengan lancar, jauh lebih baik daripada model multimoda yang ada — dan kemampuannya merupakan yang tercanggih di hampir setiap domain.

Pelajari lebih lanjut tentang Cara Kerja dan Kemampuan Gemini Google.

Alasan Yang Canggih

Kemampuan penalaran multimodal Gemini 1.0 yang canggih dapat membantu memahami informasi tertulis dan visual yang kompleks. Hal ini menjadikannya ahli dalam mengungkap pengetahuan yang mungkin sulit dipahami di tengah banyaknya data.

Kemampuannya yang luar biasa dalam mengekstraksi wawasan dari ratusan ribu dokumen melalui membaca, menyaring, dan memahami informasi akan membantu menghasilkan terobosan baru dengan kecepatan digital di berbagai bidang mulai dari sains hingga keuangan.

Gemini membuka wawasan ilmiah baru.

Memahami teks, gambar, audio, dan lainnya

Gemini 1.0 dilatih untuk mengenali dan memahami teks, gambar, audio, dan lainnya secara bersamaan, sehingga lebih memahami berbagai informasi dan dapat menjawab pertanyaan terkait topik rumit. Hal ini membuatnya sangat baik dalam menjelaskan penalaran dalam mata pelajaran yang kompleks seperti matematika dan fisika.

Gemini AI menjelaskan penalaran dalam matematika dan fisika.

Pengkodean tingkat lanjut

Gemini versi pertama Google dapat memahami, menjelaskan, dan menghasilkan kode berkualitas tinggi dalam bahasa pemrograman paling populer di dunia, seperti Python, Java, C++, dan Go. Kemampuannya untuk bekerja lintas bahasa dan mempertimbangkan informasi yang kompleks menjadikannya salah satu model dasar pengkodean terkemuka di dunia.

Gemini Ultra unggul dalam beberapa tolok ukur pengkodean, termasuk HumanEval, standar industri penting untuk mengevaluasi kinerja tugas pengkodean, dan Natural2Code, kumpulan data internalnya, yang menggunakan sumber buatan penulis, bukan informasi berbasis web.

Gemini juga dapat digunakan sebagai mesin untuk sistem pengkodean yang lebih maju. Dua tahun lalu Google memperkenalkan AlphaCode, sistem pembuatan kode AI pertama yang mencapai tingkat kinerja kompetitif dalam kompetisi pemrograman.

Dengan menggunakan versi khusus Gemini, Google menciptakan sistem pembuatan kode yang lebih canggih, AlphaCode 2, yang unggul dalam memecahkan masalah pemrograman kompetitif yang lebih dari sekadar pengkodean hingga melibatkan matematika kompleks dan ilmu komputer teoretis.

Gemini unggul dalam coding dan pemrograman kompetitif.

Ketika dievaluasi pada platform yang sama dengan AlphaCode asli, AlphaCode 2 menunjukkan peningkatan besar-besaran, menyelesaikan hampir dua kali lebih banyak masalah, dan kami memperkirakan kinerjanya lebih baik daripada 85% peserta kompetisi — naik dari hampir 50% untuk AlphaCode. Ketika pemrogram berkolaborasi dengan AlphaCode 2 dengan mendefinisikan properti tertentu untuk diikuti sampel kode, kinerjanya menjadi lebih baik.

Kami sangat antusias dengan semakin banyaknya programmer yang menggunakan model AI berkemampuan tinggi sebagai alat kolaboratif yang dapat membantu mereka mempertimbangkan masalah, mengusulkan desain kode, dan membantu implementasi — sehingga mereka dapat merilis aplikasi dan merancang layanan yang lebih baik dengan lebih cepat.

Lihat detail lebih lanjut di laporan teknis AlphaCode 2 Google.


Lebih andal, terukur, dan efisien

Google melatih Gemini 1.0 dalam skala besar pada infrastrukturnya yang dioptimalkan untuk AI menggunakan Tensor Processing Unit (TPU) v4 dan v5e yang dirancang sendiri oleh Google. Dan mereka merancangnya agar menjadi model yang paling andal dan terukur untuk dilatih, serta paling efisien untuk dilayani.

Pada TPU, Gemini berjalan jauh lebih cepat dibandingkan model sebelumnya, lebih kecil, dan berkemampuan lebih rendah. Akselerator AI yang dirancang khusus ini telah menjadi inti dari produk Google yang didukung AI yang melayani miliaran pengguna seperti Penelusuran, YouTube, Gmail, Google Maps, Google Play, dan Android. Hal ini juga memungkinkan perusahaan di seluruh dunia untuk melatih model AI skala besar dengan biaya yang efisien.

Google mengumumkan sistem TPU yang paling kuat, efisien, dan skalabel hingga saat ini, Cloud TPU v5p, yang dirancang untuk melatih model AI mutakhir. TPU generasi berikutnya ini akan mempercepat pengembangan Gemini dan membantu pengembang dan pelanggan perusahaan melatih model AI generatif berskala besar dengan lebih cepat, sehingga memungkinkan produk dan kemampuan baru menjangkau pelanggan lebih cepat.

Deretan superkomputer akselerator Cloud TPU v5p AI di pusat data Google.

Gemini AI Dibangun Dengan Tanggung Jawab dan Keselamatan Sebagai Intinya

Di Google, mereka berkomitmen untuk memajukan AI yang berani dan bertanggung jawab dalam segala hal yang kami lakukan. Berdasarkan Prinsip AI Google dan kebijakan keselamatan yang ketat di seluruh produknya, Google sendiri menambahkan perlindungan baru untuk memperhitungkan kemampuan multimoda Gemini. Pada setiap tahap pengembangan, kami mempertimbangkan potensi risiko dan berupaya menguji serta memitigasinya.

Gemini memiliki evaluasi keamanan paling komprehensif dibandingkan model AI Google mana pun hingga saat ini, termasuk bias dan tocicity. Goovle telah melakukan penelitian baru terhadap area risiko potensial seperti pelanggaran dunia maya, persuasi, dan otonomi, serta telah menerapkan teknik pengujian adversarial terbaik di kelasnya dari Google Research untuk membantu mengidentifikasi masalah keamanan penting sebelum penerapan Gemini.

Untuk mengidentifikasi kelemahan dalam pendekatan evaluasi internalnya, Google bekerja sama dengan beragam kelompok pakar dan mitra eksternal untuk menguji model mereka dalam berbagai permasalahan.

Untuk mendiagnosis masalah keamanan konten selama fase pelatihan Gemini dan memastikan keluarannya sesuai dengan kebijakannya, Google menggunakan tolok ukur seperti Real Toxicity Prompts, serangkaian 100.000 perintah dengan berbagai tingkat toksisitas yang diambil dari web, yang dikembangkan oleh para ahli di Allen Institute untuk AI. Rincian lebih lanjut mengenai pekerjaan ini akan segera hadir.

Untuk membatasi bahaya, mereka membuat pengklasifikasi keamanan khusus untuk mengidentifikasi, memberi label, dan memilah konten yang melibatkan kekerasan atau stereotip negatif, misalnya. Dikombinasikan dengan filter yang kuat, pendekatan berlapis ini dirancang untuk membuat Gemini lebih aman dan inklusif bagi semua orang. Selain itu, mereka terus mengatasi tantangan umum untuk model seperti faktualitas, landasan, atribusi, dan pembuktian.

Tanggung jawab dan keselamatan akan selalu menjadi inti pengembangan dan penerapan model mereka. Ini adalah komitmen jangka panjang yang memerlukan pembangunan secara kolaboratif, jadi Google bermitra dengan industri dan ekosistem yang lebih luas dalam mendefinisikan praktik terbaik dan menetapkan tolok ukur keselamatan dan keamanan melalui organisasi seperti MLCommons, Frontier Model Forum dan AI Safety Fund, dan Secure AI Framework (SAIF), yang dirancang untuk membantu memitigasi risiko keamanan khusus untuk sistem AI di sektor publik dan swasta. Google akan terus bermitra dengan para peneliti, pemerintah, dan kelompok masyarakat sipil di seluruh dunia seiring google mengembangkan Gemini AI.


Membuat Gemini tersedia bagi dunia

Gemini 1.0 kini diluncurkan di berbagai produk dan platform:

Gemini Pro di produk Google

Google menghadirkan Gemini kepada miliaran orang melalui produk Google.

Bard akan menggunakan versi Gemini Pro yang telah disempurnakan untuk penalaran, perencanaan, pemahaman lebih lanjut, dan banyak lagi. Ini adalah peningkatan terbesar pada Bard sejak diluncurkan. Ini akan tersedia dalam bahasa Inggris di lebih dari 170 negara dan wilayah, dan mereka berencana untuk memperluas ke berbagai modalitas dan mendukung bahasa dan lokasi baru dalam waktu dekat.

Mereka juga menghadirkan Gemini ke Pixel. Pixel 8 Pro adalah smartphone pertama yang dirancang untuk menjalankan Gemini Nano, yang mendukung fitur-fitur baru seperti Summarize di aplikasi Recorder dan diluncurkan di Smart Reply di Gboard, dimulai dengan WhatsApp, Line, dan KakaoTalk — dengan lebih banyak aplikasi perpesanan yang hadir tahun depan.

Dalam beberapa bulan mendatang, Gemini akan tersedia di lebih banyak produk dan layanan Google seperti Penelusuran, Iklan, Chrome, dan Duet AI.

Kami sudah mulai bereksperimen dengan Gemini dalam Penelusuran, yang menjadikan Search Generative Experience (SGE) Google lebih cepat bagi pengguna, dengan pengurangan latensi bahasa Inggris di AS sebesar 40%, serta peningkatan kualitas.

Membangun dengan Gemini

Pada 13 Desember, pengembang dan pelanggan perusahaan dapat mengakses Gemini Pro melalui Gemini API di Google AI Studio atau Google Cloud Vertex AI.

Google AI Studio adalah alat pengembang berbasis web gratis untuk membuat prototipe dan meluncurkan aplikasi dengan cepat menggunakan kunci API. Ketika tiba waktunya untuk platform AI yang terkelola sepenuhnya, Vertex AI memungkinkan penyesuaian Gemini dengan kontrol data penuh dan memanfaatkan fitur Google Cloud tambahan untuk keamanan, keselamatan, privasi, serta tata kelola dan kepatuhan data perusahaan.

Developer Android juga akan dapat melakukan build dengan Gemini Nano, model google yang paling efisien untuk tugas di perangkat, melalui AICore, kemampuan sistem baru yang tersedia di Android 14, dimulai pada perangkat Pixel 8 Pro. Mendaftarlah untuk pratinjau awal AICore.

Gemini Ultra Segera Hadir

Untuk Gemini Ultra, saat ini google sedang menyelesaikan pemeriksaan kepercayaan dan keamanan yang ekstensif, termasuk pembentukan tim merah oleh pihak eksternal yang tepercaya, dan menyempurnakan lebih lanjut model tersebut menggunakan Reinforcement Learning From Human Feedback (RLHF) sebelum menjadikannya tersedia secara luas.

Sebagai bagian dari proses ini, mereka akan membuat Gemini Ultra tersedia bagi pelanggan, pengembang, mitra, dan pakar keselamatan dan tanggung jawab terpilih untuk eksperimen awal dan masukan sebelum meluncurkannya kepada pengembang dan pelanggan perusahaan pada awal tahun 2024.

Awal 2024, Google juga akan meluncurkan Bard Advanced, pengalaman AI baru dan mutakhir yang memberi Anda akses ke model dan kemampuan terbaik kami, dimulai dengan Gemini Ultra.


The Gemini Era : Memungkinkan Inovasi Masa Depan

Ini merupakan tonggak penting dalam pengembangan AI, dan awal dari era baru bagi mereka di Google seiring mereka terus berinovasi dengan cepat dan meningkatkan kemampuan model kami secara bertanggung jawab.

Google telah membuat kemajuan besar pada Gemini sejauh ini dan mereka bekerja keras untuk memperluas kemampuannya untuk versi mendatang, termasuk kemajuan dalam perencanaan dan memori, dan meningkatkan jendela konteks untuk memproses lebih banyak informasi guna memberikan respons yang lebih baik.

Google dengan kemungkinan-kemungkinan luar biasa dari dunia yang diberdayakan secara bertanggung jawab oleh AI — masa depan inovasi yang akan meningkatkan kreativitas, memperluas pengetahuan, memajukan ilmu pengetahuan, dan mengubah cara miliaran orang hidup dan bekerja di seluruh dunia.

Jadi itulah Google Gemini AI, teknologi yang menjanjikan dengan potensi untuk mengubah cara kita berinteraksi dengan komputer. Ini dapat membuat komputer lebih cerdas, informatif, dan bermanfaat. Sekian dari saya, srmoga beruntung dan Salam!

Reference:
https://blog.google/
Google Products

About the Author

Terlalu muda untuk dikritik dan terlalu dewasa untuk di nasehati :)

Posting Komentar

Cookie Consent
Young serve cookies on this site to analyze traffic, remember your preferences, and optimize your experience.
Oops!
Young detect it seems there is something wrong with your internet connection. Please connect to the internet and start browsing again.
AdBlock Detected!
Young have detected that you are using adblocking plugin in your browser.
The revenue we earn by the advertisements is used to manage this website, we request you to whitelist our website in your adblocking plugin.
Site is Blocked
Sorry! This site is not available in your country.