Gemini Omni sekarang tersedia

Generator Video Gemini Omni

Ucapkan. Lihat. Bagikan. Buat video seperti sedang mengobrol — ini versi video dari Nano Banana: mulai dari nol, gabungkan foto album, atau langsung pakai template.

Generasi percakapan

Kombinasi multimodal

Avatar virtual AI

Mendukung klip 4 / 6 / 8 / 10 detik, maksimal menggabungkan 3 gambar referensi.

Buka generator video lengkap Lihat contoh

Kemampuan inti

Enam kemampuan inti Gemini Omni

Posisi resmi Google: 'Nano Banana' versi video — siapa saja dapat membuat, memadukan, dan mengedit video melalui percakapan.

Segalanya bisa diciptakan: kombinasi multimodal

Gabungkan teks, gambar, dan video secara bebas, sehingga ide langsung terwujud dalam visual. Satu deskripsi + satu foto + satu klip referensi sudah cukup untuk menghasilkan karya baru.

Inspirasi vlog langsung diwujudkan, kompilasi video singkat untuk media sosial, foto album dibuat dinamis, rekreasi dari klip referensi.

Mempertahankan jiwa foto

Ganti latar, ubah busana, alihkan gaya—detail asli tetap utuh. Ganti adegan tanpa mengubah esensi.

Foto identitas jadi foto bergaya, penggantian latar untuk produk, video fashion bergaya, pembaruan kenangan dari album.

NEW

Pengeditan berbasis percakapan

Cukup beri tahu Gemini dengan satu kalimat apa yang ingin diubah—ganti karakter, atur pencahayaan, stabilkan gambar, ubah latar—tanpa perlu membuat ulang seluruh klip.

Perubahan instan berdasarkan umpan balik pelanggan, pemolesan iklan yang berulang, iterasi konten sosial, penyempurnaan tanpa harus memotong ulang.

NEW

Pengeditan video ke video

Unggah video yang sudah ada sebagai input, biarkan Gemini menggunakan AI untuk mengedit, mengubah gaya, atau mengganti adegan berdasarkan rekaman asli.

Kreasi ulang materi lama, output bergaya beberapa versi, pembuatan ulang berdasarkan video referensi, redistribusi konten antar akun.

NEW

Avatar virtual AI

Buat avatar AI yang menyerupai penampilan dan suara Anda, sehingga tidak perlu mengunggah foto setiap kali. Atur sekali, tampil berulang kali.

Jaringan akun pembicara, konten pendiri merek, distribusi multibahasa ke pasar luar negeri, host edukasi/penjualan.

Template gaya pilihan + audio asli

Cukup ketuk untuk menerapkan template gaya pilihan dari Google; klip 10 detik dilengkapi trek audio asli, dialog dan gambar dihasilkan secara sinkron.

Pemula cepat menguasai, produksi massal untuk kampanye liburan, klip dialog pendek, narasi multibahasa.

Contoh penggunaan

Contoh Resmi Gemini Omni

Semua video berasal dari halaman resmi Google Gemini, menampilkan efek nyata Omni di enam skenario.

Teks ke video

Ubah konsep menjadi klip pendek

Ubah deskripsi langsung menjadi klip 10 detik—narasi, visual, dan ritme terbentuk sekaligus

概念落地

10s 成片

原生音频

Multimodal

Perpaduan multimodal

Teks + gambar + video dapat dikombinasikan secara bebas, membuat ide Anda hidup di layar

混搭

文字

图片

Rekreasi Foto

Pertahankan esensi foto

Ganti latar belakang, ubah pakaian, alihkan gaya, detail asli tetap utuh

风格转移

换装

换背景

Template

Template Gaya Pilihan

Tak perlu menunggu inspirasi, ketuk sekali untuk menerapkan gaya pilihan Google

模板

风格

快速出片

Edit Percakapan

Pengeditan Percakapan

Cukup beri tahu Gemini dalam satu kalimat apa yang ingin diubah——ganti karakter、atur pencahayaan、stabilkan gambar、ganti latar

对话

局部替换

迭代

Avatar Virtual

Avatar Virtual AI

Buat avatar AI yang menyerupai penampilan dan suara Anda, sehingga bisa tampil berulang tanpa perlu mengunggah ulang

数字人

口播

矩阵账号

Spesifikasi teknis

Parameter teknis Gemini Omni

Spesifikasi model dan batasan penggunaan yang diumumkan secara resmi oleh Google.

Kode model

Gemini Omni Flash

Model AI video multimodal untuk pembuatan dan pengeditan, yang akan menggantikan Veo 3.1 dalam aplikasi Gemini.

Durasi klip

10 detik

Batas maksimum satu kali pembuatan: 10 detik

Modalitas input

Teks + Gambar + Video

Dapat mengombinasikan hingga 5 foto referensi

Pengeditan video ke video

Mendukung (NEW)

Upload video yang sudah ada sebagai input, AI langsung melakukan pengeditan dan penulisan ulang

Pengeditan beberapa putaran

Mendukung (NEW)

Melanjutkan percakapan untuk penyempurnaan pada video yang sudah dihasilkan

Audio asli

Sintesis suara bawaan

Dialog, suara latar, dan gambar dihasilkan secara sinkron

Avatar virtual AI

Penampilan / suara konsisten (NEW)

Atur sekali untuk tampil berulang, tidak perlu upload foto setiap kali

Tanda air SynthID

Tersemat di semua video

Tanda air tersembunyi dari Google, dapat mengidentifikasi konten yang dihasilkan oleh AI

Persyaratan akses

Google AI Plus / Pro / Ultra

Usia 18+, tersedia sesuai wilayah, beberapa fitur dibatasi di daerah tertentu

Jalur peningkatan

Dari Veo 3.1 ke Gemini Omni

Pengumuman resmi Google: Gemini Omni akan menggantikan Veo di aplikasi Gemini. Ini merupakan lompatan posisi—dari 'pembuatan' ke 'pembuatan + pengeditan'.

Veo 3.1

Gemini Omni Flash

Fokus utama

Model AI pembuat video

Model multomodal untuk pembuatan + pengeditan

Modalitas input

Teks / Gambar

Teks + Gambar + Video (kombinasi, maks. 5 referensi)

Durasi klip

Klip pendek

10 detik

Pengeditan percakapan

Tidak didukung

Didukung, iterasi berulang

Pengeditan dari video ke video

Tidak didukung

BARU, dukungan native

Avatar virtual AI

Tidak didukung

BARU, penampilan dan suara konsisten

Audio asli

Didukung

Status aplikasi Gemini

Akan digantikan

Model default generasi baru

Pengeditan percakapan

Ubah pembuatan video dari 'keberuntungan' menjadi 'alur kerja'

Model video tradisional harus dibuat ulang jika tidak puas; Gemini Omni memungkinkan Anda menyempurnakan hasil seperti berdialog dengan editor.

Dua cara penggunaan khas

Pembuatan pertama

Deskripsikan adegan lengkap dengan bahasa alami, AI akan menghasilkan draf 10 detik sekaligus

Barista di meja dekat jendela sedang membuat kopi pour-over, sinar matahari sore menembus tirai dan menghasilkan bayangan bergaris, lalu close-up perlahan bergerak ke samping wajahnya saat ia tersenyum。

Cocok untuk draf awal dan eksplorasi ide: lihat dulu visualnya baru tentukan arah penyesuaian

Penyempurnaan lewat percakapan

Berikan instruksi lanjutan pada video yang sudah ada, hanya merender ulang bagian yang diubah

Ubah filter pada detik ke-3 hingga ke-5 menjadi nuansa emas yang lebih hangat；
Pertahankan subjek, ganti latar tirai hijau tua menjadi warna krem；
Tambahkan close-up wajahnya menengadah dan tersenyum pada 2 detik terakhir。

Menghemat kredit、mempertahankan bagian yang sudah memuaskan、iterasi lebih cepat mendekati alur kerja editing nyata

Praktik Terbaik Pengeditan Percakapan

Buat seluruh video dulu sebelum memulai pengeditan percakapan; jangan sering menginterupsi saat draf awal belum terbentuk
Satu instruksi ubah hanya satu hal (mis. nada, gerakan kamera, dialog); selesaikan sebelum melanjutkan ke instruksi berikutnya
Gunakan rentang waktu untuk mengunci area yang ingin diubah (mis. detik ke-2 sampai ke-4, dua detik terakhir)
Simpan task_id dan callback untuk memudahkan pelacakan riwayat modifikasi di alur engineering
Jika ingin mengganti identitas karakter, upload ulang gambar referensi, jangan hanya mendeskripsikan penampilan dengan teks

Tips Profesional

Perintah percakapan sebaiknya berisi kata kerja + objek + keterangan ('ganti latar menjadi X' lebih baik daripada 'latar kurang pas')
Jika perlu mengganti bahasa kamera, nyatakan dengan jelas 'ubah ke close-up / medium shot / push-in'
Tugas yang gagal tidak akan dikenai biaya; jika terjadi kegagalan sporadis, ulangi secara idempoten
Untuk tugas penting, integrasikan webhook untuk menghindari long polling yang memboroskan kuota request

Panduan Prompt

Praktik Terbaik Prompt Gemini Omni

Dalam pengeditan percakapan, prompt bukan lagi sekadar 'instruksi satu kali', melainkan dasar untuk 'kolaborasi multi-putaran'.

Template Draf Awal

Sebuah video sekitar 10 detik: [adegan]，[aksi utama]，[bahasa kamera]，[pencahayaan / suasana]，[deskripsi audio asli：suara lingkungan / dialog / gaya musik]。

Mengapa efektif：mencakup empat elemen — adegan + aksi + bahasa kamera + audio — sehingga AI dapat menghasilkan draf dasar yang langsung dapat digunakan

Cocok untuk：semua pembuatan pertama kali

Template Penggantian Parsial

Pertahankan karakter / komposisi / ritme tetap；ganti [elemen] dengan [elemen baru]；bagian lainnya biarkan seperti semula。

Mengapa efektif：secara eksplisit memberi tahu model bagian mana yang tidak berubah dan mana yang harus diubah，sehingga menghindari regenerasi ulang yang tidak perlu

Cocok untuk：mengganti latar、properti、teks、atau warna

Template Rentang Waktu

Pada detik ke-[a]-[b]：[perubahan yang akan dilakukan]；periode waktu lainnya tetap tidak berubah。

Mengapa efektif：menambatkan perubahan pada rentang waktu sehingga model hanya merender ulang frame yang sesuai

Cocok untuk：penyempurnaan pembukaan、penutupan、momen kunci

Template Referensi Gambar + Multi-shot

Gambar referensi menjadi jangkar visual untuk [karakter / produk]。Hasilkan 3 bidikan berurutan：Bidikan 1 [aksi/jenis bidikan]；Bidikan 2 [aksi/jenis bidikan]；Bidikan 3 [aksi/jenis bidikan]。Pertahankan konsistensi identitas gambar referensi di ketiga bidikan。

Mengapa efektif：gambar referensi mengunci identitas，pembagian bidikan yang eksplisit ditambah konteks panjang memaksimalkan konsistensi

Cocok untuk：iklan naratif、konten bersambung、seri video IP

Pertanyaan yang Sering Diajukan

Pertanyaan yang Sering Diajukan tentang Gemini Omni

Apa itu Gemini Omni?

Gemini Omni adalah model yang dapat memahami dunia, memungkinkan Anda memberi gerakan pada foto atau menghasilkan video dari input apa pun. Ia dibangun di atas pemahaman dunia dan kemampuan multimodal bawaan Gemini, sehingga output mengikuti logika dunia nyata dan dapat disempurnakan langkah demi langkah melalui percakapan alami. Dengan hanya satu prompt, Anda bisa menjadi editor video AI — mengubah kombinasi teks / gambar / video apa pun menjadi video, menghasilkan video dengan maks. 5 foto sebagai referensi, dan dengan mudah mengedit video yang sudah ada.

Jenis input apa yang didukung?

Deskripsi teks, gambar (maks. 5 foto referensi), potongan video. Ketiga modalitas tersebut dapat dikombinasikan secara bebas sebagai input untuk pembuatan atau pengeditan.

Apa saja yang dapat diedit?

Menggunakan instruksi percakapan untuk mengganti pemeran, menyesuaikan pencahayaan, menstabilkan gambar, mengubah latar belakang, mentransfer gaya, mengubah pakaian — detail penting dari gambar asli akan tetap dipertahankan.

Berapa panjang video yang dihasilkan?

Batas maksimal tiap pembuatan adalah 10 detik. Anda dapat memperpanjang atau menyempurnakan materi asli melalui instruksi percakapan baru.

Apa itu avatar virtual AI?

Latih satu avatar AI milik Anda sekali, setelah itu Anda tidak perlu mengunggah foto setiap kali; avatar dapat terus tampil dengan wajah dan suara Anda — cocok untuk akun penyaji, konten merek, dan distribusi internasional.

Apakah video yang dihasilkan memiliki watermark?

Google menyematkan watermark tersembunyi SynthID pada semua video yang dihasilkan oleh Omni untuk menandai konten yang dibuat oleh AI, tanpa mengganggu pengalaman menonton.

Mulai Berkarya

Sampaikan ide Anda, lihat hasilnya

Gemini Omni mengembalikan pembuatan video ke ritme percakapan — siapa pun dapat memulai dengan satu kalimat, lalu menyelesaikannya dengan satu kalimat lagi.

Buat video seperti sedang mengobrol

Teks, gambar, dan video dapat dikombinasikan secara bebas

Editor percakapan, perubahan langsung terlihat

Avatar virtual AI: atur sekali, tampil berulang kali