Generator Video Gemini Omni
Ucapkan. Lihat. Bagikan. Buat video seperti sedang mengobrol — ini versi video dari Nano Banana: mulai dari nol, gabungkan foto album, atau langsung pakai template.
Mendukung klip 4 / 6 / 8 / 10 detik, maksimal menggabungkan 3 gambar referensi.
Enam kemampuan inti Gemini Omni
Posisi resmi Google: 'Nano Banana' versi video — siapa saja dapat membuat, memadukan, dan mengedit video melalui percakapan.
Segalanya bisa diciptakan: kombinasi multimodal
Gabungkan teks, gambar, dan video secara bebas, sehingga ide langsung terwujud dalam visual. Satu deskripsi + satu foto + satu klip referensi sudah cukup untuk menghasilkan karya baru.
Inspirasi vlog langsung diwujudkan, kompilasi video singkat untuk media sosial, foto album dibuat dinamis, rekreasi dari klip referensi.
Mempertahankan jiwa foto
Ganti latar, ubah busana, alihkan gaya—detail asli tetap utuh. Ganti adegan tanpa mengubah esensi.
Foto identitas jadi foto bergaya, penggantian latar untuk produk, video fashion bergaya, pembaruan kenangan dari album.
Pengeditan berbasis percakapan
Cukup beri tahu Gemini dengan satu kalimat apa yang ingin diubah—ganti karakter, atur pencahayaan, stabilkan gambar, ubah latar—tanpa perlu membuat ulang seluruh klip.
Perubahan instan berdasarkan umpan balik pelanggan, pemolesan iklan yang berulang, iterasi konten sosial, penyempurnaan tanpa harus memotong ulang.
Pengeditan video ke video
Unggah video yang sudah ada sebagai input, biarkan Gemini menggunakan AI untuk mengedit, mengubah gaya, atau mengganti adegan berdasarkan rekaman asli.
Kreasi ulang materi lama, output bergaya beberapa versi, pembuatan ulang berdasarkan video referensi, redistribusi konten antar akun.
Avatar virtual AI
Buat avatar AI yang menyerupai penampilan dan suara Anda, sehingga tidak perlu mengunggah foto setiap kali. Atur sekali, tampil berulang kali.
Jaringan akun pembicara, konten pendiri merek, distribusi multibahasa ke pasar luar negeri, host edukasi/penjualan.
Template gaya pilihan + audio asli
Cukup ketuk untuk menerapkan template gaya pilihan dari Google; klip 10 detik dilengkapi trek audio asli, dialog dan gambar dihasilkan secara sinkron.
Pemula cepat menguasai, produksi massal untuk kampanye liburan, klip dialog pendek, narasi multibahasa.
Contoh Resmi Gemini Omni
Semua video berasal dari halaman resmi Google Gemini, menampilkan efek nyata Omni di enam skenario.
Ubah konsep menjadi klip pendek
Ubah deskripsi langsung menjadi klip 10 detik—narasi, visual, dan ritme terbentuk sekaligus
Perpaduan multimodal
Teks + gambar + video dapat dikombinasikan secara bebas, membuat ide Anda hidup di layar
Pertahankan esensi foto
Ganti latar belakang, ubah pakaian, alihkan gaya, detail asli tetap utuh
Template Gaya Pilihan
Tak perlu menunggu inspirasi, ketuk sekali untuk menerapkan gaya pilihan Google
Pengeditan Percakapan
Cukup beri tahu Gemini dalam satu kalimat apa yang ingin diubah——ganti karakter、atur pencahayaan、stabilkan gambar、ganti latar
Avatar Virtual AI
Buat avatar AI yang menyerupai penampilan dan suara Anda, sehingga bisa tampil berulang tanpa perlu mengunggah ulang
Parameter teknis Gemini Omni
Spesifikasi model dan batasan penggunaan yang diumumkan secara resmi oleh Google.
Dari Veo 3.1 ke Gemini Omni
Pengumuman resmi Google: Gemini Omni akan menggantikan Veo di aplikasi Gemini. Ini merupakan lompatan posisi—dari 'pembuatan' ke 'pembuatan + pengeditan'.
Ubah pembuatan video dari 'keberuntungan' menjadi 'alur kerja'
Model video tradisional harus dibuat ulang jika tidak puas; Gemini Omni memungkinkan Anda menyempurnakan hasil seperti berdialog dengan editor.
Dua cara penggunaan khas
Pembuatan pertama
Deskripsikan adegan lengkap dengan bahasa alami, AI akan menghasilkan draf 10 detik sekaligus
Barista di meja dekat jendela sedang membuat kopi pour-over, sinar matahari sore menembus tirai dan menghasilkan bayangan bergaris, lalu close-up perlahan bergerak ke samping wajahnya saat ia tersenyum。Cocok untuk draf awal dan eksplorasi ide: lihat dulu visualnya baru tentukan arah penyesuaian
Penyempurnaan lewat percakapan
Berikan instruksi lanjutan pada video yang sudah ada, hanya merender ulang bagian yang diubah
Ubah filter pada detik ke-3 hingga ke-5 menjadi nuansa emas yang lebih hangat;
Pertahankan subjek, ganti latar tirai hijau tua menjadi warna krem;
Tambahkan close-up wajahnya menengadah dan tersenyum pada 2 detik terakhir。Menghemat kredit、mempertahankan bagian yang sudah memuaskan、iterasi lebih cepat mendekati alur kerja editing nyata
Praktik Terbaik Pengeditan Percakapan
- Buat seluruh video dulu sebelum memulai pengeditan percakapan; jangan sering menginterupsi saat draf awal belum terbentuk
- Satu instruksi ubah hanya satu hal (mis. nada, gerakan kamera, dialog); selesaikan sebelum melanjutkan ke instruksi berikutnya
- Gunakan rentang waktu untuk mengunci area yang ingin diubah (mis. detik ke-2 sampai ke-4, dua detik terakhir)
- Simpan task_id dan callback untuk memudahkan pelacakan riwayat modifikasi di alur engineering
- Jika ingin mengganti identitas karakter, upload ulang gambar referensi, jangan hanya mendeskripsikan penampilan dengan teks
Tips Profesional
- Perintah percakapan sebaiknya berisi kata kerja + objek + keterangan ('ganti latar menjadi X' lebih baik daripada 'latar kurang pas')
- Jika perlu mengganti bahasa kamera, nyatakan dengan jelas 'ubah ke close-up / medium shot / push-in'
- Tugas yang gagal tidak akan dikenai biaya; jika terjadi kegagalan sporadis, ulangi secara idempoten
- Untuk tugas penting, integrasikan webhook untuk menghindari long polling yang memboroskan kuota request
Praktik Terbaik Prompt Gemini Omni
Dalam pengeditan percakapan, prompt bukan lagi sekadar 'instruksi satu kali', melainkan dasar untuk 'kolaborasi multi-putaran'.
Template Draf Awal
Sebuah video sekitar 10 detik: [adegan],[aksi utama],[bahasa kamera],[pencahayaan / suasana],[deskripsi audio asli:suara lingkungan / dialog / gaya musik]。Mengapa efektif:mencakup empat elemen — adegan + aksi + bahasa kamera + audio — sehingga AI dapat menghasilkan draf dasar yang langsung dapat digunakan
Cocok untuk:semua pembuatan pertama kali
Template Penggantian Parsial
Pertahankan karakter / komposisi / ritme tetap;ganti [elemen] dengan [elemen baru];bagian lainnya biarkan seperti semula。Mengapa efektif:secara eksplisit memberi tahu model bagian mana yang tidak berubah dan mana yang harus diubah,sehingga menghindari regenerasi ulang yang tidak perlu
Cocok untuk:mengganti latar、properti、teks、atau warna
Template Rentang Waktu
Pada detik ke-[a]-[b]:[perubahan yang akan dilakukan];periode waktu lainnya tetap tidak berubah。Mengapa efektif:menambatkan perubahan pada rentang waktu sehingga model hanya merender ulang frame yang sesuai
Cocok untuk:penyempurnaan pembukaan、penutupan、momen kunci
Template Referensi Gambar + Multi-shot
Gambar referensi menjadi jangkar visual untuk [karakter / produk]。Hasilkan 3 bidikan berurutan:Bidikan 1 [aksi/jenis bidikan];Bidikan 2 [aksi/jenis bidikan];Bidikan 3 [aksi/jenis bidikan]。Pertahankan konsistensi identitas gambar referensi di ketiga bidikan。Mengapa efektif:gambar referensi mengunci identitas,pembagian bidikan yang eksplisit ditambah konteks panjang memaksimalkan konsistensi
Cocok untuk:iklan naratif、konten bersambung、seri video IP
Pertanyaan yang Sering Diajukan tentang Gemini Omni
Apa itu Gemini Omni?
Gemini Omni adalah model yang dapat memahami dunia, memungkinkan Anda memberi gerakan pada foto atau menghasilkan video dari input apa pun. Ia dibangun di atas pemahaman dunia dan kemampuan multimodal bawaan Gemini, sehingga output mengikuti logika dunia nyata dan dapat disempurnakan langkah demi langkah melalui percakapan alami. Dengan hanya satu prompt, Anda bisa menjadi editor video AI — mengubah kombinasi teks / gambar / video apa pun menjadi video, menghasilkan video dengan maks. 5 foto sebagai referensi, dan dengan mudah mengedit video yang sudah ada.
Jenis input apa yang didukung?
Deskripsi teks, gambar (maks. 5 foto referensi), potongan video. Ketiga modalitas tersebut dapat dikombinasikan secara bebas sebagai input untuk pembuatan atau pengeditan.
Apa saja yang dapat diedit?
Menggunakan instruksi percakapan untuk mengganti pemeran, menyesuaikan pencahayaan, menstabilkan gambar, mengubah latar belakang, mentransfer gaya, mengubah pakaian — detail penting dari gambar asli akan tetap dipertahankan.
Berapa panjang video yang dihasilkan?
Batas maksimal tiap pembuatan adalah 10 detik. Anda dapat memperpanjang atau menyempurnakan materi asli melalui instruksi percakapan baru.
Apa itu avatar virtual AI?
Latih satu avatar AI milik Anda sekali, setelah itu Anda tidak perlu mengunggah foto setiap kali; avatar dapat terus tampil dengan wajah dan suara Anda — cocok untuk akun penyaji, konten merek, dan distribusi internasional.
Apakah video yang dihasilkan memiliki watermark?
Google menyematkan watermark tersembunyi SynthID pada semua video yang dihasilkan oleh Omni untuk menandai konten yang dibuat oleh AI, tanpa mengganggu pengalaman menonton.
Sampaikan ide Anda, lihat hasilnya
Gemini Omni mengembalikan pembuatan video ke ritme percakapan — siapa pun dapat memulai dengan satu kalimat, lalu menyelesaikannya dengan satu kalimat lagi.