Gemini Omni sekarang tersedia

Generator Video Gemini Omni

Ucapkan. Lihat. Bagikan. Buat video seperti sedang mengobrol — ini versi video dari Nano Banana: mulai dari nol, gabungkan foto album, atau langsung pakai template.

Generasi percakapan
Kombinasi multimodal
Avatar virtual AI

Mendukung klip 4 / 6 / 8 / 10 detik, maksimal menggabungkan 3 gambar referensi.

Kemampuan inti

Enam kemampuan inti Gemini Omni

Posisi resmi Google: 'Nano Banana' versi video — siapa saja dapat membuat, memadukan, dan mengedit video melalui percakapan.

Segalanya bisa diciptakan: kombinasi multimodal

Gabungkan teks, gambar, dan video secara bebas, sehingga ide langsung terwujud dalam visual. Satu deskripsi + satu foto + satu klip referensi sudah cukup untuk menghasilkan karya baru.

Inspirasi vlog langsung diwujudkan, kompilasi video singkat untuk media sosial, foto album dibuat dinamis, rekreasi dari klip referensi.

Mempertahankan jiwa foto

Ganti latar, ubah busana, alihkan gaya—detail asli tetap utuh. Ganti adegan tanpa mengubah esensi.

Foto identitas jadi foto bergaya, penggantian latar untuk produk, video fashion bergaya, pembaruan kenangan dari album.

NEW

Pengeditan berbasis percakapan

Cukup beri tahu Gemini dengan satu kalimat apa yang ingin diubah—ganti karakter, atur pencahayaan, stabilkan gambar, ubah latar—tanpa perlu membuat ulang seluruh klip.

Perubahan instan berdasarkan umpan balik pelanggan, pemolesan iklan yang berulang, iterasi konten sosial, penyempurnaan tanpa harus memotong ulang.

NEW

Pengeditan video ke video

Unggah video yang sudah ada sebagai input, biarkan Gemini menggunakan AI untuk mengedit, mengubah gaya, atau mengganti adegan berdasarkan rekaman asli.

Kreasi ulang materi lama, output bergaya beberapa versi, pembuatan ulang berdasarkan video referensi, redistribusi konten antar akun.

NEW

Avatar virtual AI

Buat avatar AI yang menyerupai penampilan dan suara Anda, sehingga tidak perlu mengunggah foto setiap kali. Atur sekali, tampil berulang kali.

Jaringan akun pembicara, konten pendiri merek, distribusi multibahasa ke pasar luar negeri, host edukasi/penjualan.

Template gaya pilihan + audio asli

Cukup ketuk untuk menerapkan template gaya pilihan dari Google; klip 10 detik dilengkapi trek audio asli, dialog dan gambar dihasilkan secara sinkron.

Pemula cepat menguasai, produksi massal untuk kampanye liburan, klip dialog pendek, narasi multibahasa.

Contoh penggunaan

Contoh Resmi Gemini Omni

Semua video berasal dari halaman resmi Google Gemini, menampilkan efek nyata Omni di enam skenario.

Teks ke video

Ubah konsep menjadi klip pendek

Ubah deskripsi langsung menjadi klip 10 detik—narasi, visual, dan ritme terbentuk sekaligus

概念落地
10s 成片
原生音频
Multimodal

Perpaduan multimodal

Teks + gambar + video dapat dikombinasikan secara bebas, membuat ide Anda hidup di layar

混搭
文字
图片
Rekreasi Foto

Pertahankan esensi foto

Ganti latar belakang, ubah pakaian, alihkan gaya, detail asli tetap utuh

风格转移
换装
换背景
Template

Template Gaya Pilihan

Tak perlu menunggu inspirasi, ketuk sekali untuk menerapkan gaya pilihan Google

模板
风格
快速出片
Edit Percakapan

Pengeditan Percakapan

Cukup beri tahu Gemini dalam satu kalimat apa yang ingin diubah——ganti karakter、atur pencahayaan、stabilkan gambar、ganti latar

对话
局部替换
迭代
Avatar Virtual

Avatar Virtual AI

Buat avatar AI yang menyerupai penampilan dan suara Anda, sehingga bisa tampil berulang tanpa perlu mengunggah ulang

数字人
口播
矩阵账号
Spesifikasi teknis

Parameter teknis Gemini Omni

Spesifikasi model dan batasan penggunaan yang diumumkan secara resmi oleh Google.

Kode model
Gemini Omni Flash
Model AI video multimodal untuk pembuatan dan pengeditan, yang akan menggantikan Veo 3.1 dalam aplikasi Gemini.
Durasi klip
10 detik
Batas maksimum satu kali pembuatan: 10 detik
Modalitas input
Teks + Gambar + Video
Dapat mengombinasikan hingga 5 foto referensi
Pengeditan video ke video
Mendukung (NEW)
Upload video yang sudah ada sebagai input, AI langsung melakukan pengeditan dan penulisan ulang
Pengeditan beberapa putaran
Mendukung (NEW)
Melanjutkan percakapan untuk penyempurnaan pada video yang sudah dihasilkan
Audio asli
Sintesis suara bawaan
Dialog, suara latar, dan gambar dihasilkan secara sinkron
Avatar virtual AI
Penampilan / suara konsisten (NEW)
Atur sekali untuk tampil berulang, tidak perlu upload foto setiap kali
Tanda air SynthID
Tersemat di semua video
Tanda air tersembunyi dari Google, dapat mengidentifikasi konten yang dihasilkan oleh AI
Persyaratan akses
Google AI Plus / Pro / Ultra
Usia 18+, tersedia sesuai wilayah, beberapa fitur dibatasi di daerah tertentu
Jalur peningkatan

Dari Veo 3.1 ke Gemini Omni

Pengumuman resmi Google: Gemini Omni akan menggantikan Veo di aplikasi Gemini. Ini merupakan lompatan posisi—dari 'pembuatan' ke 'pembuatan + pengeditan'.

Veo 3.1
Gemini Omni Flash
Fokus utama
Model AI pembuat video
Model multomodal untuk pembuatan + pengeditan
Modalitas input
Teks / Gambar
Teks + Gambar + Video (kombinasi, maks. 5 referensi)
Durasi klip
Klip pendek
10 detik
Pengeditan percakapan
Tidak didukung
Didukung, iterasi berulang
Pengeditan dari video ke video
Tidak didukung
BARU, dukungan native
Avatar virtual AI
Tidak didukung
BARU, penampilan dan suara konsisten
Audio asli
Didukung
Didukung
Status aplikasi Gemini
Akan digantikan
Model default generasi baru
Pengeditan percakapan

Ubah pembuatan video dari 'keberuntungan' menjadi 'alur kerja'

Model video tradisional harus dibuat ulang jika tidak puas; Gemini Omni memungkinkan Anda menyempurnakan hasil seperti berdialog dengan editor.

Dua cara penggunaan khas

Pembuatan pertama

Deskripsikan adegan lengkap dengan bahasa alami, AI akan menghasilkan draf 10 detik sekaligus

Barista di meja dekat jendela sedang membuat kopi pour-over, sinar matahari sore menembus tirai dan menghasilkan bayangan bergaris, lalu close-up perlahan bergerak ke samping wajahnya saat ia tersenyum。

Cocok untuk draf awal dan eksplorasi ide: lihat dulu visualnya baru tentukan arah penyesuaian

Penyempurnaan lewat percakapan

Berikan instruksi lanjutan pada video yang sudah ada, hanya merender ulang bagian yang diubah

Ubah filter pada detik ke-3 hingga ke-5 menjadi nuansa emas yang lebih hangat; Pertahankan subjek, ganti latar tirai hijau tua menjadi warna krem; Tambahkan close-up wajahnya menengadah dan tersenyum pada 2 detik terakhir。

Menghemat kredit、mempertahankan bagian yang sudah memuaskan、iterasi lebih cepat mendekati alur kerja editing nyata

Praktik Terbaik Pengeditan Percakapan

  • Buat seluruh video dulu sebelum memulai pengeditan percakapan; jangan sering menginterupsi saat draf awal belum terbentuk
  • Satu instruksi ubah hanya satu hal (mis. nada, gerakan kamera, dialog); selesaikan sebelum melanjutkan ke instruksi berikutnya
  • Gunakan rentang waktu untuk mengunci area yang ingin diubah (mis. detik ke-2 sampai ke-4, dua detik terakhir)
  • Simpan task_id dan callback untuk memudahkan pelacakan riwayat modifikasi di alur engineering
  • Jika ingin mengganti identitas karakter, upload ulang gambar referensi, jangan hanya mendeskripsikan penampilan dengan teks

Tips Profesional

  • Perintah percakapan sebaiknya berisi kata kerja + objek + keterangan ('ganti latar menjadi X' lebih baik daripada 'latar kurang pas')
  • Jika perlu mengganti bahasa kamera, nyatakan dengan jelas 'ubah ke close-up / medium shot / push-in'
  • Tugas yang gagal tidak akan dikenai biaya; jika terjadi kegagalan sporadis, ulangi secara idempoten
  • Untuk tugas penting, integrasikan webhook untuk menghindari long polling yang memboroskan kuota request
Panduan Prompt

Praktik Terbaik Prompt Gemini Omni

Dalam pengeditan percakapan, prompt bukan lagi sekadar 'instruksi satu kali', melainkan dasar untuk 'kolaborasi multi-putaran'.

Template Draf Awal

Sebuah video sekitar 10 detik: [adegan],[aksi utama],[bahasa kamera],[pencahayaan / suasana],[deskripsi audio asli:suara lingkungan / dialog / gaya musik]。

Mengapa efektif:mencakup empat elemen — adegan + aksi + bahasa kamera + audio — sehingga AI dapat menghasilkan draf dasar yang langsung dapat digunakan

Cocok untuk:semua pembuatan pertama kali

Template Penggantian Parsial

Pertahankan karakter / komposisi / ritme tetap;ganti [elemen] dengan [elemen baru];bagian lainnya biarkan seperti semula。

Mengapa efektif:secara eksplisit memberi tahu model bagian mana yang tidak berubah dan mana yang harus diubah,sehingga menghindari regenerasi ulang yang tidak perlu

Cocok untuk:mengganti latar、properti、teks、atau warna

Template Rentang Waktu

Pada detik ke-[a]-[b]:[perubahan yang akan dilakukan];periode waktu lainnya tetap tidak berubah。

Mengapa efektif:menambatkan perubahan pada rentang waktu sehingga model hanya merender ulang frame yang sesuai

Cocok untuk:penyempurnaan pembukaan、penutupan、momen kunci

Template Referensi Gambar + Multi-shot

Gambar referensi menjadi jangkar visual untuk [karakter / produk]。Hasilkan 3 bidikan berurutan:Bidikan 1 [aksi/jenis bidikan];Bidikan 2 [aksi/jenis bidikan];Bidikan 3 [aksi/jenis bidikan]。Pertahankan konsistensi identitas gambar referensi di ketiga bidikan。

Mengapa efektif:gambar referensi mengunci identitas,pembagian bidikan yang eksplisit ditambah konteks panjang memaksimalkan konsistensi

Cocok untuk:iklan naratif、konten bersambung、seri video IP

Pertanyaan yang Sering Diajukan

Pertanyaan yang Sering Diajukan tentang Gemini Omni

Apa itu Gemini Omni?

Gemini Omni adalah model yang dapat memahami dunia, memungkinkan Anda memberi gerakan pada foto atau menghasilkan video dari input apa pun. Ia dibangun di atas pemahaman dunia dan kemampuan multimodal bawaan Gemini, sehingga output mengikuti logika dunia nyata dan dapat disempurnakan langkah demi langkah melalui percakapan alami. Dengan hanya satu prompt, Anda bisa menjadi editor video AI — mengubah kombinasi teks / gambar / video apa pun menjadi video, menghasilkan video dengan maks. 5 foto sebagai referensi, dan dengan mudah mengedit video yang sudah ada.

Jenis input apa yang didukung?

Deskripsi teks, gambar (maks. 5 foto referensi), potongan video. Ketiga modalitas tersebut dapat dikombinasikan secara bebas sebagai input untuk pembuatan atau pengeditan.

Apa saja yang dapat diedit?

Menggunakan instruksi percakapan untuk mengganti pemeran, menyesuaikan pencahayaan, menstabilkan gambar, mengubah latar belakang, mentransfer gaya, mengubah pakaian — detail penting dari gambar asli akan tetap dipertahankan.

Berapa panjang video yang dihasilkan?

Batas maksimal tiap pembuatan adalah 10 detik. Anda dapat memperpanjang atau menyempurnakan materi asli melalui instruksi percakapan baru.

Apa itu avatar virtual AI?

Latih satu avatar AI milik Anda sekali, setelah itu Anda tidak perlu mengunggah foto setiap kali; avatar dapat terus tampil dengan wajah dan suara Anda — cocok untuk akun penyaji, konten merek, dan distribusi internasional.

Apakah video yang dihasilkan memiliki watermark?

Google menyematkan watermark tersembunyi SynthID pada semua video yang dihasilkan oleh Omni untuk menandai konten yang dibuat oleh AI, tanpa mengganggu pengalaman menonton.

Mulai Berkarya

Sampaikan ide Anda, lihat hasilnya

Gemini Omni mengembalikan pembuatan video ke ritme percakapan — siapa pun dapat memulai dengan satu kalimat, lalu menyelesaikannya dengan satu kalimat lagi.

Buat video seperti sedang mengobrol
Teks, gambar, dan video dapat dikombinasikan secara bebas
Editor percakapan, perubahan langsung terlihat
Avatar virtual AI: atur sekali, tampil berulang kali
Gemini Omni: Model Pembuatan Video Percakapan Google | CreatOK | CreatOK