,
Jakarta
–
Google
menyertakan sejumlah model layanan tambahan
platform
Kecerdasan ciptaannya, yaitu Vertex AI. Setelah menambahkan Lyria, yang merupakan model kecerdasan buatan untuk konversi teks ke musik, Vertex AI semakin berkembang.
platform
Perdana menghadirkan model generatif untuk empat tipe konten. Sebagaimana dijelaskan oleh Direktur Produk Tingkat Lanjut Google Warren Barkley melalui pernyataan tertulis pada Rabu, 9 April 2025, keempat kategori tersebut adalah video, gambar, audio, dan musik.
Dengan kemampuan baru Vertex
AI
Pengguna dapat menciptakan asset produksi yang komprehensif. Layanan tersebut menerima instruksi atau
prompt
untuk teks, kemudian teks diubah menjadi gambar, sampai pada aset video yang komplit beserta musik dan efek suaranya.
Lyria saat ini tersedia dalam edisi pra-lihatan yang terbatas atau
allowlist
Model terbaru dari Vertex AI dikembangkan untuk menciptakan suara berkualitas tinggi dan mengcapture detil musik pada beragam genre. Google menyatakan bahwa Lyria bisa diteraplikasikan dalam peningkatan proses pembuatan video, siaran radio ataupun podcaster, juga strategi pemasangan merk yang tidak memerlukan biaya lisensi lagu ekstra.
Misalnya, pelanggan bisa melakukan ini.
prompt
Yang menguraikan, contohnya “Buatlah musik bebop bertekanan kuat. Fokuskan pada solo saxophone dan trumpet yang menakjubkan, bergantian sambil menyuarakan frasa rumit dengan tempo cepat.”
Petunjuk tersebut dapat diperluas dengan “Sediakan irama piano yang memiliki ritme kuat, disertai chord, bass yang dinamis, dan drum yang cepat untuk membangkitkan semangat lagu. Kesan yang dihasilkan seharusnya sangat menyegah dan tegang. Atmosfir harus mencerminkan suasana klub jazz pada malam hari yang dipenuhi asap, sambil tetap menyoroti elemen-elemennya.”
virtuoso
Dan improvisasi. Penikmat musik tak boleh tetap berada di satu posisi.”
Bukan cuma Lyria, Google pun meng-update beberapa model generatif lain dalam Vertex AI. Model video terbaru mereka, yaitu Veo 2, saat ini sudah dilengkapi dengan berbagai fungsi pengeditan.
inpainting
, guna menyingkirkan latar belakang dengan cara otomatis. Selain itu ada pula
outpainting
agar video dapat disesuaikan dengan beragam ukuran layar.
Veo 2 dilengkapi dengan kontrol kamera otomatis seperti preset atau konfigurasi awal pergerakan kamera dan efek.
timelapse
, serta pengambilan gambar gaya drone. Fitur interpolasi memungkinkan pengguna menghubungkan dua klip video dengan transisi yang mulus. Semua fitur tersebut tersedia dalam versi pratinjau dan masih menggunakan sistem
allowlist.
Model audio Chirp 3 pun telah ditingkatkan. Fiturnya
Instant Custom Voice
memungkinkan pengguna membuat suara
custom
Yang masuk akal hanyalah dari perekaman audio selama 10 detik. Fungsi ini digunakan untuk menyesuaikan layanan personal seperti itu.
call center
hingga
branding
suara.
Ada juga fitur
Transcription with Diarization
Yang membedaikan dan mengenali pengucap dalam satu perekaman audio. Chirp 3 sekarang sudah mendukung lebih dari 35 bahasa serta menawarkan delapan jenis nada kualitas tinggi atau HD.
Untuk soal gambar, Google telah memperbaiki kinerja model Imagen versi 3. Model tersebut sudah diperbaharui dengan kapabilitas yang lebih baik.
npaintingyang
Yang lebih presisi dalam perbaikan area citra yang cacat atau hilang. Pencopotan objek pun terlihat lebih natural dan halus dibandingkan dengan versi sebelumnya.
Google mengungkapkan bahwa semua aspek pembuatan ini dibuat berdasarkan pedoman keamanan dan etika AI yang kuat. Teknologi tersebut dikembangkan dengan memperhatikan prinsip-prinsip tertentu untuk menjaga keselamatan dan moralitas dalam teknologi artificial intelligence.
digital watermarking SynthID
dari DeepMind akan dipasang secara otomatis pada setiap item
frame
gambar, video, dan audio yang dihasilkan oleh Imagen, Veo, dan Lyria untuk mencegah disinformasi dan penyalahgunaan.
Seluruh model ini telah dibekali fitur perlindungan keamanan untuk mencegah pengadaan materi berisiko. Terdapat juga mekanisme manajemen informasi yang menjamin bahwa data konsumen tak dipergunakan sebagai bahan latihan bagi algoritma buatan manusia. “Kamu bisa menyantumkan hasil produksi tersebut tanpa khawatir terhadap gugatan kepemilikan intelektual oleh entitas lain, seperti paten,” jelas Barkley.
Komentar