Microsoft Perkenalkan VASA-1, Model AI Image To Video Terbaru
Microsoft baru saja memamerkan model AI terbarunya yang diberi nama VASA-1. Model AI terbaru dari Microsoft ini adalah sebuah model AI Image to Video yang mampu membuat video yang menampilkan seseorang sedang berbicara namun hanya dengan input berupa sebuah foto dan juga sampel suaranya.

Video yang dihasilkan juga bisa dibilang punya hasil yang cukup realistis. Mimik muka, pergerakan bibir dan juga pergerakan kepala terlihat sinkron dengan audio yang dikeluarkan.
VASA-1 Punya Kemampuan Self Learning
Microsoft mengklaim kalau model terbaru buatan mereka ini bisa menghasilkan video dengan resolusi 512 x 512 pixel serta memiliki frame rate sampai 40 FPS. Selain itu Microsoft juga berkata kalau model AI buatan mereka ini bisa menghasilkan video dengan menggunakan input audio berupa nyanyian dan juga audio dengan bahasa selain Inggris.
Menariknya, pihak Microsoft berkata kalau mereka tidak merancang model AI ini untuk melakukan hal tersebut. Itu artinya kemampuan itu merupakan hasil dari self learning dari VASA-1 ini.
Kemampuan dari model AI baru milik Microsoft ini memang bisa dibilang impresif, namun tentunya juga menimbulkan kekhawatiran terhadap penggunaan yang tidak etis seperti deep fake. Pihak Microsoft pun sudah paham tentang adanya masalah tersebut, dan sedang berusaha mencari jalan keluarnya.
Raksasa teknologi dari Amerika Serikat tersebut pun juga berkata kalau mereka tidak akan merilis model AI VASA-1 ini ke publik dalam waktu dekat. Kita tunggu saja perkembangan berikutnya ya!














