Stable Diffusion Rilis Versi 3.5, Diklaim Kini “Lebih Patuh”

Author

Mahfud

Reading time:

News

October 26, 2024

readmode

Stable Diffusion, alternatif open-source untuk image generator AI seperti Midjourney dan DALL-E, baru saja diperbarui ke versi 3.5. Versi baru ini hadir untuk memperbaiki kekurangan besar yang ada di versi sebelumnya, yaitu Stable Diffusion 3 Medium, yang cukup banyak mendapat dikritik.

Stability AI mengatakan model baru ini jauh lebih baik dalam mengikuti prompt atau perintah pengguna. Selain itu, output gambar diklaim dapat bersaing dengan model yang lebih besar, sambil tetap beragam dalam gaya, warna kulit, dan fitur wajah tanpa perlu instruksi khusus.

Stable Diffusion 3.5 memiliki tiga varian: Large, Large Turbo, dan Medium. Versi Large menawarkan kualitas gambar terbaik dan cocok untuk kebutuhan profesional dengan resolusi 1 MP. Versi Large Turbo lebih efisien meski sedikit menurunkan kualitas, tapi mampu menghasilkan gambar berkualitas hanya dalam empat langkah.

Di sisi lain, varian Medium didesain untuk perangkat konsumen, dengan keseimbangan antara kualitas dan kemudahan penggunaan. Varian ini bisa menghasilkan gambar dengan resolusi antara 0,25MP hingga 2MP, akan tetapi varian Medium ini baru akan dirilis pada 29 Oktober.

Pembaruan ini muncul setelah Stable Diffusion 3 Medium versi sebelumnya gagal memenuhi ekspektasi, menghasilkan gambar-gambar aneh yang tidak sesuai perintah. Stability AI menekankan bahwa versi 3.5 ini sangat patuh terhadap prompt, mencoba menghindari kesalahan serupa.

Menariknya, versi 3.5 ini juga memiliki filter baru yang merepresentasikan keberagaman manusia, dari berbagai warna kulit hingga fitur wajah. Stability AI berharap model ini lebih peka terhadap keragaman dan sejarah, menghindari kesalahan fatal seperti Gemini yang menimbulkan kontroversi besar tahun ini, di mana generative AI milik Google tersebut menghasilkan foto historis yang sangat tidak akurat.

Sumber