DALL-E 2, Midjourney ve Stable Diffusion üzere yapay zekâlar, hayatımıza istediğimiz görseli yalnızca yazıyla anlatarak oluşturma üzere harikulâde bir imkânı soktu. Alışılmış yeni gelişen her teknolojide olduğu üzere bu teknolojilerin de gelişme suratı, inanılmaz ölçüde yüksek düzeyde.
Bu teknolojilerin bilhassa açık kaynak olarak yayınlanması halihazırda bu gelişime büyük bir katkı sunarken, bugün Stable Difusion’dan heyecanlandıran duyuru geldi. Yapay zekânın arkasındaki takım, Stable Diffusion’un ikinci versiyonunu kullanıma sundu.
“Stable Diffusion 2.0” neler sunuyor?
CompVis tarafından geliştirilen yapay zekânın yeni sürümü Stable Diffusion 2.0, metinden görsel oluşturma imkânını orijinal boyuta taşıyacak. LAION-5B bilgi seti ile eğitilen yeni model, daha yüksek çözünürlüklü görseller oluşturabilecek, düşük çözünürlüklü görselleri yüksek çözünürlüğe kavuşturabilecek ve görseller için çok daha dengeli alternatifler sunabilecek. Gelin, tüm bunlara ayrıntılarıyla bakalım.
Çok daha yüksek çözünürlüklü görseller elde edilebilecek:
Stable Diffusion 2.0 ile birlikte kullanıcılar, 512×512 yahut 768×768 çözünürlüklerinde çıktılar alabilecekler. Ek olarak oluşturulan tüm fotoğraflar, LAION’un NSFW filtresinden geçerek yetişkin içeriklerden arındırılacak.
Tabii istediğiniz fotoğrafı alırsanız, bunun çözünürlüğünü çok daha yüksek düzeylere taşıyabileceksiniz:
Yeni sürüm, artık 2048×2048 piksel ve daha yüksek çözünürlükte ‘upscale’ imkânı da sunacak. Oluşturduğunuz görsellerden beğendiğiniz örneği alıp, 512×512 pikselden çok daha yüksek çözünürlüklere taşıyabileceksiniz.
Görselden görsel oluşturmada da yeni geliştirmeler yapıldı:
‘depth2img’ isimli yeni model ile birlikte 2.0 sürümü, görselleri çok daha yeterli bir biçimde tahlil edebilecek. Bu sayede yapay zekâ, sunduğunuz bir görselin farklı alternatiflerini daha yüksek mana bağıyla oluşturabilecek.
Görseller üzerinde metinle değişiklik yapılabilecek!
Görselden görsele çıktının yanı sıra kullanıcılar, artık sundukları bir görselde istedikleri değişiklikleri yazıyla belirtebilecekler. Yapay zekâ, evvel görseli tahlil edecek, sonrasında metinle sunduğunuz değişiklikleri görsel üzerinde uygulayacak.
Stable Diffusion 2.0’a erişmek için bu ilişkiye tıklayarak yapay zekânın GitHub sayfasına ulaşabilirsiniz.