Google, yapay zeka destekli görsel oluşturmanın en büyük sorunlarından biri olan ‘tutarlılık’ problemini çözmek için Gemini uygulamasını güncelledi. Şirketin duyurduğu Gemini 2.5 Flash Image, kullanıcıların bir görselde küçük değişiklikler yapmak istediğinde tüm görüntünün bozulmasını engelliyor.
Google, “Artık aynı karakteri farklı ortamlara yerleştirebilir, tek bir ürünü yeni açılardan gösterebilir veya konuyu korurken marka varlıklarını tutarlı biçimde üretebilirsiniz” açıklamasında bulundu.
ÇOKLU DÜZENLEME MÜMKÜN
Yeni sistem, çoklu düzenleme özelliğiyle dikkat çekiyor. Örneğin bir odanın fotoğrafına mobilya eklenebiliyor, dekorasyon değiştirilebiliyor ya da bir kişinin kıyafeti ve saç modeli farklı senaryolarda denenebiliyor. Kullanıcılar ayrıca bir kişiyi ve evcil hayvanını aynı sahnede buluşturabiliyor.
TASARIMLAR KARŞILIKLI AKTARILABİLİYOR
Gemini’nin sunduğu bir diğer yenilik ise ‘tasarımları karıştırma’ özelliği. Bu sayede bir görseldeki stil başka bir nesneye uygulanabiliyor. Google örnek olarak bir elbise tasarımının desenlerinin bir kelebeğin kanatlarına aktarılmasını gösterdi.
GÜVENLİK VE ŞEFFAFLIK
Yapay zeka üretimli görsellerin kötüye kullanımıyla ilgili endişelerin arttığı dönemde, Gemini 2.5 Flash Image güvenlik önlemleriyle öne çıkıyor. Google, her görselin üzerinde görünmez bir SynthID dijital filigranı bulunduğunu ve görüntü değiştirilmiş olsa bile bu filigranın tespit edilebildiğini belirtiyor.
YAPAY ZEKA YARIŞI KIZIŞIYOR
Görüntü üretimi, yapay zeka rekabetinde en sıcak alanlardan biri haline geldi. Elon Musk, kendi platformu Grok’un ‘Baharatlı mod’ özelliğiyle bu alanda iddialı olduğunu vurgularken, ChatGPT’nin Ghibli tarzında popülerleşen görselleri sayesinde kullanıcı sayısı milyara yaklaşmıştı.
Google’ın yeni hamlesi, özellikle geliştiriciler için Gemini API, Google AI Studio ve Vertex AI üzerinden erişilebilir olmasıyla dikkat çekiyor.