Mevcut metinden görüntüye (text-to-image) dönüştüren modeller, görsel kaliteleriyle göz doldursa da, spesifik yönlendirmeler söz konusu olduğunda yaratıcıları hayal kırıklığına uğratabiliyor. Stanford bilgisayar bilimleri profesörü Maneesh Agrawala, bu durumu şu sözlerle özetliyor: "Modeller harika görünse de iş birliği konusunda berbatlar. Bir sanatçının, belirli bir metin komutu verildiğinde yapay zekanın ne üreteceğini bilmesinin hiçbir yolu yok."
İŞ BİRLİĞİNİ GÜÇLENDİREN ÜÇ STRATEJİK ARAÇ
Stanford ekibi, insanların görsel içerik oluştururken kurduğu iletişimi analiz ederek üç yeni açık kaynaklı çözüm geliştirdi:
OYUNDAN EĞİTİME: GENİŞ UYGULAMA ALANI
Stanford’un bu vizyoner yaklaşımı şimdiden endüstriyel karşılığını bulmuş durumda. Araştırma ekibi, popüler oyun platformu Roblox ile iş birliği yaparak oyuncuların oyun kuralları ve kısıtlamaları dahilinde (örneğin şiddet içermeyen nesneler üretmek gibi) 3 boyutlu dünyalar inşa etmesini sağlıyor.
Psikoloji yardımcı doçenti Judith Fan, projenin demokratikleştirici etkisine dikkat çekerek; "Hobi sahiplerinden küçük işletme sahiplerine kadar her seviyeden yaratıcının, fikirlerini yapay zekaya sorunsuz bir şekilde anlatabileceği araçlar sunmakta kararlıyız" diyor.
Bu gelişme; mimari tasarımdan robotik simülasyonlara, eğitimden profesyonel animasyon üretimine kadar geniş bir yelpazede ‘insan yaratıcılığını’ yapay zeka hızıyla birleştiren yeni bir iş modelinin kapısını aralıyor.