adnan.ertemel@gmail.com
Geçtiğimiz yazımızda OpenAI araştırma şirketinin şaşırtıcı bir performansa sahip ChatGPT sistemini incelemiştik. Elon Musk ve Silikon Vadisi’nin en ünlü Y-Combinator hızlandırma şirketinin eski yöneticisi Sam Altman’ın kurucu ortakları olduğu Microsoft yatırım fonunun 1 milyar dolar yatırım yaptığı OpenAI son günlerde adından sıklıkla söz ettirmeye başladı. Öyle ki, ChatGPT, kullanıcıların Google’a sadece 2021’de 208 milyar ABD doları (Alphabet’in toplam gelirinin yüzde 81’i) olan reklamlı Google arama motoru pazarını ciddi anlamda sekteye uğratabilir. OpenAI yönetiminin yatırımcılara yaptığı son sunumdan sızan bilgilere göre, şirket gelecek yıl 200 milyon dolar ve 2024’te de 1 milyar dolar gelir öngörüyor.
GÖRSEL İÇERİK
Şirketin ikincil hisse satışında hisselerinin son olarak toplam 20 milyar dolar değerleme üzerinden el değiştirdiği belirtiliyor. Şirket, ChatGPT dışında yapay zeka tabanlı ilham veren başka ürünler de sunuyor. Bu ürünlerin en dikkat çekicilerinden biri DALL-E 2. DALL-E’yi, OpenAI tarafından geliştirilen bir Görsel Tanımlama Aracı (VQA) olarak tanımlamak mümkün. Bu sistem, verilen bir metin girişine göre görsel içerik oluşturmayı amaçlıyor. Örneğin, ‘kırmızı bir elbise giyen bir kadın’ gibi bir metin girişi verildiğinde, DALL-E, tarif edilen şeyi görsel olarak temsil eden tamamen özgün bir resmi saniyeler içinde üretebiliyor.
DALL-E’nin çalışma mekanizması, genellikle derin öğrenme tabanlı VQA sistemlerinde olduğu gibi bir metin girişi alıyor ve bu girişi temsil eden bir görsel üretebilmek için bir görsel çıktı üretiyor. Akıl sınırlarını zorlayan tamamen fiktif bir tariften hareketle (yağlı boya, dijital sanat, kara kalem çalışması vb.) DALL-E, farklı stillerde, etkileyici ve özgün görseller üretiyor. Aynı metin için en az 4 ayrı alternatif oluşturan sistem, alternatiflerden birinin seçilmesi sonrası farklı varyantlar oluşturulmasına da izin veriyor.
Aşağıda girdi olarak verilen metinler eşliğinde DALL-E’nin ürettiği iki farklı görsel yer alıyor.
Yansıtıcı bir gölün üzerinde uçan gökkuşağı renkli bir sıcak hava balonunun 3 boyutlu görüntüsü
Bir maymun, bir robot ve bir dinozorun bir arada olduğu bir masa tenisi maçı (üretilen alternatiflerden ikisi)
YIKICI İNOVASYON
OpenAI, yazılım geliştiricilere teknolojisini lisanslayarak ChatGPT ile 20 bin kelimelik metni üretmek için sadece 1 sent ücret alıyor. Yazılan bir metni tarif eden bir görseli DALL-E ile oluşturmak için de 2 sent ücret alıyor.
Özetle DALL-E, yıkıcı bir inovasyon olma potansiyeline sahip bir sistem olarak görülebilir. Kısa zamanda öğrenme mekanizması sayesinde sanatsal eserler çıkarmada çok becerikli olan sistem, birçok kreatif alanda (stüdyolar, reklam ajansları vb.) ilham vermesi ve başlangıç noktasında farklı alternatifler üretmesi için kullanılabilir.
Microsoft üst yöneticisi Brad Smith, geçtiğimiz hafta yaptığı bir açıklamada, OpenAI’ın kısa zamanda gösterdiği kayda değer ilerlemeye atıfta bulunarak şu ifadeleri kullandı: “AI, birçok kişinin tahmin ettiğinden daha hızlı ilerledi. 2023’te, iki yıl önce insanların 2033’te bekleyeceği ilerlemeleri göreceğiz. Bu durum sadece Microsoft’un geleceği için değil, herkesin geleceği için çok önemli gelişmelere gebe olduğumuzu gösteriyor.”
Görünen o ki, yapay zeka emekleme aşamasını çoktan geçmiş durumda ve ilgili yenilikçi araştırma şirketleri, Google gibi devlerde kırmızı alarm zillerinin çalmasına neden oldu bile…
02 Ocak 2023 Pazartesi