Meta, Lawrence Berkeley Ulusal Laboratuvarı ve Los Alamos Ulusal Laboratuvarı'nın yürüttüğü ortak çalışma sonucunda geliştirilen Open Molecules 2025 veri seti, biyoloji, enerji teknolojileri ve malzeme bilimi gibi alanlarda makine öğreniminin etkisini derinleştirecek dev bir kaynak olarak sunuldu. Bu iş birliği, Los Alamos'un moleküler tarama konusundaki uzmanlığı ile Meta'nın hesaplama gücünü bir araya getirdi.
YENİLİKÇİ VERİ EKOSİSTEMİ
Open Molecules 2025, kuantum kimyası seviyesindeki doğruluğa ulaşmak için gereken yüksek hesaplama maliyetini azaltmayı hedefliyor. Projede, yoğunluk fonksiyonel teorisine (DFT) dayalı 100 milyondan fazla hesaplama gerçekleştirildi. Bu sayede, makine öğrenimi modellerinin kimyasal zorlukları çözmekte daha güvenilir hale gelmesi hedefleniyor.
Kapsamlı veri seti; ilaç keşfi, enerji depolama çözümleri ve malzeme geliştirme gibi alanlarda yapay zekâ destekli tasarımı daha erişilebilir kılacak. Araştırmacılar, bu verilerle eğitilmiş modelleri düşük maliyetle uyarlayabilecek.
YAZILIM DESTEKLİ KEŞİF
Projenin önemli bileşenlerinden biri de Los Alamos Ulusal Laboratuvarı'ndan Michael G. Taylor tarafından geliştirilen Architector yazılımı oldu. Bu yazılım, özellikle F-blok elementleri üzerinde 3 boyutlu metal komplekslerinin yapısal tahminini gerçekleştirmek için kullanıldı.
Architector, lantanitler (seryum, iterbiyum) ve aktinitler (toryum, uranyum) gibi elementlerin kimyasal yapılarını modelleyerek, veri setinin üçte birine kadarını oluşturdu. Bu kimyasallar, telekomünikasyondan görüntüleme sistemlerine kadar birçok yüksek teknoloji uygulamasında kullanılıyor.
METAL KOMPLEKSLER VE ÖTESİ
Open Molecules 2025 yalnızca metal kompleksleriyle sınırlı değil. Veri setinde; proteinler, RNA gibi iyonik moleküller, küçük moleküller ve elektrolit çözücülerle çevrili metal iyonları gibi farklı kimya sınıfları da yer alıyor. Bu çeşitlilik, makine öğrenimi modellerinin çok yönlü kullanımına imkân tanıyor.
EŞSİZ VERİ BÜYÜKLÜĞÜ
Meta’nın yüksek performanslı bilgi işlem altyapısı sayesinde yalnızca nadir toprak elementlerine dair yaklaşık 340 bin farklı yapı oluşturuldu. Bu sayı, literatürde yer alan en büyük ikinci veri setinin yaklaşık 20 katı büyüklüğünde. Her biri 17 farklı nadir toprak elementi için ortalama 20.000 yapıdan oluşan veri, yeni nesil modellerin temelini oluşturuyor.
AÇIK BİLİMSEL KATKI
Tüm proje çıktıları—veri seti, Architector yazılımı ve ilk makine öğrenimi modelleri—araştırma topluluğunun kullanımına açık kaynak olarak sunulacak. Böylece, bilim insanları kendi projelerinde bu kaynaklardan doğrudan faydalanabilecek.
Uzmanlara göre bu gelişme, kimyasal tasarımı minimum bilgi ve düşük maliyetle gerçekleştirebilecek yeni makine öğrenimi sistemlerinin eğitilmesine olanak tanıyacak. Open Molecules 2025’in bu açıdan bilimsel keşiflerde dönüştürücü bir rol üstlenmesi bekleniyor.