Tether, QVAC Genesis II'yi yayımladı Sentetik eğitim veri seti 148 milyar token'a ulaştı

Ekonomi

Tether, QVAC Genesis II'yi yayımladı Sentetik eğitim veri seti 148 milyar token'a ulaştı



Tether Data'nın yapay zekâ araştırma birimi QVAC, yapay zekâ ön eğitimi için dünyanın
kamuya açık en büyük sentetik eğitim veri setinin önemli bir genişlemesi
olan QVAC Genesis II'nin yayınlandığını duyurdu.

Sentetik yapay zekâ eğitim verileri alanında önemli bir genişlemeye giden QVAC,
Genesis II sürümünü yayımladı. Yeni sürümle birlikte 107 milyar token veri setine
eklenirken, toplam hacim 19 eğitim alanında 148 milyar token'a ulaştı. Genesis
II, kimya, bilgisayar bilimi, makine öğrenimi, istatistik ve fizik gibi temel
STEM alanlarını kapsayan Genesis I üzerine inşa edilerek üniversite düzeyinde
doğrulanmış, daha derin ve çok disiplinli bir sentetik veri altyapısı sunuyor.

QVAC Genesis II'nin merkezinde, yalnızca doğru sonuçlara değil, bu sonuçlara götüren
muhakeme süreçlerine odaklanan Seçenek Düzeyinde Muhakeme (Option-Level Reasoning)
yaklaşımı yer alıyor. Bu yöntem, çoktan seçmeli sorulardaki tüm yanıt
seçeneklerini sistematik biçimde analiz ederek doğru muhakemeyi güçlendirirken
yaygın hataları da açıkça ele alıyor, Genesis I'deki Hata Analizi yöntemiyle birlikte
çalışarak her sorunun yüksek eğitsel değer taşımasını sağlıyor. Bağımsız
değerlendirmeler, bu yaklaşımla üretilen verilerle eğitilen modellerin muhakeme
doğruluğunda ve yanıt netliğinde belirgin iyileşmeler gösterdiğini ortaya koyuyor.

Bu yayın, yalnızca ölçeğin büyümesini değil, eğitim amaçlı yapay zekâ verilerinin
nasıl tasarlanması gerektiğine dair bilinçli bir yön değişimini temsil ediyor.
QVAC'in yaklaşımı, metin hacmini artırmak yerine modellere nasıl düşüneceklerini,
muhakeme edeceklerini ve açıklayacaklarını öğretmeyi hedefleyerek zekâyı taklitten
anlayışa taşıyor.

Günümüzde yapay zekâ eğitiminin çoğu, anlama değil, akıcılığa odaklanıyor
Tether CEO'su Paolo Ardoino, Günümüzde yapay zekâ eğitiminin çoğu, anlama değil,
akıcılığa odaklanıyor. Bu sürümle, hacmin ötesine geçerek yapıya, mantığa ve
açıklığa yöneliyoruz. Zekâ, sadece kulağa doğru gelen şeyi tahmin etmekle değil,
bir şeyin neden doğru olduğunu anlamakla inşa edilmelidir. Bu veri setini açık
hale getirerek, araştırmacılara ve geliştiricilere daha güvenilir, daha açıklanabilir
ve nihayetinde topluma daha faydalı yapay zekâ geliştirmek için araçlar
sağlıyoruz. dedi.

Genesis I'de olduğu gibi QVAC Genesis II veri seti de kapalı ve mülkiyetli sistemlerin
dışında çalışan araştırmacıları, akademik kurumları ve bağımsız geliştiricileri
desteklemek amacıyla Creative Commons Atıf-Ticari Olmayan (CC-BY-NC 4.0)
lisansı altında açık olarak yayımlanıyor. Bu yayın, QVAC ve Tether Data'nın merkezi
bulut platformlarına bağımlı olmayan, yerel ve merkeziyetsiz yapay zekâ
geliştirmeyi destekleyen daha geniş vizyonunun bir parçası olarak, yüksek kaliteli
eğitim verilerine küresel erişimi güçlendirmeyi hedefliyor. Veri setine ve
modellere Hugging Face üzerinden erişilebilirken, teknik ayrıntılar QVAC araştırma
blogunda yayımlanan kapsamlı dokümanda ve QVAC web sitesindeki ek kaynaklarda
paylaşılıyor.


-iDeal Haber Merkezi-
- twitter.com/iDealDataHaber // www.idealdata.com.tr -

Görüntülü Görüşme
× Kolayca Görüntülü Hesap Açın Telefon Görseli