Openai, insan düşünme sürecini taklit eden, daha basit adımlara ayrılan, çeşitli yaklaşımları analiz edebilen ve mantıksal olarak çözülebilen yeni dil modeli Chatgpt O1’i tanıttı.
O1 modeli, uzmanların sonuçlarıyla karşılaştırılabilir testler ve yarışmalarda olağanüstü sonuçlar gösterdi. Programlama alanında O1, 2024 Uluslararası Bilişim Olimpiyatı’nda (IOI) 49. sırada yer aldı ve Codeforces platformundaki katılımcıların yüzde 89’unu aştı. Matematikte O1, Amerikan Matematik Olimpiyatı’nın (AIME) yeterlilik aşamasında ABD’deki en iyi 500 öğrenciden biriydi.
Doğa bilimlerinde, model GPQA elmas testinde doktorların ve bilim adaylarının sonuçlarını aştı, kimya, fizik ve biyoloji alanındaki bilgileri değerlendirdi. Geliştiriciler, modelin herhangi bir bilim adayı üzerindeki üstünlüğü anlamına gelmediğini, ancak sorunları yüksek nitelikli uzmanlar düzeyinde çözme yeteneğini gösterdiğini belirtiyor.
O1 modeli, MMMU ve MMLU dahil olmak üzere istihbarat testlerinde ve problemleri çözmedeki önceki modelleri de aştı. Openai’ye göre, O1 mantıksal düşünce ile ilgili görevlerde GPT-4O’yu önemli ölçüde aşmaktadır. AIME O1 testlerinde, GPT -4o – yüzde 13, görevlerin ortalama yüzde 83’ünü çözdüm.
Ek olarak, O1, GPT-4O’ya kıyasla halüsinasyonlara çok daha az duyarlıdır, ancak daha yavaş çalışır ve bakımı daha pahalıdır. Ansiklopedik bilgilerde GPT-4O’dan daha düşüktür ve web sayfasını, dosyaları ve resimleri işleyemez. Ayrıca, model çözümü sonuç olarak ayarlayarak verileri değiştirebilir.
Modelin başarısı yeni öğrenme algoritması ile açıklanmaktadır – modelin sonuçlarını iyileştirmesine ve düzeltmesine, karmaşık adımları daha basit bir şekilde kırmasına ve farklı yaklaşımlara sahip olmasını sağlar. >
Openai, API aracılığıyla CHATGPT’de ve geliştiriciler için kullanılabilen O1 ön görüş modelinin bir ön versiyonunu yayınladı. O1 önleme kullanma maliyeti 1 milyon giriş jetonları için 15 $ ve 1 milyon çıktı jetonları için 60 $, GPT-4O’nun sırasıyla 5 $ ve 15 $ ‘dır.
Daha önce, Apple Intelligence AI sistemi piyasanın arkasında güçlü bir şekilde geciktirildi.