OpenAI, muhakeme ve problem çözmede uzmanlaşmak üzere geliştirdiği o1 model serisini duyurdu. o1-preview ve o1-mini adını taşıyan bu modeller, karmaşık görevlerde daha düşünceli bir yaklaşım benimseyerek, yanıt vermeden önce daha fazla "düşünme" süresi harcıyor. Bu metodoloji, özellikle bilim, matematik ve kodlama gibi alanlarda yapay zekânın insan benzeri akıl yürütme yeteneğini güçlendiriyor.
Proje, perşembe günü resmi olarak o1 adıyla piyasaya sürüldü ve hem ChatGPT platformunda hem de API üzerinden kullanıma açıldı. OpenAI’nin açıklamasına göre, o1-preview modeli Uluslararası Matematik Olimpiyatı (IMO) yeterlilik sınavında yüzde 83 başarı oranına ulaşarak, GPT-4o’nun yüzde 13’lük skoruna kıyasla büyük bir ilerleme kaydetti. Ayrıca, rekabetçi kodlama yarışmalarında yüzde 89’luk bir başarıya imza atan model, karmaşık problem çözme becerilerini bir kez daha kanıtladı.
o1 modelinin en dikkat çeken özelliği, yanıtlarını zamanla iyileştirebilmesi. Model, stratejilerini tekrarlayarak hatalarını fark ediyor ve böylece daha güvenilir çözümler sunabiliyor. Ancak, bu gelişmiş işleyiş bazı dezavantajlar da barındırıyor. Kullanıcılar, ek işlem adımlarının yanıt süresini uzattığını bildiriyor. OpenAI, bu konuda iyimser kalarak, modelin hız ve doğruluk dengesini sağlamak için performansını daha da iyileştirmeye yönelik çalışmalarını sürdürüyor.
Yeni model bilim, kodlama ve matematik alanlarında öne çıkıyor
o1 modeli, özellikle yaratıcı işler yerine, bilim, kodlama ve matematik gibi alanlarda karmaşık problem çözmenin gerekli olduğu görevlerde en iyi performansını gösteriyor. Sağlık araştırmacıları hücre dizileme verilerini açıklamak ya da fizikçiler karmaşık matematiksel formüller üretmek için bu modelden faydalanabiliyor.
o1-mini sürümü ise daha hızlı ve ekonomik bir alternatif sunuyor. o1-preview'dan yüzde 80 daha ucuz olmasına rağmen, o1-mini hala kod üretimi ve hata ayıklama gibi görevlerde güçlü muhakeme yetenekleriyle dikkat çekiyor. Bu model, büyük bir bilgi tabanına ihtiyaç duymadan güçlü problem çözme becerileri gerektiren görevler için ideal bir kaynak olarak öne çıkıyor.
OpenAI, bu yeni akıl yürütme modellerinin lansmanıyla birlikte, ChatGPT ve API üzerinden kullanılabilirliğini genişletiyor. Modele önümüzdeki dönemlerde tarama, dosya ve resim yükleme gibi ek özellikler de sunulacak. Şu an için ChatGPT Plus ve Team kullanıcıları, o1-preview ve o1-mini modellerine doğrudan model seçici aracılığıyla erişebiliyor. Başlangıç olarak, o1-preview modeli için haftalık 30 mesaj ve o1-mini için 50 mesaj sınırı getirilmiş durumda, ancak OpenAI bu sınırları genişletmeyi ve ChatGPT'nin herhangi bir görev için en uygun modeli otomatik olarak seçmesini sağlamayı hedefliyor.