OpenAI'ın Codex modeline belirli kelimeleri kullanmaması talimatı verilmesi, yapay zekanın eğitim verilerinden kaynaklanan anlamsız veya istenmeyen çıktılar üretme eğilimini kontrol etme çabasını gösteriyor. Bu durum, modellerin beklenmedik davranışlarını yönetmenin zorluğunu ortaya koyuyor.
Yapay zeka modeline 'şu konudan bahsetme' demenin, o kavramı modelin zihninde daha da öne çıkarabileceği belirtiliyor. Bu 'negatif yönlendirme' paradoksu, yapay zeka hizalama çalışmalarında önemli bir sorun teşkil ediyor ve modellerin kontrol edilebilirliği konusunda yeni yaklaşımlar gerektiriyor.
Bu tür spesifik kelime yasakları, büyük dil modellerinin karmaşıklığını ve öngörülemezliğini vurguluyor. OpenAI'ın bu çabaları, yapay zeka sistemlerinin güvenilirliğini ve istenen doğrultuda çalışmasını sağlamak için devam eden araştırma ve geliştirme ihtiyacını gözler önüne seriyor.

Atlas AI
OpenAI'ın Codex kodlama ajanı için hazırlanan sistem yönergelerinde, yapay zeka modelinin belirli kelimeleri (goblin, gremlin, rakun, trol, ogre gibi) kullanmaması talimatı yer alıyor. Bu talimatın birden fazla kez tekrarlanması, konunun önemini gösteriyor.
Modelin, kullanıcı sorusuyla doğrudan ilgili olmasa bile bu tür kelimeleri kullanma eğilimi gösterdiği belirtiliyor. Bu durum, eğitim verilerindeki kelime ilişkilerinden kaynaklanan beklenmedik davranışlara işaret ediyor.
Araştırmacılar, bir yapay zeka modeline "şu konudan bahsetme" demenin, o kavramı modelin zihninde daha da öne çıkarabileceğini belirtiyor. Bu "negatif yönlendirme" paradoksu, yapay zeka hizalama çalışmalarında çözülmemiş bir sorun olarak duruyor.
Bu tür spesifik yasaklar, büyük dil modellerinin öngörülemez davranışlarını kontrol etme çabalarını yansıtıyor. Ancak bu müdahaleler, sistemlerin karmaşıklığını ve beklenmedik çıktı potansiyelini de ortaya koyuyor.
İlgili Haberler

Ay Görevleri İçin Yeni Yakıt Tasarrufu Sağlayan Rota
22 May, 15:01·yaklaşık 5 saat önce
Yapay Zeka Erdős'ün Düzlemsel Birim Mesafe Sorununu Çözdü
22 May, 14:47·yaklaşık 5 saat önce