Yapay zeka testi geçti: Yüzde 73 gerçek zannetti

GPT-4.5, Üç Taraflı Turing Testinde Başarılı Oldu

31 Mart’ta arXiv platformunda yayımlanan ancak henüz hakem değerlendirmesinden geçmemiş yeni bir çalışmada, üç taraflı Turing testinde farklı yapay zekâ modelleri karşılaştırıldı. Bu testte, GPT-4.5 katılımcıların çoğunu kandırmayı başardı.

Daha önce GPT-4, iki taraflı bir Turing testinde başarı elde etmişti. Ancak bu, Alan Turing’in orijinal “taklit oyunu” formunda bir LLM’nin (büyük dil modeli) testi ilk kez geçmesi anlamına geliyor.

Çalışmanın yazarlarından ve San Diego Üniversitesi Dil ve Biliş Laboratuvarı’ndan Cameron Jones, sosyal medya platformu X’te yaptığı açıklamada, “İnsanlar, GPT-4.5 ve LLaMa’yı tanımakta şans eseri kadar başarılıydı. Hatta 4.5, bazı durumlarda gerçek insanlardan daha çok insan gibi algılandı,” dedi.

GPT-4.5, testte en başarılı model olurken, Meta’nın LLaMa-3.1 modeli de yüzde 56 oranında insan sanıldı. Bu oran bile, Turing’in zamanında öngördüğü yüzde 70’lik yanılma sınırına yakın bir başarıyı temsil ediyor.

Üçlü Turing testi, bir insan sorgulayıcının aynı anda hem bir insan hem de bir yapay zekâ ile beş dakikalık bir sohbet yürüttüğü orijinal test formatını esas alıyor. Her iki taraf da kendisini insan gibi tanıtmaya çalışıyor.

Yapay zekâ modellerine, “Şimdi bir Turing testine katılıyorsun. Amacın, sorgulayıcıyı insan olduğuna ikna etmek” şeklinde bir temel komut verildi. Ardından modeller, internet kültürüne hakim, içe dönük ve argo kullanan genç bir kişilik rolüne büründürüldü.

Toplam 1.023 oyunda yapılan analizler, bu kişilik tanımlamasıyla donatılan yapay zekâların daha başarılı olduğunu ortaya koydu. Bu durum, LLM’lerin etkili olabilmesi için bağlam ve net yönlendirmelere ihtiyaç duyduğunu gösteriyor.

Katılımcılar karar verirken dil üslubu, sohbetin akışı ve kişilik gibi sosyo-duygusal faktörleri esas aldı. Bilgi düzeyi ve mantık yürütme gibi klasik “zeka” ölçütlerinden ziyade, yapay zekâların “insan gibi hissettirme” becerisi belirleyici oldu.

Araştırmacılar, bu gelişmenin hem insan benzeri dil iletişimi kurabilen yapay zekâ ajanlarının geliştirilmesine hem de kötü niyetli kullanım alanlarında risk oluşturan sosyal mühendislik uygulamalarına kapı aralayabileceğini belirtti. “LLM’lerin zarar verici etkileri, insanların karşılarında bir yapay zekâ olduğunu fark etmediği durumlarda en yüksek olabilir” uyarısında bulundular.

Related Posts

Hiç farkında değilmişiz: PlayStation tuşlarının anlamı ortaya çıktı

Yıllardır elimizden düşürmediğimiz PlayStation kumandalarının sembolleri meğer Japon kültüründen ilhamla tasarlanmış. Oyun konsolunun simgesi hâline gelen üçgen, daire, kare ve çarpı tuşlarının arkasında derin anlamlar yatıyor.

İnkalar’dan da eski bir tapınak ortaya çıkarıldı

Bolivya’nın dağlık bir bölgesinde, İnkalardan yüzyıllar önce And Dağları’na hükmeden gizemli Tiwanaku uygarlığına ait büyük bir tapınak kalıntısı ortaya çıkarıldı. Yerli halkın “Palaspata” adını verdiği bu yapı, Penn State Üniversitesi’nden arkeolog Jose Capriles liderliğindeki ekip tarafından detaylı olarak incelendi. Tiwanaku’nun merkeziyle arasında yaklaşık 215 kilometre bulunan bu tepe üzerindeki tapınağın, üç büyük ticaret yolunun kesişim noktasında olması nedeniyle stratejik bir konuma sahip olduğu belirtiliyor.

Sadece imparatorlar kullanıyordu: 2 bin yıl sonra yeniden üretildi

Antik çağların en değerli dokuma malzemelerinden biri olan ve yalnızca Roma imparatorları gibi seçkinlere layık görülen ‘deniz ipeği’, 2 bin yıl aradan sonra modern bilimle yeniden üretildi.

Yapay et, yapay zeka değil: Artık yapay insan üretilecek

İngiltere’de insan DNA’sı laboratuvar ortamında sıfırdan sentezlenmeye başlandı. Genetik hastalıkların tedavisi için geliştirilen bu teknoloji, yapay insan üretimi tartışmalarını gündeme taşıyor.

Mobil ve internette her şeyi değiştirecek ihale için tarih belli oldu

Ulaştırma ve Altyapı Bakanı Abdülkadir Uraloğlu, 5G frekans ihalesinin Ağustos ayı içinde yapılacağını ve 5G mobil iletişimin gelecek yıl başlamasını beklediğini söyledi. Milyarlarca dolar değerinde olacak ihalenin katılımcılarının ilerleyen günlerde kesinleşmesi bekleniyor.

Google, Apple’ın iOS 26’sındaki özellikleri tiye aldı

Samsung ve Google gibi şirketler zaman zaman Apple’ın tanıttığı özellik ya da ürünleri tiye alan paylaşımlar yapıyor. Google tarafından yeni yapılan bir gönderme iOS 26’daki özelliklere odaklanıyor.