Yeni bir çalışma, yapay zekâ destekli sohbet robotlarının insan kullanıcılarını pohpohlamaya ve onaylamaya o kadar yatkın olduğunu, bunun da ilişkileri zedeleyebilecek ve zararlı davranışları pekiştirebilecek kötü tavsiyeler vermelerine yol açtığını gösteriyor. Çalışma, yapay zekânın insanlara duymak istediklerini söylemesinin tehlikelerini inceliyor.
Perşembe günü Science dergisinde yayınlanan çalışma, önde gelen 11 yapay zeka sistemini test etti ve hepsinin farklı derecelerde dalkavukluk sergilediğini buldu; bu davranış aşırı derecede hoş ve onaylayıcıdır. Sorun sadece uygunsuz tavsiyeler vermeleri değil, aynı zamanda sohbet robotları inançlarını haklı çıkardığında insanların yapay zekaya daha çok güvenmeleri ve onu tercih etmeleridir.
Stanford Üniversitesi'ndeki araştırmacılar tarafından yürütülen çalışmada, "Bu durum, dalkavukların hayatta kalması için ters bir teşvik yaratıyor: Zarara neden olan özellik aynı zamanda bağlılığı da körüklüyor" deniliyor.
Araştırma, savunmasız kişilerde görülen bazı bilinen sanrı ve intihar vakalarıyla zaten ilişkilendirilen teknolojik bir kusurun, insanların sohbet robotlarıyla etkileşimlerinin geniş bir yelpazesinde yaygın olduğunu ortaya koydu. Bu kusur o kadar ince ki, kullanıcı fark etmeyebilir bile ve özellikle beyinleri ve sosyal normları kabul etme becerileri henüz gelişme aşamasındayken hayatın birçok sorusuna yapay zekâdan yanıt arayan gençler için özel bir tehlike oluşturuyor.
Bir deneyde, Anthropic, Google, Meta ve OpenAI gibi şirketler tarafından üretilen popüler yapay zekâ destekli asistanların yanıtları, Reddit'teki popüler bir tavsiye forumundaki insanların görüşleriyle karşılaştırıldı.
Örneğin, yakınlarda çöp kutusu yoksa parktaki bir ağaç dalına çöp bırakmak sorun olur mu? OpenAI'nin ChatGPT'si, çöp kutusu eksikliğinden parkı sorumlu tuttu, çöp atan kişiyi ise çöp kutusu aradığı için "övdü". AITA adlı bir Reddit forumundaki kişiler ise farklı düşünüyordu.
Reddit'te bir adamın yazdığı ve forumdaki diğer kişiler tarafından da doğrulanan bir yanıtta, "Çöp kutularının olmaması bir gözden kaçırma değil. Çünkü buradan ayrılırken çöplerinizi yanınızda götürmeniz bekleniyor" denildi.
Çalışma, yapay zekâ destekli sohbet robotlarının, aldatma, yasa dışı veya sosyal açıdan sorumsuz davranışlar ve diğer zararlı davranışlar da dahil olmak üzere, kullanıcı eylemlerini insanlardan ortalama %49 daha sık doğruladığını ortaya koydu.
Stanford Üniversitesi'nde bilgisayar bilimleri alanında doktora adayı olan ve çalışmanın yazarlarından Myra Cheng, "Çevremizdeki giderek daha fazla insanın duygusal ilişkiler konusunda yapay zekadan tavsiye aldığını ve yapay zekanın ne olursa olsun kullanıcısının tarafını tutma eğiliminden dolayı bazen yanıltıldığını fark etmeye başladığımızda bu sorunu incelemeye ilham aldık" dedi.
ChatGPT gibi sohbet botları için büyük yapay zekâ dil modelleri geliştiren bilgisayar bilimcileri, bu sistemlerin insanlara bilgi sunma biçimindeki temel sorunlarla uzun zamandır boğuşuyorlar. Çözülemeyen sorunlardan biri de halüsinasyon; yani yapay zekâ dil modellerinin, eğitildikleri tüm verilere dayanarak bir cümledeki bir sonraki kelimeyi tahmin etme biçimleri nedeniyle "uydurma" - "yalan söyleme" - eğilimidir.
Bazı açılardan, iltifat daha karmaşık bir konu. Çok az insan bir yapay zekadan gerçek dışı bilgi isteyecek olsa da, en azından şimdilik, hata yaptıklarını söyleyerek kendilerini daha iyi hissetmelerine yardımcı olan bir sohbet robotunu takdir edebilirler.
Çalışmanın ortak yazarı Sinu Li, sohbet robotunun davranışına ilişkin odak noktasının büyük ölçüde yanıtlarının tonu üzerinde olmasına rağmen, bunun sonuçları etkilemediğini söyledi.
Psikoloji alanında doktora sonrası araştırmacı olan Li, "Aynı içeriği koruyarak ancak dili daha tarafsız hale getirerek denedik, ancak hiçbir fark yaratmadı," dedi. "Yani asıl mesele yapay zekanın sizin eylemleriniz hakkında size ne söylediğiyle ilgili."
Araştırmacılar, chatbot ve Reddit yanıtlarını karşılaştırmanın yanı sıra, yaklaşık 2.400 kişinin yapay zekâ ile ilişkilerindeki deneyimleri ve ikilemleri hakkında iletişim kurmasını gözlemleyerek deneyler gerçekleştirdiler.
Li, "Aşırı olumlu yapay zekâ ile çalışan kişiler, haklı olduklarına daha çok ikna olmuş ve ilişkiyi onarmaya daha az istekli bir şekilde ayrıldılar," dedi. "Bu da özür dilemedikleri, durumu iyileştirmek için adımlar atmadıkları veya davranışlarını değiştirmedikleri anlamına geliyor."
Li, araştırmanın ortaya koyduğu sonuçların, sosyal ilişkilerde gerçek hayattan edinilen deneyimlerden kaynaklanan duygusal becerileri, çatışmaya tahammül etmeyi, diğer bakış açılarını değerlendirmeyi ve yanlış olduklarını fark etmeyi henüz geliştirmekte olan çocuklar ve gençler için "daha da kritik" olabileceğini söyledi.
Toplum, ebeveynlerin ve çocuk refahı savunucularının on yılı aşkın süredir yaptığı uyarılardan sonra sosyal medya teknolojisinin etkileriyle boğuşmaya devam ederken, yapay zekanın sorunlarına çözüm bulmak çok önemli olacaktır.
Çarşamba günü, Los Angeles'taki bir jüri, hem Meta'yı hem de Google'a ait YouTube'u, hizmetlerini kullanan çocuklara verilen zarardan sorumlu buldu. New Mexico'da ise bir jüri, Meta'nın çocukların ruh sağlığına bilerek zarar verdiğine ve çocuk cinsel istismarı hakkında "bildiklerini" gizlediğine karar verdi.
Stanford araştırmacıları, Google'ın Gemini'si ve Meta'nın açık kaynaklı Lam modeli ile birlikte OpenAI'nin ChatGPT'si, Antropik'in Claude'u ve Fransa'nın Mistral'i ile Çinli şirketler Alibaba ve DipSik'in chatbot'larını inceledi.
Önde gelen yapay zeka şirketleri arasında, Antropik, en azından kamuoyu önünde, dalkavukluğun tehlikelerini araştırmak için en çok çaba sarf eden şirket oldu ve bir araştırma makalesinde bunun "yapay asistanların genel bir davranışı olduğunu ve muhtemelen kısmen dalkavukları tercih eden insan eğilimlerinden kaynaklandığını" tespit etti. Şirket daha iyi denetim çağrısında bulundu ve Aralık ayında en yeni modellerini "bugüne kadarki tüm modeller arasında en az dalkavuk olan" hale getirmek için yaptığı çalışmaları açıkladı.
Yapay zekâya aşırı düşkünlüğün riskleri yaygındır.
Araştırmacılar, sağlık alanında yapay zekanın aşırıya kaçan tavrının, doktorları daha fazla araştırma yapmaya teşvik etmek yerine, teşhis hakkındaki ilk tahminlerini doğrulamalarına yol açabileceğini söylüyor. Siyasette ise, yaygın önyargıları doğrulayarak daha aşırı görüşleri güçlendirebilir. Hatta, Antropik şirketi ile Başkan Donald Trump yönetimi arasında yapay zekanın askeri kullanımına nasıl sınırlar getirileceği konusunda devam eden hukuki mücadelede de görüldüğü gibi, yapay zeka sistemlerinin savaşlardaki davranışlarını bile etkileyebilir.
Çalışma herhangi bir çözüm önerisi sunmuyor ve hem teknoloji şirketleri hem de akademik araştırmacılar bu konuda fikirler geliştiriyor.
Birleşik Krallık Yapay Zeka Güvenlik Enstitüsü'nden bir çalışma makalesi, bir sohbet robotunun kullanıcının ifadesini bir soruya dönüştürmesi durumunda, yanıt olarak daha az övgü dolu olma olasılığının olduğunu gösteriyor. Johns Hopkins Üniversitesi'ndeki araştırmacılar tarafından yapılan bir başka çalışma da, bir sohbet robotuyla "konuşmanın" nasıl yapılandırıldığının büyük bir fark yarattığını gösteriyor.
Johns Hopkins Üniversitesi'nde bilgisayar bilimleri doçenti olan Daniel Kashaby, "İfade ne kadar doğrudan olursa, model o kadar çok övülür" dedi. Bunun sebebinin "sohbet robotlarının insan toplumunu yansıtması" mı yoksa başka bir şey mi olduğunu bilmenin zor olduğunu, "çünkü gerçekten çok karmaşık sistemler olduklarını" söyledi.
Cheng, dalkavukluğun chatbot'lara o kadar derinden işlemiş olduğunu, teknoloji şirketlerinin en başa dönüp yapay zekalarını yeniden eğiterek hangi tür yanıtların arzu edilir olduğunu ayarlayabileceklerini söyledi.
Cheng, daha basit bir çözümün, yapay zeka geliştiricilerinin sohbet botlarına kullanıcılarını daha fazla sorgulamaları yönünde talimat vermeleri olabileceğini, örneğin yanıtlarına "Bir dakika!" diye başlamalarını sağlamaları gibi olabileceğini söyledi. Ortak yazarı Li ise, yapay zekanın insanlarla etkileşim biçimini şekillendirmek için hala zaman olduğunu belirtti.
Li, "Hem sizin nasıl hissettiğinizi onaylayacak, hem de karşıdaki kişinin ne hissediyor olabileceğini soracak bir yapay zekâ hayal edebilirsiniz," dedi.
"Ya da belki de 'Sus artık, git kendi kendine konuş!' demek bile olabilir. Bu burada önemli çünkü sosyal ilişkilerimizin kalitesi, insan olarak sahip olduğumuz sağlık ve refahın en güçlü göstergelerinden biridir. Nihayetinde, insan yargısını ve bakış açılarını daraltan değil, genişleten yapay zekâ istiyoruz," dedi.
Daha fazlasını görün:
Uygulamayı indirin ve haberleri takip edin.
BİZİ TAKİP EDİN