Chatbotlar Yanlış Bilgilendirmeye Açık Sağlık Konularında İyi Performans Göstermiyor

Drugs.com tarafından tıbbi olarak incelendi

HealthDay aracılığıyla

17 Nisan 2026 CUMA -- BMJ Open'da 14 Nisan'da çevrimiçi yayınlanan bir araştırmaya göre, sohbet robotları yanlış bilgiye eğilimli sağlık konularıyla ilgili soruları yanıtlarken düşük performans gösteriyor.

Kaliforniya, Torrance'daki Harbor-UCLA Tıp Merkezi'nden Ph.D. Nicholas B. Tiller ve meslektaşları, yanlış bilgiye yatkın sağlıkla ilgili sorulara yönelik sohbet robotlarının yanıtlarını denetledi. Beş popüler sohbet robotunda (kanser, aşılar, kök hücreler, beslenme ve atletik performans) beş kategoriden on soru soru olarak kullanıldı: Gemini (Google), DeepSeek (High-Flyer), Meta AI (Meta), ChatGPT (OpenAI) ve Grok (xAI) Şubat 2025'te iki uzman yanıtları derecelendirdi.

Araştırmacılar yanıtların neredeyse yarısının (yüzde 49,6) sorunlu olduğunu buldu (yüzde 30'u biraz sorunlu ve yüzde 19,6'sı oldukça sorunlu). Yanıtların kalitesi sohbet robotları arasında benzerdi (P = 0,566), ancak Grok, rastgele bir dağılım altında (z-puanı, +2,07) beklenenden önemli ölçüde daha sorunlu yanıtlar üretti. Aşılarda (ortalama z-skoru, -2,57) ve kanserde (-2,12) performans en güçlüyken, kök hücrelerde (+1,25), atletik performansta (+3,74) ve beslenmede (+4,35) en zayıf performans görüldü. Referansların kalitesi zayıftı ve ortalama tamamlama puanı yüzde 40'tı. Halüsinasyonlar ve uydurma alıntılar nedeniyle hiçbir chatbot tam olarak doğru bir referans listesi üretemedi. Yanıtların okunabilirliği "zor" olarak derecelendirildi, bu da üniversite ikinci ve son sınıf seviyesine eşdeğerdir.

Yazarlar, "Varsayılan olarak, sohbet robotları gerçek zamanlı verilere erişmez, bunun yerine eğitim verilerinden istatistiksel modeller çıkararak ve olası kelime dizilerini tahmin ederek çıktılar üretir" diye yazıyor. "Mantık yürütemiyorlar, delilleri tartamıyorlar ve etik veya değere dayalı yargılarda bulunamıyorlar. Bu davranış sınırlaması, sohbet robotlarının otoriter görünen ancak potansiyel olarak kusurlu yanıtlar üretebileceği anlamına geliyor."

Özet/Tam Metin

Yasal Uyarı: Tıbbi makalelerdeki istatistiksel veriler genel eğilimleri sağlar ve bireylere ait değildir. Bireysel faktörler büyük ölçüde değişebilir. Bireysel sağlık hizmeti kararları için daima kişiselleştirilmiş tıbbi tavsiye alın.

Kaynak: HealthDay

Devamını oku

Sorumluluk reddi beyanı

Drugslib.com tarafından sağlanan bilgilerin doğru ve güncel olmasını sağlamak için her türlü çaba gösterilmiştir. -tarihli ve eksiksizdir ancak bu konuda hiçbir garanti verilmemektedir. Burada yer alan ilaç bilgileri zamana duyarlı olabilir. Drugslib.com bilgileri Amerika Birleşik Devletleri'ndeki sağlık uygulayıcıları ve tüketiciler tarafından kullanılmak üzere derlenmiştir ve bu nedenle Drugslib.com, aksi özellikle belirtilmediği sürece Amerika Birleşik Devletleri dışındaki kullanımların uygun olduğunu garanti etmez. Drugslib.com'un ilaç bilgileri ilaçları onaylamaz, hastalara teşhis koymaz veya tedavi önermez. Drugslib.com'un ilaç bilgileri, lisanslı sağlık uygulayıcılarına hastalarıyla ilgilenme konusunda yardımcı olmak ve/veya bu hizmeti görüntüleyen tüketicilere sağlık hizmetinin uzmanlığı, becerisi, bilgisi ve muhakemesi yerine değil, tamamlayıcı olarak hizmet etmek için tasarlanmış bir bilgi kaynağıdır. uygulayıcılar.

Belirli bir ilaç veya ilaç kombinasyonu için bir uyarının bulunmaması, hiçbir şekilde ilacın veya ilaç kombinasyonunun herhangi bir hasta için güvenli, etkili veya uygun olduğu şeklinde yorumlanmamalıdır. Drugslib.com, Drugslib.com'un sağladığı bilgilerin yardımıyla uygulanan sağlık hizmetlerinin herhangi bir yönüne ilişkin herhangi bir sorumluluk kabul etmez. Burada yer alan bilgilerin olası tüm kullanımları, talimatları, önlemleri, uyarıları, ilaç etkileşimlerini, alerjik reaksiyonları veya olumsuz etkileri kapsaması amaçlanmamıştır. Aldığınız ilaçlarla ilgili sorularınız varsa doktorunuza, hemşirenize veya eczacınıza danışın.

Popüler Anahtar Kelimeler