Chatbots ทำงานได้ไม่ดีนักสำหรับหัวข้อสุขภาพที่มีแนวโน้มให้ข้อมูลผิด ๆ

ตรวจสอบทางการแพทย์โดย Drugs.com

ผ่าน HealthDay

วันศุกร์ที่ 17 เมษายน 2026 -- แชทบอททำงานได้ไม่ดีเมื่อตอบคำถามเกี่ยวกับหัวข้อด้านสุขภาพที่มีแนวโน้มให้ข้อมูลที่ไม่ถูกต้อง ตามการศึกษาที่เผยแพร่ออนไลน์เมื่อวันที่ 14 เมษายนใน BMJ Open

Nicholas B. Tiller, Ph.D. จาก Harbor-UCLA Medical Center ในเมืองทอร์รันซ์ แคลิฟอร์เนีย และเพื่อนร่วมงานได้ตรวจสอบคำตอบของแชทบอทสำหรับคำถามด้านสุขภาพที่มีแนวโน้มที่จะให้ข้อมูลที่ไม่ถูกต้อง คำถาม 10 ข้อจาก 5 หมวดหมู่ (มะเร็ง วัคซีน เซลล์ต้นกำเนิด โภชนาการ และสมรรถภาพทางกีฬา) ถูกใช้เป็นข้อความแจ้งในแชทบ็อตยอดนิยม 5 รายการ ได้แก่ Gemini (Google), DeepSeek (High-Flyer), Meta AI (Meta), ChatGPT (OpenAI) และ Grok (xAI) ในเดือนกุมภาพันธ์ 2025 โดยมีผู้เชี่ยวชาญ 2 คนให้คะแนนคำตอบ

นักวิจัยพบว่าเกือบครึ่งหนึ่ง (49.6 เปอร์เซ็นต์) ของคำตอบนั้นมีปัญหา (30 เปอร์เซ็นต์ค่อนข้างมีปัญหา และ 19.6 เปอร์เซ็นต์มีปัญหาสูง) คุณภาพของการตอบสนองมีความคล้ายคลึงกันในแชทบอท (P = 0.566) แม้ว่า Grok จะสร้างการตอบสนองที่มีปัญหาอย่างมากมากกว่าที่คาดไว้ภายใต้การแจกแจงแบบสุ่ม (z-score, +2.07) สำหรับวัคซีน (คะแนนเฉลี่ย z-2.57) และมะเร็ง (-2.12) ประสิทธิภาพการทำงานจะแข็งแกร่งที่สุด ในขณะที่ประสิทธิภาพอ่อนแอที่สุดในเซลล์ต้นกำเนิด (+1.25) ประสิทธิภาพด้านกีฬา (+3.74) และโภชนาการ (+4.35) คุณภาพของข้อมูลอ้างอิงไม่ดี โดยมีคะแนนเฉลี่ยความสมบูรณ์อยู่ที่ 40 เปอร์เซ็นต์ ไม่มีแชทบอตใดที่สร้างรายการอ้างอิงที่แม่นยำอย่างสมบูรณ์เนื่องจากภาพหลอนและการอ้างอิงที่แต่งขึ้น ความสามารถในการอ่านคำตอบได้รับการจัดระดับว่า "ยาก" เทียบเท่ากับนักเรียนชั้นปีที่สอง-อาวุโสของวิทยาลัย

"โดยค่าเริ่มต้น แชทบอทจะไม่เข้าถึงข้อมูลแบบเรียลไทม์ แต่จะสร้างผลลัพธ์โดยการอนุมานรูปแบบทางสถิติจากข้อมูลการฝึกอบรมและคาดการณ์ลำดับคำที่น่าจะเป็นไปได้" ผู้เขียนเขียน "พวกเขาไม่ให้เหตุผลหรือชั่งน้ำหนักหลักฐาน และไม่สามารถตัดสินตามหลักจริยธรรมหรือตามคุณค่าได้ ข้อจำกัดด้านพฤติกรรมนี้หมายความว่าแชทบอทสามารถสร้างการตอบสนองที่ฟังดูน่าเชื่อถือ แต่อาจมีข้อบกพร่อง"

Abstract/Full Text

ข้อจำกัดความรับผิดชอบ: ข้อมูลทางสถิติในบทความทางการแพทย์ให้แนวโน้มทั่วไปและไม่เกี่ยวข้องกับ บุคคล ปัจจัยส่วนบุคคลอาจแตกต่างกันอย่างมาก ขอคำแนะนำทางการแพทย์เฉพาะบุคคลเสมอเพื่อการตัดสินใจด้านการดูแลสุขภาพส่วนบุคคล

ที่มา: HealthDay

อ่านเพิ่มเติม

ข้อจำกัดความรับผิดชอบ

มีความพยายามทุกวิถีทางเพื่อให้แน่ใจว่าข้อมูลที่ให้โดย Drugslib.com นั้นถูกต้อง ทันสมัย -วันที่และเสร็จสมบูรณ์ แต่ไม่มีการรับประกันใดๆ เกี่ยวกับผลกระทบดังกล่าว ข้อมูลยาเสพติดที่มีอยู่นี้อาจจะเป็นเวลาที่สำคัญ. ข้อมูล Drugslib.com ได้รับการรวบรวมเพื่อใช้โดยผู้ประกอบวิชาชีพด้านการดูแลสุขภาพและผู้บริโภคในสหรัฐอเมริกา ดังนั้น Drugslib.com จึงไม่รับประกันว่าการใช้นอกสหรัฐอเมริกามีความเหมาะสม เว้นแต่จะระบุไว้เป็นอย่างอื่นโดยเฉพาะ ข้อมูลยาของ Drugslib.com ไม่ได้สนับสนุนยา วินิจฉัยผู้ป่วย หรือแนะนำการบำบัด ข้อมูลยาของ Drugslib.com เป็นแหล่งข้อมูลที่ได้รับการออกแบบมาเพื่อช่วยเหลือผู้ปฏิบัติงานด้านการดูแลสุขภาพที่ได้รับใบอนุญาตในการดูแลผู้ป่วยของตน และ/หรือเพื่อให้บริการลูกค้าที่ดูบริการนี้เป็นส่วนเสริมและไม่ใช่สิ่งทดแทนความเชี่ยวชาญ ทักษะ ความรู้ และการตัดสินด้านการดูแลสุขภาพ ผู้ปฏิบัติงาน

การไม่มีคำเตือนสำหรับยาหรือยาผสมใด ๆ ไม่ควรตีความเพื่อบ่งชี้ว่ายาหรือยาผสมนั้นปลอดภัย มีประสิทธิผล หรือเหมาะสมสำหรับผู้ป่วยรายใดรายหนึ่ง Drugslib.com ไม่รับผิดชอบต่อแง่มุมใดๆ ของการดูแลสุขภาพที่ดำเนินการโดยได้รับความช่วยเหลือจากข้อมูลที่ Drugslib.com มอบให้ ข้อมูลในที่นี้ไม่ได้มีวัตถุประสงค์เพื่อให้ครอบคลุมถึงการใช้ คำแนะนำ ข้อควรระวัง คำเตือน ปฏิกิริยาระหว่างยา ปฏิกิริยาการแพ้ หรือผลข้างเคียงที่เป็นไปได้ทั้งหมด หากคุณมีคำถามเกี่ยวกับยาที่คุณกำลังใช้ โปรดตรวจสอบกับแพทย์ พยาบาล หรือเภสัชกรของคุณ

คำหลักยอดนิยม