チャットボットは、誤った情報が流れやすい健康に関するトピックではうまく機能しません

Drugs.com による医学的レビュー

HealthDay 経由

2026 年 4 月 17 日、金曜日 -- BMJ Open に 4 月 14 日にオンライン掲載された研究結果によると、誤った情報が流れやすい健康関連の質問に対するチャットボットのパフォーマンスは低い。

カリフォルニア州トーランスにあるハーバー UCLA メディカル センターのニコラス B. ティラー博士とその同僚は、誤った情報が流れやすい健康関連の質問に対するチャットボットの応答を監査した。 2025 年 2 月に、5 つのカテゴリ (がん、ワクチン、幹細胞、栄養、運動能力) からの 10 の質問が、Gemini (Google)、DeepSeek (High-Flyer)、Meta AI (Meta)、ChatGPT (OpenAI)、Grok (xAI) の 5 つの人気チャットボットでプロンプトとして使用され、2 人の専門家が回答を評価しました。

研究者らは、回答のほぼ半数 (49.6 パーセント) に問題があることを発見しました (30 パーセントはやや問題があり、19.6 パーセントは非常に問題がありました)。応答の質はチャットボット間で同様でしたが (P = 0.566)、Grok はランダムな分布 (Z スコア、+2.07) で予想されるよりも大幅に問題の多い応答を生成しました。ワクチン (平均 Z スコア、-2.57) とがん (-2.12) のパフォーマンスが最も高かったのに対し、幹細胞 (+1.25)、運動パフォーマンス (+3.74)、および栄養 (+4.35) のパフォーマンスは最も弱かったです。参考文献の品質は低く、完全性スコアの中央値は 40% でした。幻覚や捏造された引用のせいで、完全に正確な参考文献リストを作成したチャットボットはありませんでした。回答の読みやすさは、大学 2 年生から 4 年生レベルに相当する「難しい」と評価されました。

「デフォルトでは、チャットボットはリアルタイム データにアクセスせず、代わりにトレーニング データから統計的パターンを推測し、可能性の高い単語シーケンスを予測することで出力を生成します」と著者らは書いています。 「彼らは証拠を推論したり比較したりすることはなく、倫理的または価値観に基づいた判断を下すこともできません。この行動上の制限は、チャットボットが権威あるように聞こえても潜在的に欠陥のある応答を再現できることを意味します。」

要約/全文

免責事項: 医学論文の統計データは一般的な傾向を提供し、個人には関係ありません。個々の要因は大きく異なる可能性があります。個々の医療上の決定については、常に個別の医学的アドバイスを求めてください。

出典: HealthDay

続きを読む

免責事項

Drugslib.com によって提供される情報が正確であることを保証するためにあらゆる努力が払われています。 -日付、および完全ですが、その旨については保証されません。ここに含まれる医薬品情報は時間に敏感な場合があります。 Drugslib.com の情報は、米国の医療従事者および消費者による使用を目的として編集されているため、特に明記されていない限り、Drugslib.com は米国外での使用が適切であることを保証しません。 Drugslib.com の医薬品情報は、医薬品を推奨したり、患者を診断したり、治療法を推奨したりするものではありません。 Drugslib.com の医薬品情報は、認可を受けた医療従事者による患者のケアを支援すること、および/または医療の専門知識、スキル、知識、判断の代替ではなく補足としてこのサービスを閲覧している消費者にサービスを提供することを目的とした情報リソースです。

特定の薬物または薬物の組み合わせに対する警告がないことは、その薬物または薬物の組み合わせが特定の患者にとって安全、有効、または適切であることを示すものと決して解釈されるべきではありません。 Drugslib.com は、Drugslib.com が提供する情報を利用して管理される医療のいかなる側面についても責任を負いません。ここに含まれる情報は、考えられるすべての使用法、使用法、注意事項、警告、薬物相互作用、アレルギー反応、または副作用を網羅することを意図したものではありません。服用している薬について質問がある場合は、医師、看護師、または薬剤師に問い合わせてください。

人気のあるキーワード