OpenaiはヘルスベンチデータセットをリリースしてヘルスケアでAIをテストします

カルメン・ポープ、Bpharmによる医学的にレビュー。 2025年5月13日に最終更新。

2025年5月13日火曜日 - Openaiは、人工知能(AI)モデルがヘルスケアの質問にどれだけうまく回答するかをテストするために、大きなデータセットを発表しました。

専門家はそれを大きな前進と呼んでいますが、安全を確保するためにもっと作業が必要であると言います。

データセット(Healthbenchと呼ばれる)は、Openaiの最初の主要な独立したヘルスケアプロジェクトです。 5,000の「現実的な健康会話」が含まれており、それぞれにAIの応答を評価するための詳細なグレーディングツールを備えています。統計ニュースは報告しました。フランシスコに本拠を置く会社の健康AIチームは言いました。 AGIは、人工的な一般情報の略記です。

「その一部はテクノロジーの構築と展開です」とシンハルは言いました。 「そのもう1つの部分は、ヘルスケアのような肯定的なアプリケーションに繁栄する場所があり、これらの設定でモデルが安全で信頼できるように適切な作業を行うことを保証することです。」

データセットは、60か国で働いた262人の医師から支援を受けて作成されました。彼らは、AIモデルが健康に関する質問にどれだけうまく答えるかを判断するために、57,000以上のユニークな基準を提供しました。

Healthbenchは、共通の問題を修正することを目的としています。さまざまなAIモデルを公正に比較することを目指しています。 href = "https://www.medstarhealth.org/innovation-and-research/-medstar-health-research-institute/principal-investigators/raj-ratwani"> raj ratwani 、MedStar Healthの健康AI研究者。

Healthbenchの5,000の例は、医師によって設計された合成された会話を使用して作成されました。

「もちろん、現実的なデータを使用することのプライバシー制約とデータをリリースできることの利点のバランスをとりたいと思いました」とSinghalはStat Newsに語りました。

データセットには、AIモデルが苦労した1,000のハード例の特別なグループも含まれています。 Openaiは、このグループが「今後数か月間、モデルの改善にふさわしいターゲットを提供する」とStat Newsが報じた。 Stat Newsによると、OpenaiのO3モデルは、特にコミュニケーションの質で最高の得点を獲得しました。

しかし、モデルはコンテキストの認識や完全性などの分野でパフォーマンスが低いと専門家は言いました。

"生と死について議論しているヘルスケアのような繊細な文脈では、その不透明度のレベルは受け入れられません。

他の人は、AI自体が反応の一部を評価するために使用され、エラーが見過ごされている可能性があることに気付きました。

「モデルとグレーダーの両方で共有されるエラーを非表示にする可能性があります」 girish nadkarni 、stat in medicing in meant sinai in neming sinai in neming in neming in neming in neming at

さまざまな国やさまざまな人口統計でモデルがうまく機能するようにするためのさらなるレビューが求められました。

「HealthbenchはLLMヘルスケアの評価を改善しますが、安全性の請求をサポートする前にサブグループ分析とより広い人間のレビューが必要です」とNadkarniは言いました。傾向と個人に関係しません。個々の要因は大きく異なる場合があります。個々のヘルスケアの決定については、常にパーソナライズされた医学的アドバイスを求めてください。

出典:HealthDay

続きを読む

免責事項

Drugslib.com によって提供される情報が正確であることを保証するためにあらゆる努力が払われています。 -日付、および完全ですが、その旨については保証されません。ここに含まれる医薬品情報は時間に敏感な場合があります。 Drugslib.com の情報は、米国の医療従事者および消費者による使用を目的として編集されているため、特に明記されていない限り、Drugslib.com は米国外での使用が適切であることを保証しません。 Drugslib.com の医薬品情報は、医薬品を推奨したり、患者を診断したり、治療法を推奨したりするものではありません。 Drugslib.com の医薬品情報は、認可を受けた医療従事者による患者のケアを支援すること、および/または医療の専門知識、スキル、知識、判断の代替ではなく補足としてこのサービスを閲覧している消費者にサービスを提供することを目的とした情報リソースです。

特定の薬物または薬物の組み合わせに対する警告がないことは、その薬物または薬物の組み合わせが特定の患者にとって安全、有効、または適切であることを示すものと決して解釈されるべきではありません。 Drugslib.com は、Drugslib.com が提供する情報を利用して管理される医療のいかなる側面についても責任を負いません。ここに含まれる情報は、考えられるすべての使用法、使用法、注意事項、警告、薬物相互作用、アレルギー反応、または副作用を網羅することを意図したものではありません。服用している薬について質問がある場合は、医師、看護師、または薬剤師に問い合わせてください。

人気のあるキーワード