OpenAI veröffentlicht das HealthBench -Datensatz, um KI im Gesundheitswesen zu testen
HealthBench zielt darauf ab, ein gemeinsames Problem zu beheben: Vergleich verschiedener KI -Modelle. href = "https://www.medstarhealth.org/innovation-andresearch/medstar-health-research-institute/principal-investators/raj-ratwani"> raj ratwani , ein Gesundheits-AI-Forscher bei Medstar Health, sagte.
Die 5.000 Beispiele in HealthBench wurden unter Verwendung synthetisierter Gespräche durchgeführt, die von Ärzten entworfen wurden.
Der Datensatz enthält auch eine spezielle Gruppe von 1.000 harten Beispielen, bei denen KI -Modelle zu kämpfen haben. OpenAI hofft, dass diese Gruppe "in den kommenden Monaten ein würdiges Ziel für Modellverbesserungen liefert", berichtete Status News. Das O3 -Modell von OpenAI erzielte das Beste, insbesondere in der Kommunikationsqualität, berichtete Stat News.
Aber Modelle haben in Bereichen wie Kontextbewusstsein und Vollständigkeit schlecht abgebildet, sagten Experten.
"In sensiblen Kontexten wie Healthcare, in denen wir über Leben und Tod diskutieren, ist diese Grad der Opazität inakzeptabel", erklärte Hao.
Es kann "Fehler verbergen, die sowohl vom Modell als auch vom Grader geteilt werden", Girish Nadkarni , Kopf der künstlichen Intelligenz und der menschlichen Gesundheit, und die medizinische Gesundheit in der medizinischen Schule in der medizinischen Sinai in New York City, die in New York City, in New York City, sagte, in der medizinischen Schule in der medizinischen Schule in der medizinischen Sinai in New York City. forderte weitere Bewertungen, um sicherzustellen, dass Modelle in verschiedenen Ländern und zwischen verschiedenen demografischen Daten gut funktionieren.
„HealthBench verbessert die Bewertung der LLM-Gesundheitsversorgung, erfordert jedoch noch Untergruppenanalyse und breitere menschliche Überprüfung, bevor sie Sicherheitsansprüche unterstützen kann“, sagte Nadkarni. Bieten Sie allgemeine Trends an und beziehen sich nicht auf Einzelpersonen. Individuelle Faktoren können stark variieren. Suchen Sie immer personalisierte medizinische Beratung für individuelle Entscheidungen im Gesundheitswesen.
Quelle: HealthDay
Gesendet : 2025-05-14 06:00
Mehr lesen

- Harninkontinenz im Zusammenhang mit dem Risiko für Herzerkrankungen bei Frauen
- Dupixent (Dupilumab) in den USA als erste neue gezielte Therapie seit über einem Jahrzehnt für chronische spontane Urtikaria (CSU) zugelassen
- Mehr Kinder ohne Asthma -Inhalator nach dem Ausgang des Marktes aus dem Markt
- RSV-Impfstoffe, Nirsevimab, die an reduzierte RSV-verknüpfte Krankenhausaufenthalte gebunden sind
- Wenn Statine nicht genug sind, kann dieses Medikament dazu beitragen, den „schlechten“ Cholesterinspiegel zu senken
- RFK Jr., um Impfstofftestregeln zu ändern
Haftungsausschluss
Es wurden alle Anstrengungen unternommen, um sicherzustellen, dass die von Drugslib.com bereitgestellten Informationen korrekt und aktuell sind aktuell und vollständig, eine Garantie hierfür kann jedoch nicht übernommen werden. Die hierin enthaltenen Arzneimittelinformationen können zeitkritisch sein. Die Informationen von Drugslib.com wurden für die Verwendung durch medizinisches Fachpersonal und Verbraucher in den Vereinigten Staaten zusammengestellt. Daher übernimmt Drugslib.com keine Gewähr dafür, dass eine Verwendung außerhalb der Vereinigten Staaten angemessen ist, sofern nicht ausdrücklich anders angegeben. Die Arzneimittelinformationen von Drugslib.com befürworten keine Arzneimittel, diagnostizieren keine Patienten und empfehlen keine Therapie. Die Arzneimittelinformationen von Drugslib.com sind eine Informationsquelle, die zugelassenen Ärzten bei der Betreuung ihrer Patienten helfen soll und/oder Verbrauchern dienen soll, die diesen Service als Ergänzung und nicht als Ersatz für die Fachkenntnisse, Fähigkeiten, Kenntnisse und Urteilsvermögen im Gesundheitswesen betrachten Praktiker.
Das Fehlen einer Warnung für ein bestimmtes Medikament oder eine bestimmte Medikamentenkombination sollte keinesfalls als Hinweis darauf ausgelegt werden, dass das Medikament oder die Medikamentenkombination für einen bestimmten Patienten sicher, wirksam oder geeignet ist. Drugslib.com übernimmt keinerlei Verantwortung für irgendeinen Aspekt der Gesundheitsversorgung, die mithilfe der von Drugslib.com bereitgestellten Informationen durchgeführt wird. Die hierin enthaltenen Informationen sollen nicht alle möglichen Verwendungen, Anweisungen, Vorsichtsmaßnahmen, Warnungen, Arzneimittelwechselwirkungen, allergischen Reaktionen oder Nebenwirkungen abdecken. Wenn Sie Fragen zu den Medikamenten haben, die Sie einnehmen, wenden Sie sich an Ihren Arzt, das medizinische Fachpersonal oder Ihren Apotheker.
Beliebte Schlüsselwörter
- metformin obat apa
- alahan panjang
- glimepiride obat apa
- takikardia adalah
- erau ernie
- pradiabetes
- besar88
- atrofi adalah
- kutu anjing
- trakeostomi
- mayzent pi
- enbrel auto injector not working
- enbrel interactions
- lenvima life expectancy
- leqvio pi
- what is lenvima
- lenvima pi
- empagliflozin-linagliptin
- encourage foundation for enbrel
- qulipta drug interactions