OpenAI vydává datový soubor HealthBench pro testování AI ve zdravotnictví
lékařsky přezkoumán Carmen Pope, Bpharm. Naposledy aktualizováno 13. května 2025.
od I. Edwards Healthday Reporter
Úterý 13. května 2025 - OpenAI představil velký datový soubor, který pomůže otestovat, jak dobře modely umělé inteligence (AI) odpovídají na otázky týkající se zdravotní péče.
odborníci to nazývají hlavním krokem vpřed, ale také říkají, že k zajištění bezpečnosti je zapotřebí více práce.
Datový soubor - zvaný HealthBench - je prvním hlavním nezávislým projektem zdravotní péče OpenAI. Zahrnuje 5 000 „realistických zdravotních konverzací“, z nichž každý má podrobné nástroje pro hodnocení hodnocení odpovědí AI, uvádí zprávy Stat News. Řekl tým zdravotnických AI se sídlem v Franciscu. AGI je zkratka pro umělou obecnou inteligenci.
„Jednou z nich je budování a nasazení technologie,“ řekl Singhal. „Další částí toho je zajištění toho, aby pozitivní aplikace, jako je zdravotní péče, mělo místo, kde se dá vzkvétat, a že děláme správnou práci, abychom zajistili, že modely jsou v těchto prostředích bezpečné a spolehlivé.“
Datový soubor byl vytvořen s pomocí 262 lékařů, kteří pracovali v 60 zemích. Poskytli více než 57 000 jedinečných kritérií pro posouzení, jak dobře modely AI odpovídají na zdravotní otázky.
HealthBench si klade za cíl vyřešit společný problém: spravedlivé srovnání různých modelů AI. href = "https://www.medstarhealth.org/inovation-and-research/medstar-health-research-institute/principal-investigators/raj-ratwani"> Raj Ratwani , zdravotnický výzkumník v Medstar Health, řekl.
5 000 příkladů ve HealthBenchu bylo provedeno pomocí syntetizovaných konverzací navržených lékaři.
Datový soubor také zahrnuje speciální skupinu 1 000 tvrdých příkladů, kde modely AI bojovaly. OpenAI doufá, že tato skupina „poskytuje hodný cíl pro vylepšení modelu pro nadcházející měsíce,“ uvedl Stat News. Openi's O3 Model skóroval to nejlepší, zejména v kvalitě komunikace, informoval Stat News.
Ale modely se chovaly špatně v oblastech, jako je povědomí o kontextu a úplnost, uvedli odborníci.
"V citlivých kontextech, jako je Healthcare, kde diskutujeme o životě a smrti, je tato úroveň neprůhlednosti nepřijatelná," vysvětlil Hao.
„Může skrýt chyby sdílené jak modelem, tak srovnávačem“, girish nadkarni , hlava umělé inteligence a lidské zdraví, které byly v New Yorku v New Yorku v New Yorku. požadoval další recenze, aby se zajistilo, že modely fungují dobře v různých zemích a mezi různými demografii.
„HealthBench zlepšuje hodnocení zdravotní péče LLM, ale stále potřebuje analýzu podskupin a širší lidskou přezkum, než může podpořit bezpečnostní nároky,“ řekl Nadkarni. Obecné trendy a netýkají se jednotlivců. Jednotlivé faktory se mohou velmi lišit. Vždy hledejte personalizovanou lékařskou pomoc pro individuální rozhodnutí o zdravotní péči.
Zdroj: Healthday
Vyslán : 2025-05-14 06:00
Přečtěte si více

- Federální státní zástupce zpochybňuje lékařské časopisy nad údajnou zkreslení
- Pilulka na antikoncepci zvyšuje riziko útoků astmatu u mladých žen
- Co byste měli vědět o ALS, také známý jako Lou Gehrigova nemoc
- Některé rakoviny rostoucí u lidí do 50 let, ukazuje nová zpráva
- Trump Administration snižuje financování pro život zachraňující dětské srdce
- Ořechy, semena v pořádku pro lidi s divertikulitidou, říká studie
Odmítnutí odpovědnosti
Vynaložili jsme veškeré úsilí, abychom zajistili, že informace poskytované na webu Drugslib.com jsou přesné a aktuální -datum a úplné, ale v tomto smyslu není poskytována žádná záruka. Informace o léčivech zde uvedené mohou být časově citlivé. Informace Drugslib.com byly sestaveny pro použití zdravotnickými lékaři a spotřebiteli ve Spojených státech, a proto Drugslib.com nezaručuje, že použití mimo Spojené státy jsou vhodné, pokud není výslovně uvedeno jinak. Informace o drogách na webu Drugslib.com nepodporují léky, nediagnostikují pacienty ani nedoporučují terapii. Informace o lécích na webu Drugslib.com jsou informačním zdrojem, který má pomáhat licencovaným lékařům v péči o jejich pacienty a/nebo sloužit spotřebitelům, kteří tuto službu vnímají jako doplněk, a nikoli náhradu za odborné znalosti, dovednosti, znalosti a úsudek zdravotní péče. praktikující.
Neexistence varování pro daný lék nebo lékovou kombinaci by v žádném případě neměla být vykládána tak, že naznačuje, že lék nebo léková kombinace je pro daného pacienta bezpečná, účinná nebo vhodná. Drugslib.com nepřebírá žádnou odpovědnost za jakýkoli aspekt zdravotní péče poskytované s pomocí informací, které poskytuje Drugslib.com. Informace obsažené v tomto dokumentu nejsou určeny k pokrytí všech možných použití, pokynů, opatření, varování, lékových interakcí, alergických reakcí nebo nežádoucích účinků. Máte-li otázky týkající se léků, které užíváte, zeptejte se svého lékaře, zdravotní sestry nebo lékárníka.
Populární klíčová slova
- metformin obat apa
- alahan panjang
- glimepiride obat apa
- takikardia adalah
- erau ernie
- pradiabetes
- besar88
- atrofi adalah
- kutu anjing
- trakeostomi
- mayzent pi
- enbrel auto injector not working
- enbrel interactions
- lenvima life expectancy
- leqvio pi
- what is lenvima
- lenvima pi
- empagliflozin-linagliptin
- encourage foundation for enbrel
- qulipta drug interactions