OpenAi는 HealthBench 데이터 세트를 출시하여 건강 관리에서 AI를 테스트합니다.

Carmen Pope, Bpharm에 의해 의학적으로 검토되었습니다. 2025 년 5 월 13 일에 마지막 업데이트.

2025 년 5 월 13 일 화요일 - OpenAi는 대규모 데이터 세트를 공개하여 인공 지능 (AI) 모델이 건강 관리 문제에 얼마나 잘 대답하는지 테스트하는 데 도움이되었습니다.

전문가들은 그것을 주요 진전이라고 부르지 만 안전을 보장하기 위해 더 많은 작업이 필요하다고 말합니다.

HealthBench라고하는 데이터 세트는 OpenAI의 첫 번째 주요 독립 건강 관리 프로젝트입니다. STAT News는 AI 응답을 평가하기위한 세부적인 등급 도구가있는 5,000 개의“현실적인 건강 대화”가 포함되어 있습니다.

“Openai로서의 우리의 임무는 Agi로서의 우리의 임무”, Karan Singhal <, https://www.linkedin.com/in/karan1149 "> Sanhal <, https://www.linkedin.com/in/karan1149"입니다. 프란시스코에 본사를 둔 회사의 Health AI 팀은 말했다. AGI는 인공 일반 정보를위한 속기입니다.

“그 중 일부는 기술을 구축하고 배치하는 것”이라고 Singhal은 말했다. "그것의 또 다른 부분은 건강 관리와 같은 긍정적 인 응용 프로그램이 번성 할 수있는 곳을 갖도록하는 것입니다. 우리는 이러한 환경에서 모델이 안전하고 신뢰할 수 있도록 올바른 작업을 수행하는 것입니다."

데이터 세트는 60 개국에서 일한 262 명의 의사의 도움으로 만들어졌습니다. 그들은 AI 모델이 건강 문제에 얼마나 잘 대답하는지 판단하기 위해 57,000 개 이상의 고유 한 기준을 제공했습니다.

Healthbench는 일반적인 문제를 해결하는 것을 목표로합니다. 다양한 AI 모델을 공정하게 비교합니다.

“Openai는 사람들 이이 문제를 매우 쉽게 사용할 수있게하는 크고 평판이 좋은 브랜드에서 확장 가능한 방식으로 이것을 제공 한 것입니다. href = "https://www.medstarhealth.org/innovation-and-research/medstar-health-research-institute/principal-investigators/raj-ratwani"> raj ratwani , Medstar Health의 건강 연구원이 말했다.

Healthbench의 5,000 가지 사례는 의사가 설계 한 합성 대화를 사용하여 만들어졌습니다.

“물론 사실적인 데이터 사용의 개인 정보 제약 제약과 함께 데이터를 발표 할 수있는 이점의 균형을 맞추고 싶었습니다.”Singhal은 Stat News에 말했습니다.

데이터 세트에는 AI 모델이 어려움을 겪는 1,000 개의 하드 예제의 특수 그룹도 포함되어 있습니다. Openai는이 그룹이“앞으로 몇 달 동안 모델 개선을위한 가치있는 목표를 제공하기를 희망한다”고 STAT News는 보도했다. Stat News는 OpenAi의 O3 모델이 특히 커뮤니케이션 품질에서 최고를 기록했다고 보도했다.

그러나 상황 인식과 완전성과 같은 분야에서 모델이 제대로 수행되지 않았다고 전문가들은 말했다.

"우리가 삶과 죽음을 논의하는 의료와 같은 민감한 맥락에서, 불투명도 수준은 용납 할 수 없다"고 Hao는 설명했다.

다른 사람들은 AI 자체가 일부 응답을 등급을 매기는 데 사용되었으며, 이로 인해 오류가 간과 될 수 있다고 언급했다.

"모델과 그레이더 모두가 공유하는 오류를 숨길 수 있습니다." 다른 국가와 다른 인구 통계에서 모델이 잘 작동하는지 확인하기위한 더 많은 리뷰.

“Healthbench는 LLM 의료 평가를 향상 시키지만 안전 주장을 지원하기 전에 서브 그룹 분석과 더 넓은 인간 검토가 필요하다”고 Nadkarni는 말했다. 일반적인 추세를 제공하고 개인과 관련이 없습니다. 개별 요인은 크게 다를 수 있습니다. 항상 개별 의료 결정에 대한 개인화 된 의료 조언을 구하십시오.

출처 : Healthday

게시됨 : 2025-05-14 06:00

더 읽어보세요

면책조항

Drugslib.com에서 제공하는 정보의 정확성을 보장하기 위해 모든 노력을 기울였습니다. -날짜, 완전하지만 해당 효과에 대한 보장은 없습니다. 여기에 포함된 약물 정보는 시간에 민감할 수 있습니다. Drugslib.com 정보는 미국의 의료 종사자와 소비자가 사용하도록 편집되었으므로 달리 구체적으로 명시하지 않는 한 Drugslib.com은 미국 이외의 지역에서 사용하는 것이 적절하다고 보증하지 않습니다. Drugslib.com의 약물 정보는 약물을 보증하거나 환자를 진단하거나 치료법을 권장하지 않습니다. Drugslib.com의 약물 정보는 면허를 소지한 의료 종사자가 환자를 돌보는 데 도움을 주고/하거나 이 서비스를 건강 관리에 대한 전문 지식, 기술, 지식 및 판단을 대체하는 것이 아니라 보완으로 보는 소비자에게 제공하기 위해 설계된 정보 리소스입니다. 실무자.

특정 약물 또는 약물 조합에 대한 경고가 없다고 해서 해당 약물 또는 약물 조합이 해당 환자에게 안전하고 효과적이거나 적절하다는 의미로 해석되어서는 안 됩니다. Drugslib.com은 Drugslib.com이 제공하는 정보의 도움으로 관리되는 의료의 모든 측면에 대해 어떠한 책임도 지지 않습니다. 여기에 포함된 정보는 가능한 모든 용도, 지시 사항, 주의 사항, 경고, 약물 상호 작용, 알레르기 반응 또는 부작용을 다루기 위한 것이 아닙니다. 복용 중인 약에 대해 궁금한 점이 있으면 담당 의사, 간호사 또는 약사에게 문의하세요.

OpenAi는 HealthBench 데이터 세트를 출시하여 건강 관리에서 AI를 테스트합니다.

더 읽어보세요

면책조항

인기있는 키워드