OpenAI випускає набір даних HealthBench для тестування ШІ в охороні здоров'я

Медикально розглянуто Кармен Поп, Бфарм. Останнє оновлення 13 травня 2025 р.

від I. Edwards Healthday Reporter

Вівторок, 13 травня 2025 року - OpenAI представив великий набір даних, щоб допомогти перевірити, наскільки добре моделі штучного інтелекту (AI) відповідають на питання охорони здоров'я.

Експерти називають це головним кроком вперед, але вони також кажуть, що для забезпечення безпеки потрібно більше роботи.

Набір даних - називається HealthBench - є першим великим незалежним проектом охорони здоров'я OpenAI. Він включає 5000 "реалістичних розмов про здоров'я", кожен з яких має детальні інструменти класифікації для оцінки відповідей AI, повідомляє Stat News.

"Наша місія як OpenAI - забезпечити користь AGI для людства"

"Одна частина цього - це будівництво та розгортання технологій", - сказав Сінгал. "Ще одна його частина - це забезпечення того, щоб позитивні програми, такі як охорона здоров'я, мали місце для процвітання, і що ми виконуємо правильну роботу, щоб забезпечити безпечне та надійне моделі в цих умовах".

набір даних був створений за допомогою 262 лікарів, які працювали в 60 країнах. Вони надали понад 57 000 унікальних критеріїв, щоб судити про те, наскільки добре моделі AI відповідають на питання охорони здоров'я.

HealthBench має на меті вирішити загальну проблему: порівняння різних моделей AI справедливо.

"Що зробило OpenAi, це те, що вони забезпечили це масштабованим способом від справді великої, авторитетної марки, яка дозволяє людям використовувати це дуже легко", raj Ratwani , дослідник AI Health AI в Medstar Health, сказав.

5000 прикладів HealthBench були проведені за допомогою синтезованих розмов, розроблених лікарями.

"Ми хотіли збалансувати переваги від можливості оприлюднити дані, звичайно, обмеженням конфіденційності використання реалістичних даних", - сказав Сінгал Новини.

Доданий набір також включає спеціальну групу з 1000 важких прикладів, де боролися моделі AI. OpenAi сподівається, що ця група "забезпечує гідну ціль для вдосконалення моделі протягом наступних місяців", повідомляє Stat News.

OpenAi також перевірив власні моделі, а також моделі з Google, Meta, Antropic та XAI. Модель O3 Opai відбулася найкращим чином, особливо за якістю комунікації, повідомляє Stat News.

"У чутливих контекстах, таких як охорона здоров'я, де ми обговорюємо життя та смерть, цей рівень непрозорості неприйнятний", - пояснив Хао.

інші зазначили, що сам AI використовувався для оцінки деяких відповідей, що може призвести до того, що помилки не помічаються.

це "може приховувати помилки, що діляться як моделлю, так і грейдатором", > Girish Nadkarni , керівником штучної розвідки та He Health at Icahn School of Medical у Sinai в Нью-Йорку, і Plos> P> P> PTOMENTION

"HealthBench покращує оцінку охорони здоров'я LLM, але все ще потрібен аналіз підгруп підгрупи та ширший огляд людини, перш ніж він може підтримувати претензії на безпеку",-сказав Надкарні. Загальні тенденції і не стосуються людей. Окремі фактори можуть сильно відрізнятися. Завжди шукайте персоналізованих медичних консультацій для індивідуальних рішень щодо охорони здоров'я.

Джерело: Healthday

Опубліковано : 2025-05-14 06:00

Читати далі

Відмова від відповідальності

Було докладено всіх зусиль, щоб інформація, надана Drugslib.com, була точною, до -дата та повна, але жодних гарантій щодо цього не надається. Інформація про ліки, що міститься тут, може бути чутливою до часу. Інформація Drugslib.com була зібрана для використання медичними працівниками та споживачами в Сполучених Штатах, тому Drugslib.com не гарантує, що використання за межами Сполучених Штатів є доцільним, якщо спеціально не вказано інше. Інформація про ліки Drugslib.com не схвалює ліки, не ставить діагноз пацієнтів і не рекомендує терапію. Інформація про ліки на Drugslib.com – це інформаційний ресурс, призначений для допомоги ліцензованим медичним працівникам у догляді за їхніми пацієнтами та/або для обслуговування споживачів, які розглядають цю послугу як доповнення, а не заміну досвіду, навичок, знань і суджень у сфері охорони здоров’я. практиків.

Відсутність попередження щодо певного препарату чи комбінації ліків у жодному разі не слід тлумачити як вказівку на те, що препарат чи комбінація препаратів є безпечними, ефективними чи прийнятними для будь-якого конкретного пацієнта. Drugslib.com не несе жодної відповідальності за будь-які аспекти медичної допомоги, що надається за допомогою інформації, яку надає Drugslib.com. Інформація, що міститься в цьому документі, не має на меті охопити всі можливі способи використання, інструкції, запобіжні заходи, попередження, лікарські взаємодії, алергічні реакції чи побічні ефекти. Якщо у вас є запитання щодо препаратів, які ви приймаєте, зверніться до свого лікаря, медсестри або фармацевта.

OpenAI випускає набір даних HealthBench для тестування ШІ в охороні здоров'я

Читати далі

Відмова від відповідальності

Популярні ключові слова