Openai phát hành bộ dữ liệu HealthBench để kiểm tra AI trong chăm sóc sức khỏe
Thứ ba, ngày 13 tháng 5 năm 2025 - Openai đã tiết lộ một bộ dữ liệu lớn để giúp kiểm tra các mô hình Trí tuệ nhân tạo (AI) trả lời các câu hỏi chăm sóc sức khỏe tốt như thế nào.
Các chuyên gia gọi nó là một bước tiến lớn, nhưng họ cũng nói rằng cần nhiều công việc hơn để đảm bảo an toàn.
Bộ dữ liệu - được gọi là HealthBench - là dự án chăm sóc sức khỏe độc lập lớn đầu tiên của Openai. Nó bao gồm 5.000 cuộc trò chuyện về sức khỏe thực tế của người Viking, mỗi người có các công cụ chấm điểm chi tiết để đánh giá các phản hồi của AI, Stat News đưa tin. Nhóm AI sức khỏe của công ty có trụ sở tại Francisco, cho biết. AGI là tốc ký cho trí thông minh chung nhân tạo.
Một phần trong số đó là xây dựng và triển khai công nghệ, "Singhal nói. "Một phần khác của nó là đảm bảo rằng các ứng dụng tích cực như chăm sóc sức khỏe có một nơi để phát triển và chúng tôi làm đúng công việc để đảm bảo rằng các mô hình an toàn và đáng tin cậy trong các cài đặt này. Họ đã cung cấp hơn 57.000 tiêu chí độc đáo để đánh giá các mô hình AI trả lời các câu hỏi sức khỏe tốt như thế nào.
HealthBench nhằm mục đích khắc phục một vấn đề phổ biến: So sánh các mô hình AI khác nhau một cách công bằng. href = "https://www.medstarhealth.org/innovation-and-resechan
5.000 ví dụ trong HealthBench đã được thực hiện bằng cách sử dụng các cuộc hội thoại tổng hợp được thiết kế bởi các bác sĩ.
Bộ dữ liệu cũng bao gồm một nhóm đặc biệt gồm 1.000 ví dụ khó khăn trong đó các mô hình AI đấu tranh. Openai hy vọng nhóm này cung cấp một mục tiêu xứng đáng cho các cải tiến mô hình trong nhiều tháng tới ", Stat News đưa tin. Mô hình OpenaiTHER O3 đã đạt điểm tốt nhất, đặc biệt là về chất lượng truyền thông, Stat News đưa tin.
Nhưng các mô hình thực hiện kém trong các lĩnh vực như nhận thức và tính đầy đủ của bối cảnh, các chuyên gia cho biết.
"Trong các bối cảnh nhạy cảm như chăm sóc sức khỏe, nơi chúng ta đang thảo luận về sự sống và cái chết, mức độ mờ đục đó là không thể chấp nhận được", Hao giải thích.
Nó có thể ẩn các lỗi được chia sẻ bởi cả mô hình và học sinh lớp Để biết thêm đánh giá để đảm bảo các mô hình hoạt động tốt ở các quốc gia khác nhau và trong số các nhân khẩu học khác nhau.
Sức khỏe của Sức khỏe cải thiện đánh giá chăm sóc sức khỏe của LLM nhưng vẫn cần phân tích phân nhóm và đánh giá rộng hơn của con người trước khi có thể hỗ trợ các khiếu nại an toàn, ông Nad Nadarni nói. Xu hướng chung và không liên quan đến các cá nhân. Các yếu tố cá nhân có thể thay đổi rất nhiều. Luôn tìm kiếm lời khuyên y tế được cá nhân hóa cho các quyết định chăm sóc sức khỏe cá nhân.
Nguồn: Healthday
Đã đăng : 2025-05-14 06:00
Đọc thêm

- Gần một nửa người Mỹ hít thở không khí không lành mạnh, báo cáo mới cho thấy
- Aldeorra Therapeutics đạt được điểm cuối chính trong giai đoạn 3 Thử nghiệm buồng bệnh khô mắt của reproxalap và kế hoạch gửi lại NDA
- Concussion trẻ em: Những gì cần biết nếu con bạn giáng một đòn mạnh vào đầu
- Các vấn đề về sức khỏe mang thai làm tăng huyết áp của trẻ em
- Túi nicotine sử dụng nhân đôi trong số các học sinh trung học Hoa Kỳ
- Hơn 1,8 triệu nồi áp suất ninja được gọi lại vì nguy cơ bị bỏng
Tuyên bố từ chối trách nhiệm
Chúng tôi đã nỗ lực hết sức để đảm bảo rằng thông tin do Drugslib.com cung cấp là chính xác, cập nhật -ngày và đầy đủ, nhưng không có đảm bảo nào được thực hiện cho hiệu ứng đó. Thông tin thuốc trong tài liệu này có thể nhạy cảm về thời gian. Thông tin về Drugslib.com đã được biên soạn để các bác sĩ chăm sóc sức khỏe và người tiêu dùng ở Hoa Kỳ sử dụng và do đó Drugslib.com không đảm bảo rằng việc sử dụng bên ngoài Hoa Kỳ là phù hợp, trừ khi có quy định cụ thể khác. Thông tin thuốc của Drugslib.com không xác nhận thuốc, chẩn đoán bệnh nhân hoặc đề xuất liệu pháp. Thông tin thuốc của Drugslib.com là nguồn thông tin được thiết kế để hỗ trợ các bác sĩ chăm sóc sức khỏe được cấp phép trong việc chăm sóc bệnh nhân của họ và/hoặc phục vụ người tiêu dùng xem dịch vụ này như một sự bổ sung chứ không phải thay thế cho chuyên môn, kỹ năng, kiến thức và đánh giá về chăm sóc sức khỏe các học viên.
Việc không có cảnh báo đối với một loại thuốc hoặc sự kết hợp thuốc nhất định không được hiểu là chỉ ra rằng loại thuốc hoặc sự kết hợp thuốc đó là an toàn, hiệu quả hoặc phù hợp với bất kỳ bệnh nhân nào. Drugslib.com không chịu bất kỳ trách nhiệm nào đối với bất kỳ khía cạnh nào của việc chăm sóc sức khỏe được quản lý với sự hỗ trợ của thông tin Drugslib.com cung cấp. Thông tin trong tài liệu này không nhằm mục đích bao gồm tất cả các công dụng, hướng dẫn, biện pháp phòng ngừa, cảnh báo, tương tác thuốc, phản ứng dị ứng hoặc tác dụng phụ có thể có. Nếu bạn có thắc mắc về loại thuốc bạn đang dùng, hãy hỏi bác sĩ, y tá hoặc dược sĩ.
Từ khóa phổ biến
- metformin obat apa
- alahan panjang
- glimepiride obat apa
- takikardia adalah
- erau ernie
- pradiabetes
- besar88
- atrofi adalah
- kutu anjing
- trakeostomi
- mayzent pi
- enbrel auto injector not working
- enbrel interactions
- lenvima life expectancy
- leqvio pi
- what is lenvima
- lenvima pi
- empagliflozin-linagliptin
- encourage foundation for enbrel
- qulipta drug interactions