Openai, sağlık hizmetlerinde yapay zekayı test etmek için Healthbench veri kümesini serbest bırakır

tıbbi olarak Carmen Pope, Bpharm tarafından tıbbi olarak gözden geçirildi. En son 13 Mayıs 2025'te güncellendi.

13 Mayıs 2025 Salı - Openai, yapay zeka (AI) modellerinin sağlık sorularını ne kadar iyi yanıtladığını test etmeye yardımcı olmak için büyük bir veri kümesi tanıttı.

Uzmanlar buna büyük bir adım diyorlar, ancak güvenliği sağlamak için daha fazla çalışmaya ihtiyaç olduğunu söylüyorlar.

Healthbench olarak adlandırılan veri kümesi Openai'nin ilk büyük bağımsız sağlık projesidir. Stat News, AI yanıtlarını değerlendirmek için her biri ayrıntılı derecelendirme araçlarına sahip 5.000 “gerçekçi sağlık konuşması” içeriyor. Şirketin sağlık AI ekibi, dedi. AGI yapay genel istihbarat için stenografidir.

“Bunun bir kısmı teknoloji inşa etmek ve dağıtmaktır,” dedi Singhal. "Bunun bir başka kısmı, sağlık hizmetleri gibi olumlu uygulamaların gelişmek için bir yeri olmasını ve modellerin bu ortamlarda güvenli ve güvenilir olmasını sağlamak için doğru işi yaptığımızı sağlamaktır.”

Veri kümesi, 60 ülkede çalışan 262 doktordan yardımla oluşturuldu. AI modellerinin sağlık sorularını ne kadar iyi yanıtladığını yargılamak için 57.000'den fazla benzersiz kriter sağladılar.

Healthbench Ortak bir sorunu çözmeyi amaçlıyor: farklı AI modellerini adil bir şekilde karşılaştırma. href = "https://www.medstarhealth.org/innovation-and-se-search/medstar-health-research-institute/principal-investigators/raj-ratwani"> raj ratwani , Medstar Health'teki bir sağlık AI araştırmacısı olan.

Healthbench'teki 5.000 örnek, doktorlar tarafından tasarlanan sentezlenmiş konuşmalar kullanılarak yapıldı.

Veri kümesi ayrıca AI modellerinin mücadele ettiği 1.000 zor örnekten oluşan özel bir grup içerir. Openai, bu grubun “önümüzdeki aylar boyunca model iyileştirmeleri için değerli bir hedef sunmasını” umuyor. Stat News, Openai’nin O3 modelinin özellikle iletişim kalitesinde en iyisini aldığını bildirdi.

Ancak modeller, bağlam farkındalığı ve eksiksizlik gibi alanlarda kötü performans gösterdi, dedi uzmanlar.

"Yaşamı ve ölümü tartıştığımız sağlık hizmetleri gibi hassas bağlamlarda, bu opaklık seviyesinin kabul edilemez olduğu," diye açıkladı Hao.

Bu “hem model hem de greyder tarafından paylaşılan hataları gizleyebilir” Girish nadkarni , yeni York City'de tıpta yapay zeka ve insan sağlığı için insan sağlığı çağrısında bulundu. Modellerin farklı ülkelerde ve farklı demografiler arasında iyi çalışmasını sağlamak için daha fazla inceleme.

“Healthbench, LLM sağlık hizmeti değerlendirmesini geliştirir, ancak güvenlik iddialarını desteklemeden önce alt grup analizine ve daha geniş insan incelemesine ihtiyaç duyar,” dedi Nadkarni. genel eğilimler ve bireylerle ilgili değil. Bireysel faktörler büyük ölçüde değişebilir. Her zaman bireysel sağlık kararları için kişiselleştirilmiş tıbbi tavsiye alın.

Kaynak: Healthday

Devamını oku

Sorumluluk reddi beyanı

Drugslib.com tarafından sağlanan bilgilerin doğru ve güncel olmasını sağlamak için her türlü çaba gösterilmiştir. -tarihli ve eksiksizdir ancak bu konuda hiçbir garanti verilmemektedir. Burada yer alan ilaç bilgileri zamana duyarlı olabilir. Drugslib.com bilgileri Amerika Birleşik Devletleri'ndeki sağlık uygulayıcıları ve tüketiciler tarafından kullanılmak üzere derlenmiştir ve bu nedenle Drugslib.com, aksi özellikle belirtilmediği sürece Amerika Birleşik Devletleri dışındaki kullanımların uygun olduğunu garanti etmez. Drugslib.com'un ilaç bilgileri ilaçları onaylamaz, hastalara teşhis koymaz veya tedavi önermez. Drugslib.com'un ilaç bilgileri, lisanslı sağlık uygulayıcılarına hastalarıyla ilgilenme konusunda yardımcı olmak ve/veya bu hizmeti görüntüleyen tüketicilere sağlık hizmetinin uzmanlığı, becerisi, bilgisi ve muhakemesi yerine değil, tamamlayıcı olarak hizmet etmek için tasarlanmış bir bilgi kaynağıdır. uygulayıcılar.

Belirli bir ilaç veya ilaç kombinasyonu için bir uyarının bulunmaması, hiçbir şekilde ilacın veya ilaç kombinasyonunun herhangi bir hasta için güvenli, etkili veya uygun olduğu şeklinde yorumlanmamalıdır. Drugslib.com, Drugslib.com'un sağladığı bilgilerin yardımıyla uygulanan sağlık hizmetlerinin herhangi bir yönüne ilişkin herhangi bir sorumluluk kabul etmez. Burada yer alan bilgilerin olası tüm kullanımları, talimatları, önlemleri, uyarıları, ilaç etkileşimlerini, alerjik reaksiyonları veya olumsuz etkileri kapsaması amaçlanmamıştır. Aldığınız ilaçlarla ilgili sorularınız varsa doktorunuza, hemşirenize veya eczacınıza danışın.

Popüler Anahtar Kelimeler