Openai, sağlık hizmetlerinde yapay zekayı test etmek için Healthbench veri kümesini serbest bırakır
13 Mayıs 2025 Salı - Openai, yapay zeka (AI) modellerinin sağlık sorularını ne kadar iyi yanıtladığını test etmeye yardımcı olmak için büyük bir veri kümesi tanıttı.
Uzmanlar buna büyük bir adım diyorlar, ancak güvenliği sağlamak için daha fazla çalışmaya ihtiyaç olduğunu söylüyorlar.
Healthbench olarak adlandırılan veri kümesi Openai'nin ilk büyük bağımsız sağlık projesidir. Stat News, AI yanıtlarını değerlendirmek için her biri ayrıntılı derecelendirme araçlarına sahip 5.000 “gerçekçi sağlık konuşması” içeriyor. Şirketin sağlık AI ekibi, dedi. AGI yapay genel istihbarat için stenografidir.
“Bunun bir kısmı teknoloji inşa etmek ve dağıtmaktır,” dedi Singhal. "Bunun bir başka kısmı, sağlık hizmetleri gibi olumlu uygulamaların gelişmek için bir yeri olmasını ve modellerin bu ortamlarda güvenli ve güvenilir olmasını sağlamak için doğru işi yaptığımızı sağlamaktır.”
Veri kümesi, 60 ülkede çalışan 262 doktordan yardımla oluşturuldu. AI modellerinin sağlık sorularını ne kadar iyi yanıtladığını yargılamak için 57.000'den fazla benzersiz kriter sağladılar.
Healthbench Ortak bir sorunu çözmeyi amaçlıyor: farklı AI modellerini adil bir şekilde karşılaştırma. href = "https://www.medstarhealth.org/innovation-and-se-search/medstar-health-research-institute/principal-investigators/raj-ratwani"> raj ratwani , Medstar Health'teki bir sağlık AI araştırmacısı olan.
Healthbench'teki 5.000 örnek, doktorlar tarafından tasarlanan sentezlenmiş konuşmalar kullanılarak yapıldı.
Veri kümesi ayrıca AI modellerinin mücadele ettiği 1.000 zor örnekten oluşan özel bir grup içerir. Openai, bu grubun “önümüzdeki aylar boyunca model iyileştirmeleri için değerli bir hedef sunmasını” umuyor. Stat News, Openai’nin O3 modelinin özellikle iletişim kalitesinde en iyisini aldığını bildirdi.
Ancak modeller, bağlam farkındalığı ve eksiksizlik gibi alanlarda kötü performans gösterdi, dedi uzmanlar.
"Yaşamı ve ölümü tartıştığımız sağlık hizmetleri gibi hassas bağlamlarda, bu opaklık seviyesinin kabul edilemez olduğu," diye açıkladı Hao.
Bu “hem model hem de greyder tarafından paylaşılan hataları gizleyebilir” Girish nadkarni , yeni York City'de tıpta yapay zeka ve insan sağlığı için insan sağlığı çağrısında bulundu. Modellerin farklı ülkelerde ve farklı demografiler arasında iyi çalışmasını sağlamak için daha fazla inceleme.
“Healthbench, LLM sağlık hizmeti değerlendirmesini geliştirir, ancak güvenlik iddialarını desteklemeden önce alt grup analizine ve daha geniş insan incelemesine ihtiyaç duyar,” dedi Nadkarni. genel eğilimler ve bireylerle ilgili değil. Bireysel faktörler büyük ölçüde değişebilir. Her zaman bireysel sağlık kararları için kişiselleştirilmiş tıbbi tavsiye alın.
Kaynak: Healthday
Gönderildi : 2025-05-14 06:00
Devamını oku

- Celtics yıldızı Jayson Tatum Sezon için Yırtılmış Aşil ile
- Dünyanın bölümleri yeni Covid-19 varyantını görüyor
- Erteleme düğmesine ulaşmak mı? Yalnız değilsin
- Kura Onkoloji ve Kyowa Kirin, nüksed veya refrakter NPM1-Mutant AML'li yetişkinlerde Ziftomenib için yeni ilaç uygulamasının FDA kabulünü ve öncelik incelemesini duyurdu
- Kadınlarda sağlıklı yaşlanmaya bağlı orta yaşta kafein alımı
- Ön işlentili ileri veya metastatik özofagus skuamöz hücreli karsinomu olan bazı hastalarda başlatılan Ifinatamab DeRuxtecan'ın Iteat-Ezophageal01 Faz 3 Denemesi
Sorumluluk reddi beyanı
Drugslib.com tarafından sağlanan bilgilerin doğru ve güncel olmasını sağlamak için her türlü çaba gösterilmiştir. -tarihli ve eksiksizdir ancak bu konuda hiçbir garanti verilmemektedir. Burada yer alan ilaç bilgileri zamana duyarlı olabilir. Drugslib.com bilgileri Amerika Birleşik Devletleri'ndeki sağlık uygulayıcıları ve tüketiciler tarafından kullanılmak üzere derlenmiştir ve bu nedenle Drugslib.com, aksi özellikle belirtilmediği sürece Amerika Birleşik Devletleri dışındaki kullanımların uygun olduğunu garanti etmez. Drugslib.com'un ilaç bilgileri ilaçları onaylamaz, hastalara teşhis koymaz veya tedavi önermez. Drugslib.com'un ilaç bilgileri, lisanslı sağlık uygulayıcılarına hastalarıyla ilgilenme konusunda yardımcı olmak ve/veya bu hizmeti görüntüleyen tüketicilere sağlık hizmetinin uzmanlığı, becerisi, bilgisi ve muhakemesi yerine değil, tamamlayıcı olarak hizmet etmek için tasarlanmış bir bilgi kaynağıdır. uygulayıcılar.
Belirli bir ilaç veya ilaç kombinasyonu için bir uyarının bulunmaması, hiçbir şekilde ilacın veya ilaç kombinasyonunun herhangi bir hasta için güvenli, etkili veya uygun olduğu şeklinde yorumlanmamalıdır. Drugslib.com, Drugslib.com'un sağladığı bilgilerin yardımıyla uygulanan sağlık hizmetlerinin herhangi bir yönüne ilişkin herhangi bir sorumluluk kabul etmez. Burada yer alan bilgilerin olası tüm kullanımları, talimatları, önlemleri, uyarıları, ilaç etkileşimlerini, alerjik reaksiyonları veya olumsuz etkileri kapsaması amaçlanmamıştır. Aldığınız ilaçlarla ilgili sorularınız varsa doktorunuza, hemşirenize veya eczacınıza danışın.
Popüler Anahtar Kelimeler
- metformin obat apa
- alahan panjang
- glimepiride obat apa
- takikardia adalah
- erau ernie
- pradiabetes
- besar88
- atrofi adalah
- kutu anjing
- trakeostomi
- mayzent pi
- enbrel auto injector not working
- enbrel interactions
- lenvima life expectancy
- leqvio pi
- what is lenvima
- lenvima pi
- empagliflozin-linagliptin
- encourage foundation for enbrel
- qulipta drug interactions