AI4Meder
返回数据资源列表
数据资源TextLLM benchmarkBenchmark and leaderboard开放访问

MedHELM 医学 LLM 评测基准

Medical LLM benchmark and leaderboard intended to broaden coverage beyond single medical QA datasets.

数据集默认配图 - 医疗大模型与 Agent

数据资源详情

数据模态
Text
资源类别
LLM benchmark
数据规模
Benchmark and leaderboard
许可协议
See MedHELM site
访问方式
开放访问
适用任务
医学问答、临床推理、benchmarking
来源
MedHELM