医学人工智能周刊5|提高医疗领域AI算法研究透明性清单
Table of Contents
有关临床人工智能建模的最小信息:MI-CLAIM检查清单 #
一种用于提高医疗领域AI算法透明性报告的工具
研究设计 #
- 模型解决的临床问题在论文中有清楚的细节
- 清晰的表述研究问题
- 患者队列的特征有细节文本体现
- 患者队列能代表真实世界临床环境
- 确定并详细说明用于基线比较最先进的解决方案
数据和优化 #
- 原始数据以及原始格式在文中描述清楚
- 用于模型的数据转化被详细描述
- 训练集和测试集说吗相互独立
- 描述关于如何选择最优模型的细节
- 输入数据是结构化还是非结构化
模型性能 #
- 描述用于评价算法性能(AUC、F-score等)的主要指标,包括选择依据
- 描述用于评价模型临床利用(PPV、NNT等)的主要指标,包括选择依据
- 使用合适的统计学方法描述比较提出模型性能与基线模型的性能
模型测试 #
- 检查技术1,结构化数据系数以及敏感度分析
- 检查技术2,非结构化数据显著图以及敏感度分析
- 讨论模型/算法性能与检查结果相关性
- 讨论在检查方法不可解释的情况下,在案例层面模型可解释性的可行性与意义
- 讨论在底层数据分布偏移情况下模型的可靠性以及鲁棒性
可重复性 #
- 完成代码分享
- 允许第三方评测代码的准确性/公平性;分享评测结果
- 发布用于在新数据上运行代码而不共享其详细信息的虚拟机(二进制文件)
- 不分享