突破干眼症诊断的边界:人工智能技术的最新研究与进展
随着创新解决方案和先进深度学习模型的不断开发,人工智能正越来越广泛地为公众所用。在医疗保健领域,企业也开始将人工智能融入诊断和治疗技术中。在眼科领域,包括角膜病学在内的多个亚专业在机器学习方面都取得了进展。专家表示,据估计有21.2%的美国人患有睑板腺功能障碍,为了减轻医疗护理负担,人工智能正被应用于干眼症检查和诊断工具中,以下为具体应用方式。
当为眼科开发一种机器学习模型时,有些人可能期望该程序一旦完成就能公开使用,但实际并非如此。人工智能通常会与其他技术相结合,无论是集成到一个用户友好的网络平台,还是诊断设备中。例如,CSI 干眼症软件和 Omnicad 是两种已在国际上商业化的干眼症诊断技术,它们使用人工智能算法来判断患者是否有干眼症的体征和(或)症状,以及疾病的严重程度。
图1 用户可以使用CSI干眼症软件跟踪患者干眼症的进展医生可以进行多项测试来辅助诊断,但筛选图像和数据可能很繁琐。CSI 干眼症软件是一款可以通过电脑访问的人工智能程序,它可以分析测试结果,并提供详细的诊断和治疗计划建议。
北卡罗来纳大学眼科临床教授、医师诊疗规程和激光视力中心医学主任卡 Karl Stonecipher 医学博士表示:“无论你拥有最新、最先进的分析仪,还是根本没有任何设备,你都可以将数据提交到系统中。所以,你可以提交诸如泪膜破裂时间、角膜染色、结膜染色、眼表疾病指数或眼表疾病评分等简单数据,基本上你想提交什么数据都可以,比如泪液分泌试验数据。因此,即使你没有高端的诊断设备,仍然可以从 CSI 干眼症软件中获取大量信息。”
除了与 CSI 兼容的众多干眼症测试外,医生还可以通过 CSI 提供的符合《健康保险流通与责任法案》的网络链接在线问诊表格,收集患者的病史和用药情况。收集尽可能多的数据对于确保算法得出最佳结果至关重要,无论是主观数据还是客观数据。为了进一步强化结果,CSI 还会考虑患者的生活环境。
Stonecipher 医生评论道:“当我们综合查看所有不同的主观和客观数据时,会有惊人的发现。我认为主观和客观数据同样重要,因为患者会主观地告诉你哪里不舒服,而医生则通过客观诊断来确认或排除这些问题。” 所有这些信息,再加上 CSI 提供的结果,可以为治疗方向提供一个整体规划,然后可以整合到患者的电子健康记录中。虽然该系统并非与所有的电子健康记录系统都兼容,但许多记录系统可以协同工作,为患者提供相关信息。Stonecipher 医生补充说,运行 CSI 并不需要可集成的电子健康记录系统。
Stonecipher 医生说:“CSI 让我在进行白内障手术评估的同时,能派一名技术人员去看诊情况更复杂的患者。技术人员可以回答患者的问题,询问相关信息,并开始将信息上传到程序中,从而简化流程。患者很喜欢这种方式,因为他们与技术人员相处的时间通常比与医生相处的时间更长,而且我们的技术人员可以借助 CSI 向患者普及知识、分享信息。这让我的诊所能够更高效地发挥技术人员的作用。”
由于 CSI 可以分析多项测试和数据点,因此需要准确记录信息以确保获得可靠的结果。上传患者详细信息和测试数据时出现的错误会干扰算法,导致 CSI 依据存疑的数据给出诊断结果。
Stonecipher 医生举例说:“假设一名技术人员出了错,将眼表疾病指数值85误输为5,这就会产生问题。” 他建议,每次为干眼症患者看诊时,都应打开 CSI 软件。这样可以减少误差,因为技术人员或医生可以查看患者与上次就诊相比是好转还是恶化。如果由于某种原因,CSI 结果显示没有干眼症的体征或症状,但患者在初次就诊时被诊断为轻度、中度或重度干眼症,那么就应该考虑可能是某个数据点计算有误。
目前,CSI 软件已更新到5.0版本,该版本增加了更多语言支持、优化了图表显示、集成了在线问诊表格、增加了与干眼症相关的药物副作用提醒、设立了网络转诊中心(需额外付费)、推出了新的收件箱系统,还可定制术前干眼症评估功能,以满足任何诊所的需求。医生们可以在其官网上试用免费演示版,或下载 CSI 干眼症软件。图2 Omnicad 的制造商 Lumibird 公司表示,这款产品旨在提高工作流程效率,用户只需点击按钮就能立即获得结果。结果可以存储在设备内,用于术后评估,并在随访检查时查看,以判断干眼症体征和症状是改善还是恶化
2024年,Lumibird 和 Quantel Medical 公司宣布推出干眼症诊断辅助平台 Omnicad。该设备内置人工智能软件,可在成像过程中进行全面检查。Omnicad 配备了高清自动对焦摄像头,可通过15英寸高清触摸屏查看图像,还能使用操纵杆进行控制。医生可以进行标准或透照式睑板腺造影,观察睑板腺及可能存在的血管情况。它还能分析眨眼频率、泪膜稳定性、泪河高度和脂质层。人工智能系统还可以分析其他测试,如荧光素染色、分诊评估、分级量表和症状问卷。
Omnicad 设计得便于使用,医生在一台设备上就能获取每次成像测试所需的一切功能。用户可以通过屏幕选择多种测试,然后调整成像镜头辅助检查。镜头可以旋转,提供多种光源,如白色、红外线和蓝色光,还能减少特定检查过程中的光反射和阴影。医生将设备调整到所需设置后,患者即可将下巴放在下巴托上。使用操纵杆将镜头聚焦在眼表的特定点上,按下操纵杆按钮就能拍摄图像。
人工智能算法使 Omnicad 成为一个干眼症诊断辅助平台。如果没有这项技术,Lumibird 公司的这款设备就只是一个用于眼表测试的多用途工具,其结果需要人工解读。该机器在完成图像采集后能立即生成检查报告,可在设备屏幕上查看。该公司表示,由于设备配备了强大的图形处理单元,结果几分钟内就能显示,而且计算机能够存储大量数据。如需了解更多关于 Omnicad 的信息,可访问其官网。
在过去一年里,数百项研究致力于开发用于干眼症诊断的实验性人工智能模型,目前还有更多研究正在进行中。各个研究团队在一定程度上成功开发出了能够解读各种独特干眼症测试的模型,但研究人员表示,这些研究大多处于概念验证阶段,模型需要不断重新训练,以确保结果的有效性和准确性。以下是一些研究人员为开发突破性干眼症诊断技术所做的努力。
图3 一项基于智能手机人工智能测定泪河高度的研究中,带掩码图像的样本量。(A)用三星 A71 拍摄的图像;(B)用 iPhone 11 拍摄的图像。机器学习模型通过分析带掩码图像的分割区域来做出判断
智能手机正逐渐在眼科成像领域兴起,因为大多数医生手头都有这种设备。由于智能手机可以连接互联网并支持大容量数据文件,将人工智能与之集成似乎是顺理成章的事。那么,如何利用智能手机诊断患者的干眼症呢?
伊朗的研究人员使用 Python 开发了一种人工智能算法,可根据智能手机拍摄的图像评估患者的泪河高度。他们创建了一个包含1021张图像的数据集,这些图像由三星 A71 或 iPhone 11拍摄,且每张图像仅包含患者一只眼睛的区域。然后,研究人员在图像上覆盖遮罩,将眼睛标注为三个部分:虹膜、巩膜和背景区域(眼睑)。他们裁剪掉每张图像中虹膜下方的下眼睑部分,并使用一个程序来提高图像质量。
在这项研究中,研究人员在智能手机闪光灯开启的情况下拍摄每位患者的眼睛,以便根据图像测量泪河高度。为了测量泪河高度,他们需要找到瞳孔反射的质心,绘制一条穿过该反射点(参考点)的垂直线,然后选择泪河上距离参考点最近的一个反射点。随后,研究人员用自己对泪河高度的评估结果训练算法。
深度学习模型能够在智能手机图像中准确检测泪河高度,误差极少。研究人员用80%的数据训练算法,其余20%的数据用于验证。他们将剩余数据与664张未标注的图像一起输入算法。在868张图像中,该模型能够在95.39%的图像中准确检测出泪河高度。
泪膜破裂时间检测是检查患者是否患有干眼症的最传统测试方法之一。如果算法训练得当,人工智能模型可以消除主观性,从而提高泪膜破裂时间测量的可靠性。法国的研究人员进行了一项研究,总共检查了67个裂隙灯视频,用于训练和验证他们评估泪膜破裂时间测量结果的人工智能算法。
研究人员用47个裂隙灯视频训练人工智能模型,并根据视频中是否显示泪膜破裂进行分类。模型训练完成后,研究人员向人工智能系统展示20个裂隙灯视频,观察其能否检测出泪膜破裂。他们通过图表评估结果,发现该模型的曲线下面积达到0.870,这一结果被认为“非常出色”。他们相信,这一发现证明了使用人工智能方法量化泪膜破裂时间的潜力。
隐形眼镜佩戴者的泪液渗透压往往较高,这会导致干眼症。因此,用于评估高渗透压的深度学习模型有助于诊断戴与不戴隐形眼镜患者的干眼症。西班牙和波兰的研究人员合作创建了多个不同智能水平的人工智能模型,以观察哪种算法能够预测隐形眼镜佩戴者泪液渗透压的严重程度。
研究人员使用包含175名参与者的数据集,创建了四种回归算法和六种分类算法。回归模型用于确定渗透压的变化,分类模型用于确定准确性。尽管并非每个算法都针对这些变量进行了训练,但研究人员尝试用非侵入性泪膜破裂时间、泪河高度、球结膜充血、角膜缘充血、角膜染色、结膜染色、上下睑板腺占比、眼表疾病指数和干眼问卷5项等数据训练模型。
简单回归模型的结果不尽人意,无法提供与更先进回归模型相同的有效性。然而,先进模型的预测能力也仅处于中等水平,多元线性回归模型显示其对渗透压变化的预测准确率为32%。分类算法在判断不同渗透压水平时表现稍好,使用随机森林模型时准确率最高,达到83%。图4 该模型有助于在荧光素染色后诊断干眼症。研究人员开发了一种算法,用于确定导致干眼症的点状上皮糜烂的严重程度。该模型使用1100张角膜荧光素染色图像进行训练,这些图像通过 U - Net 架构进行分割。一个卷积神经网络利用200张包含角膜区域点状和非点状上皮糜烂数据的图像进行训练。该模型可确定荧光素染色角膜的区域,以及是否存在点状上皮糜烂。然后,它通过最大密度值来判定病情的严重程度一些研究人员认为,人工智能在分析角膜荧光素染色后的图像方面很有效。韩国的研究人员开发了一个程序,可根据这些染色图像对干眼症的严重程度进行分级。
这个深度学习模型能够分割角膜区域以识别点状上皮糜烂,使用美国国立眼科研究所评分对疾病进行分级,并判断患者的病情是好转还是恶化。研究人员用1400张角膜荧光素染色图像训练该程序,这些图像由三位专家使用美国国立眼科研究所评分进行分级,以中位数美国国立眼科研究所评分为基准来衡量结果。此外,他们在不同的两天拍摄了其中100张图像,以评估疾病的进展情况。
研究人员用另外94张图像验证了他们的模型。模型得出的美国国立眼科研究所评分与基准评分高度相关。该模型还能够分割角膜并确定点状上皮糜烂的区域。此外,在报告了哪些患者的病情好转或恶化后,研究人员检查了模型的结果,发现其在88%的图像上判断准确。
当人工智能开始引起公众关注时,像 ChatGPT 这样的大语言模型是最早受到欢迎的算法之一。遗憾的是,常用的大语言模型并非为眼科诊断而设计,因此美国和中国的研究人员创建了一种多模态诊断流程(MDPipe),利用大语言模型进行干眼症诊断。
其开发者表示,MDPipe 经过训练,能够提供具有临床可行性的诊断结果,且性能优于 GPT-4 等复杂的大语言模型。利用汇总的临床数据,该模型可以解读信息,并判断患者是否患有干眼症、睑板腺功能障碍和(或)睑缘炎。研究人员用包含3513张睑板腺造影图像的大型数据集训练他们的模型,并开发了一个视觉翻译器,将每张图像转换为可量化的形态学数据。当医生将图像上传到大语言模型中时,翻译器会作为最终提供诊断结果的机制发挥作用。
为了评估 MDPipe 的准确性,研究人员将他们的大语言模型与 Llama、Llama2-7B(Meta 公司)等标准模型,以及 GPT-3.5、GPT-4(OpenAI 公司),还有针对医学领域数据进行微调的大语言模型(包括 Med-Alpaca 和 PMC-LLaMA)进行了比较。他们发现,MDPipe 是最精确的模型,在干眼症检测方面的准确率达到86.9%,睑板腺功能障碍检测的准确率为81.7%,睑缘炎检测的准确率为79.7%。每个大语言模型在诊断干眼症方面的准确率都高于睑板腺功能障碍和睑缘炎,其中 GPT-4 和 PMC-LLaMA 在干眼症诊断方面的准确率分别为70.7%和73.3%。
机器学习模型在短期内不会被淘汰,其在诊断方面的应用可以提高人们对疾病的认知,改善患者的整体健康状况。然而,人工智能并不完美,模型需要持续维护,以确保结果的有效性。
2020年,来自 Covisus、Adobe Research、Whistle Labs 以及加利福尼亚州西方学院数学系的研究人员发表了一篇关于人工智能如何改变医学的论文。当时,这项技术正广泛普及,算法在医学领域的准确率也开始达到人类水平。虽然使用人工智能有很多好处,但也有人指出,数据收集可能存在问题,数据可能存在偏差,并且在将数据应用到软件中之前,必须预先检查是否存在错误。此外,选择使用哪种算法可能是一项艰巨的任务,错误的模型可能会使结果出现偏差。如果模型更易于使用和理解,而不是成为用户难以理解内部机制的 “黑匣子”,就可以避免技术问题。
Stonecipher 医生说:“你要明白,必须持续训练人工智能。不能创建一个模型后就不管了,否则会得到各种错误的解读,我们在一些大语言模型上就看到了这种情况,其他模型也存在类似问题。如果模型训练不当或存在偏差,那么这种偏差就会影响人工智能软件给出的结果。我们需要做的,也是 CSI 努力去做的,是使模型不受种族或民族因素的影响,这样我们就能专注于询问患者的日常经历,因为每个人在生活环境、睡眠情况、年龄对日常生活的影响等方面都有所不同。”
上一篇:孕前调种子 孕中固胎元 圆梦子女全
下一篇:阿育韦达备孕指南【建议收藏】