北京, 2023年8月15日 — WiMi虚拟现实技术有限公司(纳斯达克股票交易所代码:WIMI)(“WiMi”或”公司”),是一家领先的全球虚拟增强现实(“AR”)技术提供商,今天宣布开发了一种X光图像分析的通用学习算法,将其命名为自动人工智能X光图像分析(Auto-AIX)。

X光图像分析是一个复杂的过程,涉及骨密度、器官形状和组织密度等各种特征的检测。传统上,这个过程是由医务人员通过利用其专业知识来识别和分析特征来手动完成的。然而,这种方法需要时间,且可能会导致人为错误,从而导致误诊和患者预后不良。

WiMi一直在探索使用人工智能算法自动化X光图像分析过程。这些算法旨在从大量X光图像数据集中学习,并可以识别人类专家难以或无法检测到的模式和特征。通过自动化X光图像分析过程,AI算法有可能提高诊断速度和准确性,同时减轻医疗专业人员的工作量。但是,为X光图像分析开发有效的AI算法需要一个大量且多样化的X光图像训练和验证数据集。这个数据集必须经过仔细选择和标注,以确保AI算法能够准确识别图像特征。

WiMi开发了一种通用学习算法来进行X光图像分析,它被设计为可以从一个多样化的X光图像集学习,以适应实际应用。该算法基于深度神经网络架构,使用大量且多样化的X光图像数据集进行训练。数据集经过整理和标注,以确保算法能够准确识别骨密度、器官形状和组织密度等感兴趣特征。为了提高算法的通用性能力,采取了数据扩充和领域随机化等技术。数据扩充包括对原始X光图像进行旋转、缩放和翻转等一系列变换,从而创建一个更大更多样的训练数据集。领域随机化涉及向训练数据添加随机噪声和扰动,这有助于算法对新 unseen 的X光图像具有通用性。该算法被设计为在各种硬件平台上运行,从常规CPU到高性能GPU。这使其适用于现实环境中资源可能受限或不稳定的部署。

Auto-AIX包括数据采集、生成和标注,以及通用学习算法。在医学图像领域,收集和使用真实数据面临许多隐私和保密性限制。Auto-AIX通过使用计算机生成的合成数据规避这些限制。具体来说,它使用CT扫描模拟X光图像,使合成数据具有真实的外观和细节,从而提高模型准确性。

在Auto-AIX中,生成合成数据的第一步是创建医学模型,可以通过CT扫描或手术工具建模。然后,通过向医学模型注入噪声和变化,可以生成多个样本,覆盖广泛的情况和可能出现在真实数据中的变化。最后,这些样本需要标注,例如通过手动标记特征和疾病。这些标注可以自动应用于所有其他合成数据,从而节省大量时间和劳动成本。这一过程在Auto-AIX中称为“领域扩展”,因为它允许合成数据领域扩展到更广泛的数据集。

Auto-AIX使用基于通用学习的算法来构建深度学习模型。该算法的优点是可以使用大量合成数据进行训练,而无需大量真实数据。这意味着即使在收集真实数据存在困难和限制时,Auto-AIX也可以训练高性能深度学习模型。

具体来说,Auto-AIX使用领域随机化技术来构建基于通用学习的算法。这个技术的核心思想是通过向合成数据引入随机性,来提高模型的通用性能力。这个随机性可以是任意的,例如向合成数据添加噪声、扰动、遮挡等。通过这种方式,Auto-AIX可以构建具有高通用性能的深度学习模型。

为评估Auto-AIX的性能,研究人员进行了一系列实验,比较使用Auto-AIX合成数据训练的深度学习模型与使用真实数据训练的模型之间的差异,并测试使用不同合成数据的效果。

使用SyntheX合成数据训练AI模型的实验结果显示,这种方法可以实现与真实数据训练相当甚至超过真实数据训练的性能。接下来,训练好的AI模型需要应用于真实临床X光图像数据进行评估和部署。在将AI模型应用于真实数据之前,真实数据需要预处理,使其分布与合成数据相似。这种预处理方法称为领域适应或领域转换。领域转换方法的目标是将模型从源域(合成数据)转换到目标域(真实数据),以便模型在目标域上表现最佳。领域适应的主要思想是通过建模源域和目标域分布之间的差异,学习能够在目标域上泛化的模型。

为将AI模型应用于真实数据,WiMi使用名为对抗判别领域适应(ADDA)的领域适应方法,它包含两个阶段:第一阶段是训练源域分类器和目标域分类器来区分源域和目标域;第二阶段是训练领域适配器将源域特征转换到目标域,以优化模型在目标域上的性能。分类器和目标域分类器区分源域和目标域之间的差异;第二阶段是训练一个领域适配器,将源域特征转换到目标域,以使模型在目标域上表现最佳。ADDA方法用于将模型从合成数据域转换到真实数据域。经过领域适应后,AI模型在真实数据上的性能与在合成数据上的性能相当,这表明领域适应方法是有效的。

WiMi的AI模型应用于虚拟临床X光图像并进行评估。结果显示,AI模型可以准确识别各种疾病和异常,包括肺炎、肺结节和肺积液。此外,AI模型可以进行定量测量,如肺容积和结节大小。总体来说,使用Auto-AIX合成数据训练AI模型,并使用ADDA方法进行领域适应,可以大大加速X光图像分析领域的研究和应用,为医疗领域带来更多机会和挑战。