北京, 2023年8月18日 — 慧眉虚拟现实技术有限公司(纳斯达克股票交易所代码:WIMI)(“慧眉”或”公司”),是一家领先的全球虚拟现实(AR)技术提供商,今天宣布开发了基于Mask R-CNN的技术,可以智能提取图像中的CSO(特征空间对象)和其参考点,这在高分辨率图像处理和匹配领域带来了突破。该技术利用最新的深度学习和计算机视觉技术,为自动图像匹配和目标定位提供了一种高效准确的解决方案。

高分辨率图像处理和匹配一直是计算机视觉领域的一个重要研究方向,但自动匹配一直面临着来自图像局部变形和光照条件差异的巨大挑战。以往方法通常受计算复杂度和局部特征依赖性的限制,难以实现准确结果。慧眉的这一技术可以用于图像上的CSO和其参考点的提取。通过这种方法,CSO可以自动获取,为后续图像匹配过程提供准确的定位信息。

慧眉研发团队通过引入Mask R-CNN模型成功解决了这个挑战,Mask R-CNN是基于常用于目标检测和实例分割的Faster R-CNN模型进行扩展的。该模型的独特之处在于它可以同时预测目标的边界框、类别、遮罩和关键点,为图像处理任务提供全面信息。

在这一新技术中,慧眉首先利用大量高分辨率遥感图像数据对Mask R-CNN模型进行训练。通过训练,模型能够学习图像中不同目标实例的特征,并能够准确预测它们的边界框、类别、遮罩和关键点。在训练好的Mask R-CNN模型基础上,技术团队进一步提出了CSO的概念和参考点方法。CSO指具有明显特征的目标实例,通过设置阈值或规则可以智能过滤出CSO。参考点是通过Mask预测器和关键点预测器从CSO中提取的,用于定位目标实例的重要特征点。

其技术实现逻辑如下:

数据准备:首先需要准备包含不同目标类型和变形程度图像的高分辨率遥感图像数据集,用于训练和评估。

模型训练:利用准备的数据集对Mask R-CNN模型进行训练。训练目标是使模型能够准确预测目标的边界框、类别、遮罩和关键点。

CSO参考点提取:在训练好的Mask R-CNN模型上,通过输入高分辨率遥感图像可以实现CSO和参考点的智能提取。CSO定义:CSO指特征空间对象,即具有明显特征的目标实例。通过设置一些阈值或规则可以过滤出CSO。参考点提取:利用Mask预测器和关键点预测器从每个CSO中提取遮罩和关键点,用于准确定位目标实例。Mask预测器将为每个CSO生成二值遮罩,用于准确分割目标实例。关键点预测器将预测目标实例的关键点坐标,用于定位目标实例的重要特征点。

CSO和参考点的应用:提取出的CSO和参考点可以用于各种应用,如高分辨率遥感图像匹配。根据具体应用场景,可以基于CSO的位置和特征实现图像匹配或其他相关任务。