科研进展

科研进展

当前位置: 学院首页 > 科研进展 > 正文

科研进展

《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》发表甘祥超教授团队“An integrated fast Hough transform for multidimensional data”

发布人: 发布日期: 2023-05-04 浏览次数:

近日，ok138cn太阳集团及前沿交叉研究院甘祥超教授团队在TPAMI (IEEE Transactions on Pattern Analysis and Machine Intelligence, IF=24.314)上发表题为“An integrated fast Hough transform for multidimensional data”的研究论文（https://doi.org/10.1109/TPAMI.2023.3269202），介绍了一种在多维空间数据点云中检测直线、平面及超平面等目标的快速检测算法。它可以用于高维数据的数据挖掘、分类和模式识别，在计算机视觉、自动驾驶、人工智能和数据分类等方向具有广泛应用前景。

直线检测是物体识别的基础，在人工智能和计算机视觉中具有举足轻重的地位。当拓展到三维甚至更高维度的数据空间时，霍夫变换对应的检测目标是平面和超平面(hyperplane)。但是由于“数据维度的诅咒”，在多维空间中相应算法的计算量和复杂度往往呈指数级的增加。目前，由IBM公司的Li等人于1986年提出的快速霍夫变换专利算法是该领域唯一可用的算法，该算法被一些通用的计算机图像处理类库如gandalf开源实现并获得广泛应用。但该算法具有重大缺陷，一是其数学模型使用同数据维度相等数量的参数子空间，同一目标可能会投射到多个子空间中，需要额外算法检测冗余目标；二是算法精度在参数空间非均匀分布，存在众多检测效率谷点。

本研究建立了新的直线、平面及超平面的数学模型，并开发了一体化快速霍夫变换。一体化快速霍夫变换只需要使用一个单一的参数空间，并利用单一k字节树编码所有参数空间的信息，大大消减系统中的计算量和存储需求。这一新方法还具有两个重要的优势：首先，IBM快速霍夫变换的拟合模式对应的是最小二乘法，数据噪声只存在数据的一个维度上，而一体化快速霍夫变换则对应总最小二乘拟合算法，模型假设数据噪声是遍布所有维度的，因此对数据噪声容忍度更好，在实际应用中很好解决了IBM快速霍夫变换的算法精度在参数空间非均匀分布的问题。其次，一体化快速霍夫变换中，在数据空间中彼此距离越近的目标在参数空间中越聚集，这使我们可以直观的图形显示参数空间中的数据分析过程，从而快速判断目标的数量，可视化的指导系统参数设定并避免重复识别目标。

图一. 三维空间的点云数据及一体化快速霍夫变换参数空间映射

图二. Kinect拍摄的三维RGB-D图片、深度图及一体化快速霍夫变换检测检测出来的平面

ok138cn太阳集团为该论文唯一单位，ok138cn太阳集团在读二年级博生李艳慧为该论文第一作者，甘祥超教授为该论文通讯作者。该研究得到科技部科技创新2030---“新一代人工智能”，国家自然科学基金，江苏省前沿引领技术基础研究专项，现代作物生产省部共建协同创新中心等项目的资助。