近邻球簇基本示意图
k-means是人工智能领域最常用的快速基础算法之一,被广泛用于聚类、数据预分析及改进其他机器学习算法等。该成果创新地提出了一种新型的精确k-means算法Ball k-means。研究团队在提出的多粒度-粒球计算理论基础上,使用超球体来划分度量空间,获得了更加精确的近邻关系。该近邻关系不需要额外参数,消除了现有大多数优秀加速算法中单个样本的上下界,其距离计算次数小于现有的同类算法。
“Ball k-means算法整体算法简单、高效。”夏书银博士介绍,该算法相比目前的算法在某些应用上速度会提高十倍到百倍不等,如在依赖k-means算法实现加速的大数据金融、工业机器人等人工智能应用场景中,该算法在保证精准度的同时,会显著提高计算的速度,促进实现更快、更简单的智能算法学习过程。目前,该算法已经在国家某重大项目中进行应用,极大的提高了人工智能相关技术在智能安全领域中的响应速度。
本研究成果由夏书银、彭道万(硕士生)、王国胤、陈子忠联合西安交通大学孟德宇,天津大学张长青,美国加州大学伊丽莎白·格里姆(博士生),西安理工大学魏嵬等本领域专家和青年学生共同完成。