近期,我院人工智能研究团队在聚类集成研究方面取得重要进展,相关成果“Self-Constrained Clustering Ensemble”发表在人工智能领域国际顶级期刊IEEE Transactions on Pattern Analysis and Machine Intelligence(简称TPAMI,影响因子:18.6)。该论文第一作者为魏巍教授,通讯作者为梁吉业教授,第二作者为2023级博士生吴建国,合作者为2022级博士生闫京、中北大学讲师郭鑫垚。

作为人工智能的核心方向之一,无监督学习致力于让机器从未标注数据中自动发现潜在规律,是实现机器智能突破的关键。聚类分析是其基础方法,聚类集成通过融合多基聚类结果提升稳定性与鲁棒性。但现有方法多为 “一次性融合基聚类”,难适配复杂高维数据非线性结构,还易受低质量基聚类干扰。

为此,研究团队首创迭代式聚类集成新范式(见图 1),通过动态挖掘成对约束,实现度量学习与聚类集成的协同优化,迭代生成判别性更强的基聚类,大幅提升复杂数据聚类精度,可为大数据分析处理提供关键技术支撑。


图1:自约束聚类集成框架图


在多个公开数据集上的实验验证表明,所提方法在聚类精度上优于代表性的聚类集成方法(见图2),特别是在不同集成规模下,仍保持优异聚类性能(见图3)。

图2:聚类精度(ACC)对比


图3:不同集成规模下的聚类精度(ACC)平均表现


该研究工作得到计算智能与中文信息处理教育部重点实验室、国家自然科学基金项目(62276160)、山西省基础研究计划项目(202203021211291,202303021222030)、山西省留学人员科技活动项目(20240002)等支持。

TPAMI期刊于1979年建刊,是国际上公认的人工智能领域顶级期刊,同时也被中国计算机学会(CCF)推荐为人工智能领域的A类期刊,主要刊登人工智能领域的高质量前沿研究成果。