面向化学结构的线段聚类算法
Line-Segment Clustering Algorithm for Chemical Structure作者机构:山西大学计算机与信息技术学院太原030006 山西大学计算智能与中文信息处理教育部重点实验室太原030006 山西大学大数据科学与产业研究院太原030006
出 版 物:《计算机科学》 (Computer Science)
年 卷 期:2022年第49卷第5期
页 面:113-119页
学科分类:08[工学] 081203[工学-计算机应用技术] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金(61672332) 山西省重点研发计划(201903D421003) 山西省教育厅科技成果转化培育项目(2020CG001) 山西省应用基础研究计划(20210302123444) 中国高校产学研创新基金(2021FNA02009)。
摘 要:化学键识别是化学结构识别任务的重要组成部分。化学键中的单键、双键和三键都是由线段组成的,采用霍夫变换进行线段检测时容易产生冗余数据和干扰数据。为此,提出了一种面向化学键的线段聚类算法,对霍夫变换检出的线段进行聚类,进而合并冗余线段。具体而言,基于线段间空间关系的分析,定义线段间的相对相似性与间隔相似性度量;利用这两种度量,进行基于线段合并的聚类方法。实验结果表明,所提出的相似性度量可以全面地刻画线段间的相似关系;该算法能获得较好的聚类结果,同时能够准确复原化学键组成线段的真实位置,是一种有效的化学结构图像预处理方法。