基于模糊自然语言处理的铁路CTC接口文本智能测试方法
Intelligent testing method for railway CTC interface data based on fuzzy natural language processing作者机构:北京交通大学自动化与智能学院北京100044
出 版 物:《智能科学与技术学报》 (Chinese Journal of Intelligent Science and Technology)
年 卷 期:2024年第6卷第2期
页 面:201-209页
核心收录:
学科分类:08[工学] 082302[工学-交通信息工程及控制] 0823[工学-交通运输工程]
基 金:国家重点研发计划(No.2022YFB4300500) 中国国家铁路集团有限公司科技研究开发计划(No.L2022X002)
主 题:自然语言处理 模糊文本聚类 铁路调度集中控制系统 命名实体识别 智能测试
摘 要:模糊自然语言处理将模糊理论应用在自然语言处理(NLP)的任务中,随着大模型与人工智能的不断发展,有关文本数据的研究不断深化。铁路调度集中控制(CTC)系统作为大型复杂系统,各子系统、服务器软件间的接口数据均以日志文本格式存储与传输。由于其具有文本数量多、文本类型杂等特点,提出了一种模糊自然语言处理的方法,解决CTC系统接口数据的人工测试难题。模糊C均值(FCM)聚类算法将日志文本分为不同的标签类别,并将其作为NLP任务中命名实体识别的标签输入,在传统BiLSTM-CRF模型上引入BERT进行文本编码,更准确地理解文本之间的关系并提高文本识别的精确度。根据前序训练模型,研发了铁路CTC系统日志文本接口测试的智能验证工具,其可以改善目前CTC系统的人工测试现状,帮助测试人员进行接口测试验证,提升测试工作的智能化、自动化水平。