咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于Tri-training的社交媒体药物不良反应实体抽取 收藏

基于Tri-training的社交媒体药物不良反应实体抽取

Entity Extraction of Adverse Drug Reaction on Social Media Based on Tri-training

作     者:何忠玻 严馨 徐广义 张金鹏 邓忠莹 HE Zhongbo;YAN Xin;XU Guangyi;ZHANG Jinpeng;DENG Zhongying

作者机构:昆明理工大学信息工程与自动化学院昆明650500 昆明理工大学云南省人工智能重点实验室昆明650500 云南南天电子信息产业股份有限公司昆明南天电脑系统有限公司昆明650040 云南大学信息学院昆明650091 云南财经大学信息学院昆明650221 

出 版 物:《计算机工程与应用》 (Computer Engineering and Applications)

年 卷 期:2024年第60卷第3期

页      面:177-186页

核心收录:

学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金(61562049 61462055) 

主  题:中文社交媒体 药物不良反应 实体抽取 半监督学习 Tri-training 

摘      要:社交媒体因其数据的实时性,对其充分利用可以弥补传统医疗文献药物不良反应中实体抽取的迟滞性问题,但社交媒体文本面临标注数据成本高、数据噪声大等问题,使得模型难以发挥良好的效果。针对社交媒体大量未标注语料存在标注成本高的问题,采用Tri-training半监督的方法进行社交媒体药物不良反应实体抽取,通过三个学习器Transformer+CRF、BiLSTM+CRF和IDCNN+CRF对未标注数据进行标注,再利用一致性评价函数迭代地扩展训练集,最后通过加权投票整合模型输出标签。针对社交媒体的文本不正式性(口语化严重、错别字等)问题,通过融合字与词两个粒度的向量作为整个模型嵌入层的输入,来提取更丰富的语义信息。实验结果表明,提出的模型在“好大夫在线网站获取的数据集上取得了良好表现。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分