融合字符级与单词级特征的跨领域方面词抽取
作者机构:昆明理工大学信息工程与自动化学院 昆明理工大学云南省人工智能重点实验室
出 版 物:《小型微型计算机系统》 (Journal of Chinese Computer Systems)
年 卷 期:2024年
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:方面词抽取作为一项序列标记任务,通常需要依赖于大量标记数据.这在标记数据稀缺的领域变成了一项巨大的挑战.为克服该任务对于标记数据的依赖,主要是将源域与目标域中相似的句法信息或语义信息作为枢轴信息进行领域自适应,但仅仅依靠语义或句法信息作为枢轴信息其性能是有限的.故而本文在此基础上进一步将单词内部的特征信息拓展为额外的枢轴信息,使得源域与目标域之间可以更好的进行领域自适应.同时,为了提高数据的利用率,本文设计了多通道编码器,使其可以将全局特征、局部特征、字符特征进行分散编码,间接提高了单个编码通道对于数据的利用率.最终在三个基准数据集上获得了不错的性能表现.