基于文本相似度分析的《红楼梦》化用唐诗研究
作者机构:清华大学人文学院
出 版 物:《中外文化与文论》 (Cultural Studies and Literary Theory)
年 卷 期:2024年第2期
页 面:213-228页
学科分类:0501[文学-中国语言文学] 050105[文学-中国古代文学] 05[文学]
基 金:国家社会科学基金重点项目“中国古典诗歌声律的统计分析与研究”(20AZW010) 重大项目“基于大数据技术的古代文学经典文本分析与研究”(18ZDA238)阶段成果
摘 要:《红楼梦》中的诗词不仅具有独立审美价值,也辅助推动了故事情节、刻画了人物形象,反映了作者的阅读经验与知识结构。化用诗句是《红楼梦》诗词创作的一个重要方式,而文本相似度是判定化用的重要标准。本文利用数字人文方法的“编辑距离“词袋模型“doc2vec与“LDA主题模型,筛选出《红楼梦》所化用的唐宋诗句及其诗集来源,分析它们在词句、篇章层面的关系,探究曹雪芹的阅读经验与《红楼梦》诗意风格的生成关系。通过分析这些诗句在康乾时期的所属诗歌选本及其版本流传状况,认为《才调集》等选本对《红楼梦》的诗歌创作或具有直接影响。同时,通过与传统文本细读方法的比较,指出文本相似度分析方法的得失并提出改进方法。两者结合也让我们对什么是相似诗文,基于哪些要素及如何衡量相似诗文有了进一步的理解与认识,具有一定的方法论意义。