基于谣言传播机制的大模型幻觉减轻策略
Large language model hallucination reduction strategy based on the rumor propagation mechanism作者机构:北京航空航天大学人文与社会科学高等研究院北京100191 北京航空航天大学人工智能学院北京100191 南昌大学数学与计算机学院江西南昌330031
出 版 物:《实验技术与管理》 (Experimental Technology and Management)
年 卷 期:2025年第42卷第2期
页 面:96-103页
学科分类:050302[文学-传播学] 05[文学] 0503[文学-新闻传播学]
基 金:国家自然科学基金青年项目“幻觉中的真相:多智能体交互下AIGC谣言传播模拟与治理研究”(62406016) 北京市教育科学“十四五”规划课题“基于多模态数据的高校教学质量评价研究”(CGCA23128)
摘 要:人工智能大模型各场景应用日趋广泛,但其幻觉问题导致实际应用中的误导风险增加以及用户信任下降。该研究深入探究大模型幻觉的传播与控制机制,首先运用SEIR谣言传播动力学模型,通过选取法律文本判决任务,对GPT-4-Turbo、Claude-3和Llama-3三种大模型进行了易感性的实证测试。其次,研究了干扰因素敏感度,发现内容生成后干扰对模型正确率影响更为显著,且高幻觉率模型能通过信息传递影响易感模型,导致其幻觉率上升。进一步,为完善幻觉状态干预与恢复策略,采用知识注入和提示词微调两种干预策略。最后,提出需通过更全面的管理与优化措施,来预防二次感染,并维持模型的长期健康状态。该研究不仅为大模型幻觉控制提供了新的视角,也为模型的长期稳健性管理提供了重要启示。