综合LDA与特征维度的旅游地意象感知计算方法
作者单位:河北师范大学
学位级别:硕士
导师姓名:李仁杰
授予年度:2020年
学科分类:02[经济学] 0202[经济学-应用经济学] 081603[工学-地图制图学与地理信息工程] 081802[工学-地球探测与信息技术] 07[理学] 08[工学] 020202[经济学-区域经济学] 070503[理学-地图学与地理信息系统] 0818[工学-地质资源与地质工程] 0705[理学-地理学] 0816[工学-测绘科学与技术]
主 题:LDA模型 旅游地意象 丽江古城 特征维度 位置微博 时空演变
摘 要:旅游UGC(User Generated Contents)能够直接或间接反映旅游者行为方式、情感状态等特征,已成为旅游地意象研究重要的数据源。目前,基于UGC文本的词频统计、特征词共现等内容分析法,实现了意象感知研究的定量计算,但缺少从文档集合整体视角进行语义相似性的观察,一定程度上影响了意象感知特征提取的可信度。LDA(Latent Dirichlet Allocation)主题模型通过三层贝叶斯概率模型抽取一组文本的隐含的主题信息,但在抽取结果的主题特征定性描述方面仍存在较强的主观性。另外,当前的旅游地意象感知主要聚焦于文本语义感知分析层面,缺少旅游地意象的时空间分异特征的集成研究。如何在LDA主题模型计算结果基础上,进一步提高旅游地意象特征描述的客观性,并从不同尺度旅游区域,深入挖掘旅游地意象呈现的时空模式,是本论文尝试解决的科学问题。本文提出了综合LDA与特征维度的方法,在LDA模型计算基础上,将主题特征词划分为不同的特征维度,实现LDA结合特征维度进行半定量化提取旅游地意象的方法,并通过核密度分析方法发现旅游地意象感知的时空模式。该方法的优势是:(1)能解决LDA在短文本应用中面临的问题,保证不同研究者能从大量UGC中提炼出基本一致的主题语义,最终获得旅游地意象感知的精细结构与特征。(2)该方法通过分析时空因素对旅游地意象感知产生的影响与约束,得出旅游地意象感知在多种尺度下的时空演变规律。以新浪微博为数据源的丽江古城实证研究表明,综合LDA与特征维度的方法能较好的抽取位置微博短文本的主题信息,能在一定程度上减少意象感知的主观判断性,得到与现有研究成果基本一致的结果。而且,本方法获得的丽江古城意象感知具有更加精细的结构,并通过主题实现了意象感知的空间化,发现了意象感知的时空模式,具体意象特征结果如下:在一级特征维度下,通过6组核心空间与景观元素、4种特殊感知体验,4类人与环境要素的互动特征,可以完整勾勒出丽江古城意象感知的基本框架;在二级特征维度下,从7个视角精细解读丽江古城慢活性,从3个方面烘托古城夜生活和浪漫之都的文化意境,用3种载体支撑旅游者对地方文化与现代风情融合的凝视与体验。LDA模型成功刻画了丽江古城的形象特征,并能进一步解析形象形成的原因与机制,为旅游地意象感知研究提供了新视角和新方法。本文从特征维度和时空演变两个视角深入研究意象感知的空间分布特征:从一级特征维度意象来看,行为与心理维度意象的高密度核心区分布更加广泛;从二级特征维度意象的空间分布中发现了两种分布模式:单密度核心分布和多密度核心分布,具有明确POI指向的主题意象的空间分布模式主要为单密度核心分布。从日内时尺度和旅游季节尺度来看,女性对主题意象的感知程度明显高于男性,外地游客明显高于本地游客;从日内时尺度的研究中发现了三种主题空间模式:密度核心扩散模式、密度核心收敛模式及密度核心先扩散后收敛模式;从旅游季节尺度来看,主题意象的空间分布范围无明显的季节性差异。