Sustainable Development
Vol.
12
No.
04
(
2022
), Article ID:
54003
,
9
pages
10.12677/SD.2022.124125
基于LDA的文旅扶贫政策引领旅游地发展路径探索
陈靖1,李玲2,陈博睿2
1成都理工大学数理学院,四川 成都
2成都理工大学管理科学学院,四川 成都
收稿日期:2022年6月14日;录用日期:2022年7月15日;发布日期:2022年7月25日

摘要
在2020年,我国实现了832个贫困县摘帽,近一亿人口脱贫,创造了人类减贫史上的奇迹。与此同时,我国旅游扶贫存在急于求成、只追求短期收益,规划不足的现实问题,因此贫困地区的发展必须因地制宜,尤其要利用好当地的文化旅游资源。在总结关于旅游业LDA情感分析、政策文本和贫困地区旅游文本方面的研究成果的基础上,利用LDA模型和ROST CM6情感分析方法的方式,以九寨沟、泸沽湖和雅鲁藏布大峡谷景区为例对文化旅游扶贫做进一步的研究与分析。最后,分别对于景区、旅游地政府及政策的制定进行了提升路径探索,提出了建设性建议。
关键词
文化旅游扶贫,LDA,提升路径探索

LDA-Based Cultural Tourism Poverty Alleviation Policy to Lead the Exploration of the Development Path of Tourism Destinations
Jing Chen1, Ling Li2, Borui Chen2
1College of Mathematics and Physics, Chengdu University of Technology, Chengdu Sichuan
2College of Management Science, Chengdu University of Technology, Chengdu Sichuan
Received: Jun. 14th, 2022; accepted: Jul. 15th, 2022; published: Jul. 25th, 2022

ABSTRACT
In 2020, my country has achieved 832 poverty-stricken counties, and nearly 100 million people have been lifted out of poverty, creating a miracle in the history of human poverty reduction. At the same time, my country’s tourism poverty alleviation has the practical problems of rushing for success, only pursuing short-term benefits, and insufficient planning. Therefore, the development of poverty-stricken areas must adapt to local conditions, especially to make good use of local cultural tourism resources. On the basis of summarizing the research results of tourism LDA sentiment analysis, policy texts and tourism texts in poverty-stricken areas, using the LDA model and ROST CM6 sentiment analysis method, the scenic spots of Jiuzhaigou, Lugu Lake and Yarlung Zangbo Grand Canyon are taken as For example, further research and analysis on cultural tourism poverty alleviation. Finally, the improvement paths were explored for the formulation of scenic spots, tourist destination governments and policies, and constructive suggestions were put forward.
Keywords:Cultural Tourism Poverty Alleviation, LDA, Promotion Path Exploration

Copyright © 2022 by author(s) and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
1. 引言
党的十八大以来,全国八百三十二个贫困县全部摘帽,近一亿农村贫困人口实现脱贫,创造了人类减贫史上的奇迹。在扶贫工作的开展过程中,交通闭塞、条件恶劣以及信息不通畅是制约贫困地区发展的主要因素,而旅游业门槛低,经济收益可观,适用范围广使许许多多的贫困地区走上脱贫致富之路。但同时旅游扶贫也存在急于求成、只追求短期收益,规划不足的现实问题,因此贫困地区的发展必须因地制宜,尤其要利用好当地的文化旅游资源。
2021年9月16日国家文化和旅游部发布《文化和旅游部办公厅关于进一步加强政策宣传落实支持文化和旅游企业发展的通知》进一步引导各地文化和旅游行政部门、旅游景区及企业优化旅游环境,适应文化和旅游新业态、新模式的发展需要,激发市场主体活力。文化旅游扶贫的成果来之不易,对于景区管理部门而言,需要其打造具有独特文化的旅游品牌,增加景区的吸引力;游客作为贫困地区引领经济效益的主体,同时也是景区宣传推广以及品牌和口碑打造的重点;相关政府部门要调和好开发商与当地居民的利益分配问题,使其实现合作共赢,更为重要的是为景区发展提供政策支持和方向引导。景区的开发者为了追求短期经济,快速回收资金,往往只是在贫困地区兴建各类受欢迎的旅游娱乐设施,虽然从短期来说有利可图,但并不利于长期发展,最终导致贫困地区只是临时性脱贫。为了文旅扶贫的长效发展,相关政策的监督和引导是必不可少的。本文通过建立LDA主题提取模型和ROST CM6对携程网上爬取的2013年至2021年间九寨沟、泸沽湖、雅鲁藏布大峡谷三个地区的评论数据进行文化旅游扶贫政策评论文本分析和游客评论情感分析并给出相关建议。
2. 文献综述
自2011年中共中央国务院发表《中国农村扶贫开发纲要(2011~2020年)》中首次提出了“旅游扶贫”的概念,国家相继出台各类文化旅游政策,在2021年国务院发表了《关于实现巩固拓展脱贫攻坚成果同乡村振兴有效衔接的意见》,基于此类政策国内外有关文旅扶贫的研究已取得不少成果。例如王一帆等运用复杂网络模型,结合2016年新疆南疆四地州集中连片特殊困难地区22个深度贫困县(市)的数据进行深入分析 [1]。梁晨晨等人基于LDA (Latent Dirichlet Allocation)模型,对丽江古城新浪微博进行主题提取分析,最终获得旅游地意象感知的精细结构与特征 [2]。国外学者Fang-Fang ZOU以福建省石族赤溪村为例,提出了科学定位和总体规划等三种社区适应方法 [3]。Wen Shixian等人从操作层面研究了中国南方某民族自治县,对实施扶贫旅游的地方政府、旅游企业和社区居民三个利益相关者进行了协调,为扶贫旅游理论的发展提供了有益的借鉴 [4]。结合各位学者对于文化旅游扶贫的论文来看,文旅扶贫这个主题大多学者都拥有自己独到的见解以及对当代文旅扶贫所持有成熟的建议,但传统旅游业对旅游景点评论的主题挖掘深度不足,舆情分析实时追踪能力并不强,故本文提出了基于LDA模型和ROST CM6情感分析方法的方式,以九寨沟、泸沽湖和雅鲁藏布大峡谷景区为例对文化旅游扶贫做进一步的研究与分析。
本文总结关于旅游业LDA情感分析、政策文本和贫困地区旅游文本方面的研究成果,其有助于了解前人研究背景,为后续研究内容做好理论支撑。旅游业的主题挖掘和情感分析一直以来是该领域研究热点。杨秀璋以贵州旅游景点为例,利用LDA提取模型进行主题挖掘和情感分析,进一步探索积极评论、消极评论之间的关联关系与相关程度,最终分别提取出积极情感的和消极情感的三大类主题,为贵州旅游景点乃至全国范围内的旅游优质服务提供了数据支撑和理论支持 [5]。朱哲慧通过文本聚类和主题提取的方法研究江南古镇三大典型代表的旅游目的地同质化问题,聚焦乌镇、西塘和周庄的认知形象定位,为旅游目的地同质化问题提出解决方案 [6]。以外,张学民立足于游客感知视角对西塘古镇旅游形象进行了相关研究,提取出游客对其六大感知因素,探索了积极与消极的游客感知因素,并针对于消极因素的改进提出了建设性意见与建议 [7]。综合已有文献看来,基于旅游业的LDA情感分析主要利用在大数据和LDA主题提取模型爬取现有游客评论的基础上,对游客感知、积极或者消极评论进行探索,这也为本文研究思路提供方向。
作为信息的主要载体,文本数据是重要信息和知识的主要来源 [8],在文化旅游中政策的制定具有重大影响和深远意义,因此厘清政策的文本主题信息乃是研究该领域的基石。李斌斌利用LDA模型及八爪鱼采集器,爬取1979~2017年约3000个文化政策的相关文本,进行文本挖掘并获得15个有效主题。基于此进一步探索我国文化相关政策背后的制订逻辑,可视化政策主题文本后,以关键时事热点为突破点厘清各政策主题演化趋势并尝试性地解释演化原因,填补了量化研究的空缺,为未来研究开辟道路 [9]。同时,贫困地区的文化旅游又是文化旅游扶贫的落脚点和重点。斯丽娟立足西北贫困地区基于LDA主题模型视角,收集1986~2019年西北地区政府出台的扶贫政策,提取出政策文本的热门主题和变化趋势,以理论验证西北地区的实践扶贫模式,分别论证以贫困县和以贫困村为重点的开发式扶贫阶段政策主题趋势,指明西北地区未来扶贫旅游发展趋势,提出扶贫模式培育扶贫内生动力进而实现可持续性脱贫 [10]。张艳芳以新闻舆情分析为落脚点,利用LDA模型准确提取“精准扶贫”相关的新闻报道并将“精准扶贫”分为三方面,准确把握了过去现在政策方向后,预测了精准扶贫未来发展趋势,为国家“精准扶贫”工作贡献力量 [11]。
3. 理论分析
3.1. LDA主题提取模型构建
1) 去除停用词
由于不同的游客有不同的语言特点,并且爬取的内容中大量语料是无用或没有意义的,所以在进行样本处理之前要设置一份停用词表,对所获得的评论数据进行过滤,清理掉无用的语料。
2) 分词
分词算法采用了具备高性能、高准确率、高可拓展性的“jieba”库开源分词包,并且采用全模型快速将样本中的词扫描出来,所以在主题确定时还需要对各个主题中的主题元素进行筛选,剔除没有意义和不起作用的主题元素。
3) 关键词提取
经去除停用词和分词后,得到一个完成预处理的.txt文档,将得到的这个文档直接输入到LDA算法中进行LDA主题模型构建,根据设定的确定最小主题数a、最大主题数量d及增量p和来初步训练模型,最终逐步得到主题数为d的训练模型,同时生成各个主题数量下训练模型的字典文档,根据字典生成对应关键词文档列表,其中每个字典文档要根据新词进行更新,例如生成主题数为m的训练模型时得到的字典文档记为doc(m),生成主题数为m-p的训练模型时得到的字典文档记为doc(m-p),doc(m)是由doc(m-p)在生成主题数为m的训练模型时更新得到的,即需要增量保存,字典文档和关键词文档保存后对该模型进行保存。得到对应主题数目的模型后计算不同主题数目下所有模型的困惑度,最终得到一个推荐的最优主题数目。
3.2. ROST CM6情感分析
游客情感分析是对游客带有感情的主观评论进行分析总结,推理并挖掘出用户潜在的情绪态度的过程,在自然语言的处理中,通常是指去判断文本中所隐含的情绪特征。本文使用ROST CM6工具对游客评论数据的情感进行挖掘分析。
在自然语言处理中,文本的情感主要分为两类,一类是积极性,一类是消极性,一定情况下有积极与消极形成的中性。首先对单条评论数据进行预处理,分割成为多个句子或词语,根据ROST CM6中的Emotion Words提取与情感相关的词句,根据其情感类别及其强度值获得每个词语或句子的情感得分,再将同一个评论数据中的情感词句得分累加得到某一条评论的情感得分从而对其情感进行分类分析。在情感词中表现为积极性的词句得分为正数,表现为消极性的词句得分为负数,并且得分越大说明该词句表现出的积极性越强,得分越小说明表现出的消极性越强,同理一条评论数据的情感词得分累加越高,该评论表现出的积极性越高,反之消极性越高,而情感词句累加为0的评论数据表现为中性。
4. 文化旅游扶贫舆情政策分析
4.1. 基于LDA主题提取模型的评论文本分析
4.1.1. 评论样本数据文本数据处理
本文所使用的评论文本数据为在携程网上爬取的2013年至2021年间九寨沟、泸沽湖、雅鲁藏布大峡谷三个地区的评论数据,去除重复和无效评论(图片、表情符号等)后,共采集11,138条评论,总体分布如表1所示:
Table 1. Comment data distribution
表1. 评论数据分布
4.1.2. 评论政策主题提取
本文通过LDA模型对贫困地区中较为著名景区进行主题挖掘研究,将主题数量设置为10,最终提取了10个主题和100个主题元素,即在该主题中出现频率较高且表现性较好但在其他主题种表现性较差的元素,由于一个主题中的主题元素与其他主题中重复元素较多,且主题元素无显著意义,所以最终选取了9个主题,最终保留了9个主题和90个主题元素,并将9个主题名称进行人工定义,各主题及其主题元素汇总如表2所示,括号内为各主题元素对应的权重。
Table 2. The topic and topic elements extracted by the LDA model
表2. LDA模型提取主题及主题元素
定义主题后对已建立的评论数据LDA模型进行困惑度计算,由于进行LDA分析时控制的主题数范围为大于等于5、小于等于10,得到困惑度计算表如下表3所示:
Table 3. The number and perplexity of review text topics
表3. 评论文本主题数及困惑度
可见当主题数增加时困惑度逐渐降低,而当主题数增加到10时,模型困惑度开始上升,即最优主题数为9,符合上述主题数量。
同理对搜集到的政策文本进行处理,预设主题数为15,最终得到最优主题个数为14,包括139个主题元素,如下表4所示:
Table 4. Themes and theme elements table
表4. 主题与主题元素表
进而得到可视化词云图如下图1所示:
Figure 1. Policy word cloud map
图1. 政策词云图
4.2. 基于ROST CM6的在线评论主题情感分析
通过ROST分析的结果表明,在九寨沟、泸沽湖和雅鲁藏布大峡谷景区中游客对旅游业表现出积极情绪的言论所占比例为68.12%,而中性的情绪所占比例为22.51%,消极情绪体现出的评论占了9.37%,这说明游客对景区的整体满意度不高但是不满意的占比也较少,如下表5所示:
Table 5. Analysis of online topic reviews
表5. 在线主题评论分析
4.3. 政策评论文本分析结论
根据对政策文本的LDA分析及可视化词云图可见国家扶贫政策更加侧重于因地制宜发展乡村特色、大力发展农业、电商扶贫、拓展乡村文化旅游产业致力于文化旅游扶贫等方面。
根据对九寨沟、雅鲁藏布大峡谷和泸沽湖三个处于贫困地区的景区进行分析后可知,景区都在积极的发展各地的地理、文化等方面的特色及优势,地理上的优势可以间接地表现为各个景区的自然风光、气候条件以及空气等,这也是因地制宜发展贫困地区优势来获得经济发展最主要的一个途径。再者,一个地区就会有一个地区特有的文化传承,对于游客来说,初来乍到接受一个从未接触过的文化冲击会给其带来一种与众不同的体验,而为了获得这种体验则为发展文化旅游地区的一个较大的优势,也是游客会选择景区的一个重要动机,根据分析我们可以看出各地都在发展景区的美食、民宿客栈等,特色民宿客栈和美食则是游客最直接接触该地区特色文化的手段之一,跟随中央政策,景区通过特色旅游产业的探索可以大力地促进当地的旅游经济的发展。
但是致力于拓展渠道和发展特色文化旅游的同时,景区应该更加重视一下游客对于景区满意度较低的部分的整改。一个景区想要给游客更好的体验,必须要考虑旺季时游客的承载量,这三例景区中普遍出现的一个问题就是旺季时会出现拥挤的情况,并且景区管理出现了一定问题,服务人员的怠工,造成旅游地游客游玩混乱,大幅度地影响了游客的旅游体验,势必会造成旅游经济增长的减缓;正如之前提到的游客倾向于接触该地区文化带来的冲击,但是景区普遍会有各类物品或是门票价格虚高的问题,游客出行的获得感高于付出的成本,才会有较高的满意度,如果游客认为价值远远低于价格就会对景区有不好的影响,比如宰客、门票价格虚高、各项设施都必须收费等,都会影响景区甚至一个地区的整体形象,如何改进和调整也是贫困地区发展旅游业需要重要关注的问题。根据该三个地区的分析有助于把握文化旅游扶贫地区的基本情况和整体面貌。
5. 基于评论政策LDA分析的发展路径探究与建议
根据上文中对九寨沟、雅鲁藏布大峡谷以及泸沽湖的景区游客评论进行分析,结合国家已定政策对文化旅游扶贫地区未来发展路径进行探索并提出建议,根据政策与评论文本的对比,可知景区以政策为导向可以进行的改进方向。
对于景区而言,根据“素质”“人才”等词与景区情况的对比,景区应该加大对景区工作人员的管理,引入或培养一批具有相关专业能力的人才对景区进行更加有效的管理,从而加强景区工作人员应急服务、旺季突发事件处理的能力培养,实施更加有效的淡旺季景区管理方案,避免因为管理不当等人为因素造成游客满意度的降低从而影响旅游经济的发展。
对于旅游地政府而言,根据“监管”“教育”“整治”等关键词与旅游地情况的对比中可见,应该加大对景区以及旅游地居民的监管和教育,规避景区滥收费、宰客等增加游客旅游成本的事件,加大处罚力度的同时对旅游地居民进行宣传教育,提高其远见和激发居民发展当地经济的主人翁意识,促进经济发展。“特色”“文化”“新产业”等关键词可见,旅游地不应该仅仅着眼于旅游地自然风光等的宣传和发展,更应该注重当地特色文化的宣传以及合理使用,利用当地特色文化发展形式多样的特色文化产品以及开创当地的新产业,积极发展农业以及乡村田园特色休闲设施,推动整个贫困地区经济的发展。基于“补贴”“帮扶”等关键词,旅游地应出具一定优惠补贴政策鼓励具有地理条件优势的居民积极创业,开设特色民宿、特色食品等。
对于政策的制定而言,需要考虑政策在景区实施的实际情况进而改进。根据政策文本中的“资金”“补助”等关键词结合政策中“贵”以及负面情感宰客等,可见政策中资金补助的环节可能出了一定的问题,如果旅游地补贴实施到位,居民生活水平提高势必不会有此类问题;再者,也反映出了政策实施方案的缺失,应多加考虑政策实施后的反馈情况,及时调整修改以及对政策的实施进行合理的监督。由此可以对景区、旅游地以及政策制定方的未来发展以及存在的问题及时提供解决方案,有一定的借鉴意义。
基金项目
大学生创新创业训练项目(项目编号:202010616026)。
文章引用
陈 靖,李 玲,陈博睿. 基于LDA的文旅扶贫政策引领旅游地发展路径探索
LDA-Based Cultural Tourism Poverty Alleviation Policy to Lead the Exploration of the Development Path of Tourism Destinations[J]. 可持续发展, 2022, 12(04): 1115-1123. https://doi.org/10.12677/SD.2022.124125
参考文献
- 1. 王一帆, 韩韵珩. 基于复杂网络模型的南疆四地州精准扶贫绩效水平评价[J]. 电子技术与软件工程, 2021(1): 177-179.
- 2. 梁晨晨, 李仁杰. 综合LDA与特征维度的丽江古城意象感知分析[J]. 地理科学进展, 2020(4): 614-626.
- 3. Zou, F.-F. and Chen, Q.-H. (2018) The Community Adaptation of Pro-Poor Tourism in the Ethnic Vil-lage: A Case Study of the She Ethnic Chixi Village in Fujian Province. Advanced Science and Industry Research Center: Science and Engineering Research Center, 254-258.
- 4. Wen, S.X., Cai, X.M. and Li, J. (2021) Pro-Poor Tourism and Local Practices: An Empirical Study of an Autonomous County in China. SAGE Open, 11, 1-8. https://doi.org/10.1177/21582440211022740
- 5. 杨秀璋, 宋卓远, 赵凯, 等. 基于LDA模型和情感分析的贵州景点舆情分析研究[J]. 现代计算机, 2021, 27(25): 36-43.
- 6. 张学民, 赵明宇. 基于LDA和情感分析的西塘古镇旅游形象研究[J]. 河北工业大学学报(社会科学版), 2020, 12(3): 23-30.
- 7. 朱哲慧, 朱梦然, 朱梦茜, 石睿, 袁勤俭. 基于网络大数据的旅游目的地形象同质化研究——以江南古镇为例[J]. 中国旅游评论, 2021(2): 116-130.
- 8. 魏伟. 基于条件共现度的文本表示与特征抽取方法研究[D]: [博士学位论文]. 大连: 大连理工大学, 2018.
- 9. 李斌斌. 基于LDA模型的我国文化政策主题演化研究(1979-2017) [D]: [硕士学位论文]. 上海: 上海大学, 2019.
- 10. 斯丽娟, 尹苗. 新中国70年西北地区扶贫开发模式的演进与创新——基于LDA主题模型的分析[J]. 兰州大学学报(社会科学版), 2019, 47(6): 94-105.
- 11. 张艳芳. “精准扶贫”重要思想下新闻舆情及演化分析[D]: [硕士学位论文]. 北京: 北京工业大学, 2019.