且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

舆情分析技术

更新时间:2022-10-01 22:42:58

通常来说,舆情分析的技术手段主要有以下五种:

舆情分析技术分享
一、热点话题和敏感话题识别技术
这种技术是在一定的时间范围内,根据网络舆情的流传扩散范围和网民关注程度,判断网络话题的热度。话题出处的权威度、相关内容的浏览量、转载量和网民评论数量等都是识别固定时间段内热门话题的主要参数。

话题的敏感度主要是利用布控的关键字和语义分析进行识别,其中首先要将关键词表中的关键词通过字音变换、字形变换、插入无效符号、图像化以及它们之间的变形组合来扩充关键词库;然后,将每个关键词前两个字对应的拼音编码值组合起来作为索引号,建立一个关键词索引表;最后,根据扩充的关键词库和拼音编码索引表,对关键词从拼音匹配到字型匹配程度进行打分排序,找出可能的敏感词。

二、舆情情感倾向分析技术
互联网已成为用户表达观点、态度、情绪的平台,这些内容更具强烈主观色彩,一定程度内,负面情绪聚集会对舆情走势产生不可估量的推动作用。这种技术就是对网络舆情在各种观点的交织碰撞下产生的多种情绪,通过计算机手段分析舆情文本内容蕴含的各种非内容或非实时信息,为舆情研判进一步提供依据。本质上,这是情感信息的分类问题,主要集中在文本客观性分类、词的级判类别、语气分类等方面。

目前主要有两种研究思路:一是统计所有词汇的倾向性,根据其评分正负来判断文本倾向性;二是目前最流行思路是根据词汇倾向性训练出语义倾向分类器,效果好于前者。同时情感倾向分析方法、情感词典构建、语料库建设和系统建设也成为该技术的研究重心。

三、话题跟踪与检测技术
话题检测包括以下四方面的工作:报道切分、话题关联识别、新话题发现和话题跟踪。首先要将一个舆情信息流切分为不同的话题文档,然后判断不同文档之间的关联程度,并对其进行排序,之后判断这些不同的文档是否转向了一个新的话题,这也成为该过程中最有难度的一个步骤。话题跟踪就是在后续报道中跟踪检测与新话题相关的所有报道。

四、网络文本自动分析和自动摘要技术
这种技术通过利用计算机自动化处理和人工智能技术手段采集指定网站上的舆情文本,根据文档内容自动抽取其主题,然后经过自然语言处理技术加工生成的文本摘要。它可以帮助用户无需阅读全篇文章,就能快速了解文章大意和核心,从而提高用户的阅读效率。

五、舆情预警和引导技术
它是基于以上四种技术的基础上,将分析结果通过数值、图表等直观方式表现。与此同时,按照安全、轻度、中度、重度和危险五个等级评估网络舆情的危机态势,一旦舆情危机程度为中度以上,则向指定对象发布相应的危机处理提醒。舆情引导技术就是根据舆情危机预警态势,辅助决策部门判断目前的舆情情况,并策划、发送相关舆情疏解信息,让网民及时了解真相,潜移默化地引导舆论走向。
文章部分内容摘选自《网络舆情监测:理论与实践》-郝晓伟,侵删)

识达科技舆情监测分析服务免费体验入口