舆情监测分析一 数据采集
明确分析的目的和需求后,通过不同来源渠道采集数据。
舆情监测分析二 文本清洗和预处理
文本清洗首要是把噪音数据清洗掉,然后根据需要对数据进行重新编码进行预处理。
舆情监测分析三 分词
在实际进行分词的时候,结果中可能存在一些不合理的情况。因此,在基于算法和中文词库建成分词系统后,还需要不断通过训练来提升分词的效果,如果不能考虑到各种复杂的汉语语法情况,算法中存在的缺陷很容易影响分词的准确性。
舆情监测分析四 词频和关键词
词频就是某个词在文本中出现的频次。简单来说,一个词在文本中出现的频次越高,这个词在文本中就越重要,就越有可能是该文本的关键词。
舆情监测分析五 语义网络分析
语义网络分析是指筛选统计出高频词以后,以高频词两两之间的共现关系为基础,将词与词之间的关系进行数值化处理,再以图形化的方式展示词与词之间的结构关系。这样一个语义网络结构图,可以直观的对高频词的层级关系、亲疏程度进行分析展现。
舆情监测分析六 情感分析
情感分析,主要是分析具有情感成分词汇的情感极性(即情感的正性、中性、负性)和情感强烈程度,然后计算出每个语句的总值,判定其情感类别。还可以综合全文本中所有语句,判定总舆情数据样本的整体情感倾向。
【文章声明】识微科技网倡导尊重与保护知识产权。本网站文章发布目的在于分享舆情知识。部分内容仅是发稿人为完善客观信息整理参考,不代表发稿人的观点。未经许可,不得复制、转载、或以其他方式使用本网站的内容。如发现本网站文章、图片等存在版权问题,请及时联系并发邮件至zhangming@civiw.com,电话:4008299196,我们会在第一时间删除或处理相关内容。