网络舆情监控是了解信息、提高舆情应对能力、合理呼应社会需求、及时化解矛盾,确保社会经济稳定发展的必要工具。
网络舆情监控系统一般涉及如下模块:数据采集、数据处理、舆情分析、舆情展示、网络舆情监控系统管理。
网络舆情监控的基本前提是采集到有效数据,也就是设定有效的舆情信息热点和信息采集空间。通常来说,舆情信息热点主要包括主流意识形态、社会重大事件、突发事件、政府改革和政策调整、民生问题以及媒体关注热点等。
情信息采集空间主要有政府网站(如中国政府网等)、商业网站(如新浪网、搜狐网等)、新闻类网站(如新华网等)、地方网站(如首都之窗、千龙网等)、BBS 及网络社区(如天涯社区等)、时事论坛、博客、社交网络、微信朋友圈等。
舆情信息采集技术与前面介绍的不良信息采集类似。在舆情信息获取过程中,需要根据系统需求来设定主题目标,并结合使用人工参与和自动采集等方法来完成信息采集。在信息采集时,可以设定 URL 来源、采集栏目及采集频率(更新时间、扫描间隔等)。
舆情信息分析的前提是数据预处理,具体包括数据格式转换、信息滤除、数据统计等,其作用是分析和过滤网页内容,去除广告、版权、栏目等无用信息,以精确获取目标内容主体。
舆情分析的关键技术有搜索引擎和文本挖掘等技术。搜索引擎通常使用文本分词、文本分类、文本聚类、敏感词过滤、观点倾向性识别、主题检测、主题跟踪、专题聚焦、自动摘要等文本信息内容识别技术。
舆情分析应具备数据智能分析功能,包括热点发现、热点追踪、热词挖掘以及智能关联等。
最新舆情:实时展现最新获取到的舆情信息
分类浏览:将舆情分类为正面舆情、负面舆情、突发事件等
舆情来源:根据用户选择的来源网站显示舆情信息
本地浏览:分为本省和省外显示舆情信息
信息要素:显示舆情标题、摘要、高频词数、点击数、回帖数、来源网站等
近期热点:按舆情热度、点击数、回复数、转载数、时间顺序显示
舆情统计:每一个舆情浏览都有显示舆情分析图
网络舆情预警的主要目的是对网络热点话题、重大事件、突发事件等舆情动向进行快速识别与定向跟踪,对重要事件进行快速发现与处理,从而为相关部门提供情报参考,并对舆论和宣传进行倾向性引导。这是个涉及到多方因素和多个变量的系统工程,其指标体系的构建涉及指标体系设计和评估方法建模两部分。
网络舆情预警指标体系设计:
构建网络舆情指标体系的目的是实现网络舆情信息的量化,通过明晰网络舆情信息采集的来源、范围和方向,来全面掌握网络舆情的演进形态,并利用预警指标进行综合评估,以发现网络舆情的潜在问题,进而实现对网络舆情信息的客观判断和管控治理。
网络舆情指标体系通常从时间维、数量维、显著维、集中维、意见维 5 个维度来考虑。
网络舆情预警评价方法建模:
网络舆情预警评价本质上是定性与定量相结合的综合评价问题。
定性与定量相结合的综合评价的要义是按照层次方式制订出多层指标体系,同一层的各要素指标以其上一层指标要素为准则进行两两重要程度判断,从而建立判断矩阵,通过加权递阶来逐层确定各要素的权重值,终根据各要素加权求和来综合计算其量化评价值。
实现这种评价思路通常采用层次分析法(AHP)、网络分析法(ANP)与德尔菲法等方法相结合,来确定各指标要素的权值。此外,可以采用模糊综合评价方法,包括 5 个步骤:确定对象集和因素集、建立评语集、确定权重集、建立模糊隶属度矩阵、给出综合评判结果。