一、引言
随着互联网的快速发展,网络媒体作为一种新的信息传播形式,已深入人们的日常生活。网民言论活跃已达到前所未有的程度,不论是国内还是国际重大事件,都能马上形成网上舆论,通过互联网来表达观点、传播思想,进而产生巨大的舆论压力,达到任何部门、机构都无法忽视的地步。可以说,互联网已成为思想文化信息的集散地和社会舆论的放大器。[1]
根据2013年1月中国互联网络信息中心(CNNIC)在京发布第31次[2]《中国互联网络发展状况统计报告》显示,截至2012年12月底,我国网民规模达到5.64亿,全年共计新增网民5090万人,互联网普及率为42.1%。随着高校校园网络的建立和不断完善,社会上的焦点问题、偶发性事件、关系到学生切身利益的问题以及具有煽动性的、失实的或反动的舆论等,通过各种信息平台诸如BBS论坛、博客,以及时下非常流行的微博采用跟贴、转贴、评论等交流方式进行信息传播,形成网络舆情,成为影响大学生思想和行为的新兴力量。如何对高校校园网络舆情进行监测、分析和预警,并有效的规范化管理和监控,及时控制、有效化解影响校园稳定的消极网络舆论,引导高校网络舆论朝健康的方向发展,构建和谐校园,是高校管理工作中非常重要的研究课题。
高校网络舆情的涵义、内容及特征
1.网络舆情的涵义
网络舆情(Internet Public Sentiment IPS )就是由于各种事件的刺激而产生的通过互联网传播的人们对于该事件的所有认知、态度、情感和行为倾向的集合。
2.高校网络舆情的涵义和内容
高校网络舆情主要形成于学校新闻网站、学生网站、论坛(BBS)、博客(BLOG)及微博(MicroBLOG)等载体,一般以发生在学生身上、周围的事件或关系切身利益问题为客体,与舆论主体的学生根本利益一致,但因为个体的差异性和具体利益关系的不同,会对同一事件在较为集中的范围内产生带有群体性的意见、情绪和行为,形成“舆论场”。[3]
高校网络舆情的主要内容包括:第一,国内外热点问题;第二,与学生利益密切相关的事件;第三,校园突发或偶发事件。面对国际政治、国内焦点到学校新闻、日常管理与服务,大学生都会在网络上引起强烈的反响和激烈的辩论,形成强大的舆论影响。[4]
3.高校网络舆情的特征
高校网络舆情形成于秉承知识性和开放性理念的高校这一特殊环境,除了具有一般网络舆情的突发性、快速传播性、广泛性等特征外,还有着自身显著的特征:一是主体身份的特殊性。大学生是高校舆情的主体,其年龄、心理、思维习惯以及他们在社会中所扮演的角色使他们在意见、态度和情绪表达上呈现出特有的方式,有别于其他群体的特点;二是突发性。校园内学生访问的站点相对较为集中,网络舆论的形成往往非常迅速,一个热点事件的存在加上一种情绪化的意见, 就可以成为点燃舆论的导火线;三是非理性。高校学生在网络环境之下易于受到各种资讯、各种舆论的影响,容易形成一种带有情绪化的非理性舆情。四是群发性。高校网络服务完善,学生上网极为方便,而且不少学生拥有自己的电脑,通过BBS,新闻点评和博客网站,学生可以立即发表意见,各种消息的快速传播极易造成群体性的情绪波动,甚至导致游行、集会等群体性事件。[4]
国内外网络舆情研究与关键技术现状
(一)国内外网络舆情研究
国外对网络舆情的研究起步较早,发展也较为迅速。欧盟委员会从1973年就开始监测其成员国的民意演变,以期能在他们进行文案制备、决策制定和工作效果评估等工作时起到辅助作用。美国国防高级研究计划署(DARPA )[5]于1996年倡导研究的一项新技术,旨在依据事件对语言文本信息流进行组织、利用,也是为应对信息过载问题而提出的一项应用研究。后来确定用漏报率和误报率[6]作为评价指标来评价该技术的性能,另外还有一种方法是建立识别错误权衡图来直观的描述该技术发生错误的情况,并从1998年开始主持了话题识别与跟踪系列测评会议[7],从而奠定了舆情监测领域的行业标准。
国内对网络舆情的研究起步较晚,发展也较为迟缓[7]。2006年人民日报社网络中心成立的舆情监测室是国内最早从事互联网舆情监测、研究的专业机构之一,拥有众多具备舆情分析相关专业背景的研究人员,在舆情监测与研究、危机应对和舆论引导等领域处于国内领先地位。此外北大方正技术研究院、北京理工大学、中科院自动化所等大学和研究机构也先后开始了舆情监测方面的研究。[8]
当前,市场上己经有了部分比较成熟的舆情产品,并开始为用户提供舆情监测服务。如TRS公司推出的网络舆情监控解决方案,能够在舆情信息收集和舆情分析挖掘两个方面提供实用化的技术的解决方案。中科院自动化研究所实施的“天网”工程舆情安全体系为保障国际安全、国家安全、社会安全、商业安全和个人安全提供信息服务与决策支持。北大方正技术研究院的智思舆情预警辅助决策支持系统,实现了对互联网舆情自动的监测分析,有效地减少了政府部门在舆情监测方面的人力和物力方面的投入,为加强互联网信息监管,组织力量展开信息整理和深入分析起到了一定的促进作用。此外,中科点击、谷尼国际等众多公司页相继开展舆情监测系统的研发。[9]
网络舆情监测关键技术概述
网络舆情监测系统是一个复杂而庞大的系统,它是近年来人工智能技术的重大应用,整合互联网搜索技术及信息智能处理技术.通过对互联网海量信息自动抓取、自动分类聚类、热点发现和分析、专题聚焦等[10],实现对网络舆情监测和新闻专题追踪等需求,形成多种形式 的分析结果,如简报、报告、图表等.为政府部门、高校及企业全面掌握网络舆情、争取处置主动权提供有效分析依据。网络舆情监测系统涉及的技术繁多,其内容涉及多个领域,是一项综合技术研究课题,本文通过对已有技术和知识进行分析总结的基础上,重点介绍网络舆情监测中各关键技术的研究现状。
1.网络信息采集技术
随着互联网上信息的急剧增长,以及网络信息的复杂和非结构化等特点,现在己有的舆情监测系统主要采用元搜索技术和网络爬虫的方法采集舆情信息。
(1)元搜索技术。目前,人们从互联网获取信息的主要方式是通过搜索引擎,一种更全面获取信息更多的方法是采用元搜索技术[11]。元搜索通过将多个单一搜索引擎集成在一起,将用户的检索提问同时提交给多个独立的搜索引擎,同时检索多个索引库,将多个搜索引擎的检索结果进行二次加工,如对检索结果去重、排序、过滤等,其搜索到的结果将比搜索单一搜索引擎的结果检索数量更多、信息更全。同时采用元搜索技术不需自己收录整个互联网中的信息就可以获得查询结果,其复杂性较低。
(2)网络爬虫技术。网络爬虫(Crawler)[12]是一种按照一定的规则,自动的抓取网络信息的程序或者脚本。根据预先设定的一个或若干初始种子URL开始,以此初始化爬虫的URL抓取队列,在爬行过程中不断从URL抓取队列中获得一个的URL,进而访问并下载该页面,页面下载完成之后网页信息抽取程序将页面信息保存,同时将当前页面上抽取到的新的URL保存到URL抓取队列,直到满足系统停止条件。