“大数据”对传统媒体新闻生产模式的重构

“大数据”对传统媒体新闻生产模式的重构

作者:深圳报业集团2015年新入职员工 杜贺 李楚玲 赵盼盼 李庭新  2016-06-21 19:41  新传播    【字号:  

  从本质上来讲,“大数据”是一种分析技术和分析工具。目前,大数据给传统媒体新闻生产模式带来冲击的同时,也带来了发展契机。因此,传统媒体在新闻生产的过程中要充分利用“大数据”,使之贯穿新闻生产的各个环节,完善新闻生产模式,从而实现传统媒体的转型与融合发展。

 

【关键词】大数据 新闻生产 融合发展

 

随着网络技术的成熟、云计算的兴起、智能终端的普及、物联网技术的发展和电子商务、社交网络、电子地图的全面应用,“大数据”逐步渗透到各行各业。传统媒体的新闻生产模式也受到严重冲击,新闻生产的各个环节都受到“大数据”的影响。传统媒体要紧紧抓住“大数据”带来的发展机遇,从数据的采集与提取、数据的分析与挖掘,到数据的呈现,再到数据的反馈,都应充分利用“大数据”。

 

一、“大数据”的实质:技术和工具

 

“大数据”真正爆发是在2011年5月Mckinsey研究所公开发表《大数据:下一个创新、竞争和生产率的前沿》之后。关于“大数据”的概念众说纷纭,学界并未对“大数据”的定义达成共识。“大数据”既是数据量的激增,同时又是数据复杂性的提升。“大数据”之“大”不仅在于其“大规模”“大容量”,更在于其“大价值”,即数据在大规模地增加,通过这些数据的分析、整合、存储和互换,人们可以发现新知识,创造新价值,带来“大知识”“大科技”“大利润”和“大发展”等。大数据具有“4V”特征,即Volume(大量)、Velocity(速度)、Variety(多样)和Value(价值),详情见图1-1。

 

 

图1-1 大数据“4V”特征图

 

从数据量级层面讲,“大数据”中的数据不再以几个MB、GB或TB来衡量,而是以PB、EB或ZB来衡量,以数据量级的变化表示大数据的演化历程如图1-2所示。数据量级的变化和有效存储、分析数据的能力紧密联系在一起,每一次数据存储、分析能力的提高都伴随着数据库技术的更新与发展。“大数据”除了包含规模庞大、结构复杂的数据外,还包括这些数据的处理技术,即大数据技术。“大数据”不仅是一个概念、一种技术,也是一种对当下社会状态的描述,即“大数据时代”。本文侧重于将“大数据”的实质定义为一种分析技术和分析工具。

 

 

图1-2 “大数据”的演化历程图

 

二、“大数据”给传统媒体新闻生产带来契机

 

目前,数据成为重要的生产要素和社会资源,已渗透到包括传媒产业在内的各行各业。“大数据”对传统媒体尤其是传统纸媒的冲击显而易见,传统媒体长期沿袭下来的新闻生产方式也受到“大数据”严重冲击。当数据成为新闻生产的核心资源时,与数据有关的统计、分析和挖掘技术,也就成了新闻生产新思维的重要工具。“大数据”虽然给传统媒体新闻生产的各个环节造成一定程度的冲击,但同时也给传统媒体生产带来新的发展契机。

(一) “大数据”改变了传统媒体新闻内容获取方式

在新闻内容的获取方面,传统媒体更多的依赖专业的新闻记者,在“大数据”的影响下,“人人”均是新闻内容的获取者和生产者,传统的“记者在现场”变为“我在现场”的模式。另外,在“大数据”的影响下,新闻不再是“跑”出来的,而是新闻记者在分析数据的基础上产生的,新闻记者要分析与某一事件相关的所有数据,而不是随机抽取部分数据,要分析数据间的相关关系,从而为“用户”提供优质新闻。

(二)“大数据”优化了传统媒体新闻加工的流程

大数据分析是在强大的支撑平台上运行分析算法发现隐藏在大数据中潜在价值的过程,例如隐藏的模式和未知的相关性。一方面,在“大数据”的影响下,新闻生产中的新闻可以更恰当地分析挖掘出数据与数据间的相关关系和隐藏在数据背后的价值,即加工“深度新闻”,并进行深度报道。另一方面,传统媒体的新闻选题更多的集中于已经发生或正在发生的事实,而在“大数据”的影响下,预测性新闻成为可能。

(三)“大数据”完善了传统媒体新闻内容的呈现方式

传统媒体新闻呈现主要采用文字、视频、音频、图片等简单形式,而在“大数据”影响下,新闻可以变得更加生动、形象,各种可视化图表、数据新闻、信息地图、图解、图示等运用在新闻的呈现上。在大数据时代,数据不仅可以辅助新闻报道,而且还可以“独当一面”,以纯粹数据新闻的形式出现。“大数据”使数据成为新闻生产的核心资源,但这并不意味着新闻报道是单纯的数据叠加,而是利用可视化技术实现新闻内容的可视化呈现。

(四)“大数据”提升了“新闻用户”数据反馈的价值

在“大数据”影响下,“新闻受众”实现了向“新闻用户”的转变。新闻生产重视良好的用户体验,追求新闻传播的互动性和对上一轮数据的再使用,新闻传播路径由传统的单向线性传播,转换为非线性传播,即双向、互动的传播路径,强调用户的自主选择和反馈。用户是新闻生产和传播的出发点与落脚点。大多数情况下,“新闻用户”的数据反馈也是以大规模数据的形式展现,通过数据挖掘技术,挖掘各反馈数据间的相关关系,形成清晰、明确、系统的“数据关系网”,使得“新闻用户”的意见和态度得到更充分的呈现,对用户的行为习惯在原有的基础上进行再分析、再加工。因此,数据的采集与提取、数据的分析与挖掘、数据的呈现、数据的反馈,应充分利用“大数据”,使“大数据”贯穿新闻生产的各个环节(如图2-1所示)。

 

图2-1 “大数据”影响下的新闻生产流程图

 

 

三、“大数据”对传统媒体新闻生产模式的重构

 

(一)数据的搜索与采集

1. 数据搜索:找准数据“入口”

在信息浩如烟海的大数据时代,很多时候采集数据的关键就是找准“入口”,而由欧洲新闻学中心和开放知识基金会开发的《数据新闻手册》一书则为我们提供了一些简单的搜索建议。一要精细搜索关键词。当搜索数据时,一定要包括与所要寻找的数据内容相关的搜索术语以及格式或来源的信息;二要善于从网络的专用数据端口、数据中心以及其他数据站点获得数据。在对数据进行搜索时,可以利用官方数据门户、data.hub、scraperwiki、Datacouch、Freebase等专用数据端口或数据中心;三要充分利用网络论坛,如Get The Data、Data Driven JournalismList和NICAR-L邮件列表等。

2.数据采集:准确把握数据采集路径

在大数据时代,数据通常有两种采集路径(如图3-1所示),一是从问题到数据,即先提出问题,然后根据问题寻找相关数据;另一种是从数据到问题,即从海量数据中发现、提出问题。

 

 

图3-1 数据采集路径图

 

(1)从问题到数据:关注当下,紧贴热点

《卫报》围绕“2012年美国总统大选”这一主题进行了数据收集,主要是充分利用美国政府公开的各种数据库。专辑中的55篇报道,不仅有与总统选举直接相关的选票数据、各州宣布选举结果的时间、竞选资金募集情况等内容,还涵盖了各种经济数据、美国人口基本特征统计数据以及各种社会数据(如超级富豪、贫困人口的数量及分布情况)等诸多相关背景资料。从问题到数据这种采集路径,本质是从受众出发。问题的产生和新闻热点的形成是由一个量变到质变的过程,而其生产者正是广大受众。

(2)从数据到问题:发挥内容优势

2015年8月6日,在首届“中国互联网移动社群大会”上,腾讯QQ联合企鹅智酷发布了《中国移动社群生态报告》,通过腾讯QQ独家大数据及海量网民调研,用数据揭秘“群社交”,全面勾勒出国内移动社群生态现状。腾讯通过对其拥有的大量用户信息和社交数据进行分析挖掘,实现事实和事物之间的相互连接,充分发挥了自身的优势。传统媒体也应在准确定位的基础上,发挥自身在内容生产上的优势。传统媒体在内容生产上存在领先优势,特别是在政治、经济和民生等方面,从图3-2(网易、腾讯、《南方都市报》、《新京报》四家媒体的数据新闻运营状况图)中可以看出,数据新闻在这几方面也是涉略得比较多。因此,传统媒体应多留意此类信息,定时进行信息的整理和提取,从数据中发现规律,从现象中归纳本质,进而形成相应的专题报道和跟踪报道。

 

 

图3-2 网易、腾讯、《南方都市报》、《新京报》数据新闻的运营状况图

 

(二)数据的处理与挖掘

1.数据处理:对数据去粗取精、删繁就简

当搜集了足够多的数据之后,为保证数据的质量和数据新闻的可信度,需对数据进行全面谨慎的处理。在对搜集所得的资料、讯息和数据进行处理的时候,可依次按照漂白法、比较法和组合法对其进行深一步的筛选和分析。

首先,利用漂白法对数据进行清洗,对数据的来源、信度和效度进行充分验证。数据作为传统新闻报道中的信息源,在使用数据的同时应该注意对其来源、信度和效度进行验证,提高数据的可信值和有效性。其次,利用横向比较法和纵向比较法对清洗后的数据去粗取精、删繁就简。横向比较的对象主要是时下的“新数据”,纵向比较则倾向对比以往的“旧数据”。传统媒体需借助Excel、Goole Docs、Goole Refine等软工具对不完整的数据、错误的数据、重复的数据进行剔除。最后,利用组合法将数据连接成“数据网”,将数据置于特定的语境中进行解释,从而使孤零零的数据成为具有逻辑性的新闻故事。

2.数据挖掘:夯实深度报道的基础

首先,数据挖掘服务于深度报道。在数据挖掘的过程中,新闻生产者应当力求发掘数据背后的故事,探求事件的发生过程、关联事件,并尝试分析数据对未来的影响。如在2011年英国伦敦暴乱事件中的报道中,《卫报》的工作团队采用了大量的数据,通过获取社交媒体Twitter上用户的260万条关于暴乱的信息,进行数据挖掘,发掘背后的联系,还原大众事情的前后经过,理解事情的进展以及背后的原因。

其次,数据挖掘也可服务于预测性报道。从本质上来讲,预测性报道属于深度报道,但又相对独特。制作预测性报道的关键,就是如何把现在的新闻转换成知识。具体做法是把现有新闻建立事件知识库,每个新闻都有一个专题,当热点事件发生的时候,每个专题会有滚动新闻,这个滚动新闻可以作为这个事件之后产生的知识。比如说地震之后,地震报道、援助、重建的话题,有的地震会引发海啸、核辐射,因此可以把已经发生的新闻信息作为未来相似事件产生之后的参考,为今后相似事件提供服务。

(三) 数据呈现:对数据进行可视化呈现

在大数据时代,不仅要懂得如何获取数据、分析数据,而且需要懂得呈现数据,其中呈现数据的主要方式就是数据可视化。数据可视化不仅可以简单明了地揭示新闻要点、梳理新闻进程,而且可以直观形象地展示“数据关系”、揭示新闻深层现象。现阶段国内外普遍使用的主要方式包括信息图表类工具、时间线类工具、用于数据地图的工具。

1.信息图表类工具

信息图表是一种将数值型和文本型的信息形象化、可视化的方式,其作用主要表现为呈现数据、提示要点、图解过程、梳理进程、揭示关系、展现情状、整合内容、表达意见、分析解读等。信息图表除了一般静态的信息图表外,还包括动态信息和交互式信息图表。比较常用的信息图表类工具主要有Google chart、Tableau、Data-Driven Documents(D3.js)等。在《纽约时报》的数据新闻中,通常使用这一可视化的工具,例如“512 Path to the White House”作品。

2.时间线类工具

时间线类工具是基于时间顺序的可视化工具,在表现数据在时间维度上的演变上有重要作用。时间线类工具的应用清晰地展现新闻事件中随着时间推移而带来的变化发展,同时也能增加新闻报道的信息量,提高受众的参与感。现在比较常用的时间线类工具主要包括Timetoast、Xtimeline、Timeslide、Dipity等。

3.用于数据地图的工具

数据地图就是承载着大量数据的互动式地图,数据地图多用于涉及地域性的新闻。数据和地图的结合,不仅让数据的表现方式更加多样,而且为单调的地图带来了生机,产生更大的价值。使用数据地图来呈现新闻,不仅空间感强,还能让读者对数据有更加全面立体的理解,使人一目了然。在数据地图类工具中,最常使用的软件工具主要有Leaflet、Google fushion tables等。例如,针对2015年发生的天津爆炸案,澎湃在极短的时间内利用Html5呈现了爆炸的现场情况,制作出《互动地图 致畸胎年金滨海新区爆炸案现场》,在移动终端上广泛传播;新浪图片也即时发布了爆炸的卫星监测图像。

 

四、数据反馈:为今后类似的新闻生产和报道提供决策参考

 

大数据技术不仅用于数据新闻的生产和呈现,他还是作为优化新闻反馈的重要手段。受众的反馈在新闻生产过程中的地位毋庸置疑,甚至被称为新闻改革的主要动力。数据的反馈是指通过对新闻受众数据的收集、分析,为今后类似新闻的生产与报道提供决策参考,从而为精准预测提供依据。据Netflix称,他们将动用其2900万用户的庞大数据库进行分析,对用户的喜好和视频选择方面进行分析和预测。通过这样的数据分析,不仅能够对受众偏好、兴趣有一个较为概括的认识,同时能够对传播内容的受欢迎程度,以及什么题材和话题更受追捧有一个较为准确的认知,为今后类似的新闻生产与报道提供决策参考。

编辑:郑晓鹏

打印本页】【关闭窗口】【复制地址

往期回顾

© COPYRIGHT 2014 ALL RIGHTS RESERVED. 深圳报业集团版权所有,未经书面授权禁止使用。