从“表示”版的实践看数据新闻的现状与方向

作者:深圳报业集团2015年新入职员工 杨国要 何翼 胡培心 康碧艳 林小玲  2016-06-20 16:49  新传播    【字号:  

  《深圳晚报》在2014 年5 月26 日再次改版后,增设了“表示”版面,这一版面版式简洁、醒目,注重信息可视化,是深圳晚报在数据新闻领域的尝试和探索。本文通过对“表示”版面的统计分析,借鉴国内外优秀报纸的实践经验,结合实际情况,探讨数据新闻存在的问题和改进方向。

 

【关键词】技术革命 数据新闻 可视化

 

一、数据新闻是一种报道方式

 

信息技术的发展带来数据的爆炸式增长,让新闻不再是单纯的一种对“新近发生的事实的报道”,而是需要借助各种工具,通过筛选和分析,找出复杂数据背后的关联,呈现事态变化发展背后的真正含义转变,并通过恰当的方式展示这些数据,帮助公众更好地理解复杂数据背后的意义和价值。万维网创始人伯纳斯·李甚至认为数据新闻代表着未来,未来的记者必须“要钻研数据并借助数据工具进行分析、筛选出令人关注的信息。对信息加以正确地处理,帮助人们真正看到它反映了什么,这个国家正在发生什么”。 ①中国人民大学新闻与社会发展研究中心研究员方洁等通过考察全球视野下的媒体实践人员的总结、相关网站的文章阐述,发现大部分人主要是从新闻呈现形态、新闻生产流程和新闻行业发展等三个角度去理解数据新闻。通过处理大量复杂的数据,将数据背后的关联性与扣人心弦的故事结合起来,不仅仅打破了传统新闻报道以文字叙述为主、图片、图表为辅的呈现方式,还改造了新闻生产流程。因为在反复抓取和筛选数据的过程中,原始的数据变成了有意义、有价值的信息,再经过可视化的呈现,公众可以从中获得更多的信息。方洁认为,数据新闻的内涵就是“基于数据的抓取、挖掘、统计、分析和可视化呈现的新型报道方式”。②

事实上,通过新闻与数据结合提高新闻报道的准确性和客观性,并非新鲜事物。早在1952 年,美国哥伦比亚广播公司就通过“计算机辅助新闻”(Computer Assisted Reporting,简称CAR)的方式来预测当时的美国总统选举。上世纪60 年代之后,这种通过借助大型计算机器以及后来的PC 机,从不断开放的政府和商业数据库中挖掘数据,以获得相关的新闻事实和便于进一步的深入调查。美国著名学者菲利普·迈耶(Philip Meyer)将“任何采用计算机获得信息和分析的报道”都称为计算机辅助新闻。③最核心的一点是,三者中的核心概念“数据”发生了很大的变化。相对于上世纪70 年代,无论是在美国还是全球范围内,数据的量,以及人们对数据的认识都发生了巨大改变。一般认为,在“大数据”时代,数据的来源主要分为政府等机构日常发布的传统数据和互联网等产生的新型数据。④

综上所述,本文探讨的数据新闻,是指基于数据的挖掘和统计分析发现新闻线索,通过可视化的呈现方式将数据之间的关联性及背后的价值表达出来的一种新闻报道方式。

 

二、国外数据新闻的实践和建树

 

近几年,数据新闻在各大媒体中也逐渐流行起来。越来越多的媒体都通过这一形式的新闻助力媒体转型。

2009 年1 月,英国《卫报》组建了专门的团队,并在其网站开设了“数据博客”(data blog)栏目,率先进行了专业化的数据新闻生产。自成立之初,《卫报》团队就是以数据为导向,通过谷歌表单等基础工具,来分析公开的数据,并将之可视化。最后,编辑和记者用这些数据为报纸和网站提供新闻故事。卫报数据新闻编辑西蒙·罗杰斯(Simon Rogers)曾表示,积累原始数据,与数据搏斗,是他一贯的工作逻辑。⑤

在数字化转型过程中,《纽约时报》也在其网站上尝试了数据新闻,并成立了专门的互动新闻技术部(Interactive News Technologies Department)。说起纽约时报与数据新闻的渊源,最早并且是最有影响力的当属《雪崩》(Snow Fall)。该作品从作者对滑雪场死亡率的关注点出发,通过数字化建模等手段,配合文字、音视频等多媒体呈现方式,将16 位滑雪者在美国卡斯卡德山遭遇雪崩的故事及背景、过程和后续处理连接起来。该作品不仅获得2013 年普利策新闻奖,甚至被认为是传统媒体转型的一个里程碑式的报道。⑥

除了传统的主流媒体,一些新兴的独立媒体机构在数据新闻上也颇有建树。ProPublica 是一家非盈利性在线新闻网站,致力于公共利益的新闻调查。其专门设立了Data 栏目,进行数据化生产,每年至少发表12 个数据新闻项目。⑦

纵观西方主流媒体的数据新闻实践,主要的特色和经验包括以下几个方面:

首先,在内容上,以数据为导向,着重挖掘数据背后的联系、价值,解读数据新闻故事。欧洲新闻中心编著的《数据新闻手册》开宗明义提出,数据新闻就是用数据讲述新闻故事。⑧

其次,在价值上,数据新闻的意义远远超出了传统意义上的叙述新闻故事的范畴,在预测事件发展趋势,为用户提供个性化信息服务,为用户下判断提供依据等方面发挥着更大的作用。但数据新闻不是为了分析数据而存在的,其最终目的在于将数据的价值传达给用户,让数据为用户服务。从这个意义上看,数据新闻已经超出了传统新闻讲一个好故事的价值,基于数据的挖掘和分析,为用户提供更好的判断依据和个性化服务等功能逐渐显示出来。甚至让用户参与到大数据的生产,从大数据中发现自己的故事,从而让数据价值个人化、具体化,这是数据新闻的重要价值所在。

最后,在操作上,以专业化数据新闻平台为基础,突发报道的风格逐渐形成,策划性选题各显神通。

 

三、国内数据新闻进入第一个发展阶段

 

国内数据新闻实践最早是从门户网站开始的。2011 年5 月,搜狐“数字之道”栏目上线,开启了门户网站进行数据新闻生产的尝试。随后网易的“数读”、腾讯的“新闻百科”、新浪的“图解天下”栏目相继上线,标志着国内数据新闻实践进入了第一个发展阶段。

2013 年10 月,财新传媒正式成立数据可视化实验室,推出“数字说”栏目,将数据应用于新闻采编及呈现。目前财新数据新闻团队拥有包括编辑、技术和设计等人员10 名。⑨而成立于2014 年 6 月的南方都市报数据新闻工作室,也是国内数据新闻实践中的一个标志性事件。该工作室成员由主持、编辑、交互设计师、数据工程师、音频制作者和民调小组等组成,虚拟设置,团队作业。⑩

从2011 年到2014 年,国内数据新闻实践总体还处于发展的起始阶段。纵观这几年的发展,国内数据新闻实践主要有以下几个特点:

首先,题材方面,以热点事件为主,策划性选题偏少。报道热点是新闻媒体的天然使命,但是如果只有热点,则是不正常的表现。从数据新闻的题材上看,无论是门户网站还是传统的纸质媒体,都比较偏重热点新闻事件,最多在此基础上做进一步的延伸和解析。有学者统计了四大门户网站数据新闻的题材比重,发现国内热点新闻事件的比例普遍在50% 以上,并且多以解读经济类新闻数据为主。

其次,数据应用以结构性数据为主,非结构性数据未得到充分挖掘。处理数据,是数据新闻的最核心要义。可以说,数据的优劣,很大程度上决定了数据新闻产品的效果。纵观这两年我国媒体的数据新闻实践,其数据来源绝大多数是传统型结构性数据,也就是以政府、调研机构等发布的调查数据为主。据学者统计,四大门户网站的数据新闻约有80% 属于结构性数据。

最后,呈现方式以展示数据为主,数据叙事能力不足。数据新闻,找出数据之间的逻辑关系才是最主要的,而可视化只是一种易于阅读的呈现方式,总体而言处于次要的位置。但从近几年国内数据新闻实践来看,无论是门户网站还是传统的纸媒,都把很大的力气放在了可视化上面,而在叙述数据之间的关系上则严重缺位。

 

四、《深圳晚报》“表示”版面的探索与实践

 

我们选取《深圳晚报》近一年(2014.5.26-2015.4.30,其中 2015 年2 月18 日至2 月24 日数据缺失)的“表示”版面作为样本统计分析。

(一)版面数据来源方面

通过样本统计分析得出,自我搜集整理采写的占39.36%,数据来源于通讯社、以往报道或出版社的占25.53%,数据来源于政府及政府组织的占22.87%,剩下的数据来源所占比重相对较少,分别是非政府组织、企业和公司的数据占7.45%,研究机构、院校、学者提供的数据占3.72%,网络用户搜集占1.06%。(见图1)

 

“表示”版面数据来源百分比

图1 版面数据来源

 

由上可见,“表示”版面的大部分数据都是采编人员主动搜集整理的。一方面,这与《深圳晚报》作为传统的新闻内容生产机构的定位相吻合。但另一个方面,这些数据绝大部分也是结构性数据,能够体现互联网时代“大数据”特色的非机构性数据较少,这与国内其他媒体的情况相类似。

(二)选题类型方面

选题是寻找媒体定位与受众需求之间的契合点。《深圳晚报》作为深圳本地都市类报纸,新闻的选题更侧重本地性和贴近性,多与深圳市民的社会生活相关。从这一层面来看,“表示”版面的选题比较符合该报的定位。

“表示”版面在报道议题的内容选择上相对多元化,对市民关心的政治、经济、教育、民生、科技和环境等领域的话题均有所涉及,以满足深圳市民的信息需求。在选择的186 个样本中,经济新闻所占比高达36.56%,民生新闻紧随其后占19.35%,而政治新闻占15.59%,教育、法治、科技、环境等类型新闻各自占比不足5%(见图2)。这与《深圳晚报》的市民报定位基本相符。

 

“表示”版面选题类型百分比

图2 选题类型

 

“表示”版面设立一年多以来,选题日趋稳定。但与国内外成熟的数据新闻相比,还存在较大的差距。从统计结果来看,“表示”版面大多数时候是直接采用政府单位或其他组织公布的调研、报告中的数据,辅以一定的美编手段将其做成表格、绘成图形等,让数据变得醒目,让版面变得美观。数据新闻并不等于图形化或可视化,而是用最好的方式去讲述故事。从这一角度来考量,“表示”版面目前更多的精力还是放在可视化上。

(三)版面呈现方式方面

注重视觉效果和内在逻辑,简单易读是宗旨。综合这一年的 “表示”版面,数据新闻的主要表现形式包括地图、时间线、图表、数值等。如图3 所示,主要呈现方式是“数值”(占51.55%)和“图表”(占36.43%)。

另外,“地图”占2.33%,“时间线”占1.16%。需要说明的是, “无”这一分类主要指整个版面都是文字的数据新闻。

 

“表示”版面呈现方式百分比

图3 版面呈现方式

 

在呈现方式上,“表示”版面具有以下特点:

1.用数值表达人物或者事物形象特点

数值是“表示”版面最常用的呈现方式,一直处于榜首位置。数值方式的主体是数字,简洁清晰是最大特点。用户能一眼找到关键词,更快更准地找到新闻报道的要点,这也符合现在用户 “快餐式”的阅读习惯。

2.图表注重外观包装和表达简单化

在对《深圳晚报》数据新闻研究过程中发现,图表跟传统新闻报道中使用的信息图表差不多,最常用的是柱状图、饼状图、折线图。这是受到版面的限制以及“报纸”这一载体自身的局限,“动态”“互动”此类关键元素永远无法参与到纸媒的新的可视化形式。

3.版面无数据,整版文字靠“装饰”说“关系”

在对“表示”版面的研究中发现,有的整个版面没有运用任何数值或者表示等其他呈现方式。整版文字靠“装饰”说“关系”,这能很好地凸显采编人员的思路和逻辑,但版面还是以文字为主,不够美观简洁。

4.“数值”+“图表”搭配使用,互为表里

一般图表的使用常常局限于数字表达和呈现,没有太多可挖掘的地方,而“数值”刚好可以弥补图表的缺陷,可以深入挖掘数字背后的逻辑与走向,以数值来表达人物形象或现象,二者形成互为表里关系。然而,不是所有的数据都要放在表示版面的,要尊重文章内容和数据类型,也要尊重读者阅读习惯。

数据新闻是一个对技术和融合媒体能力要求较高的领域,想要在数据新闻领域上有所作为,专业化人才的引进和培养尤为重要。因此,引进人才,建立专业团队,对于数据新闻的生产将会带来更强的独立性和强大保障,新闻选题的操作也会更易于掌控,从而推出更多的好作品。另一方面,从操作方式而言,数据新闻的报道有两种方式,一种是已有确定的报道方向,在采写过程中通过寻找相关数据来完善报道;一种是建立在海量数据的基础上,通过挖掘数据之间的内在联系来解读新闻。

 

 

注释

 

①数据新闻手册[OL].http://xiaoyongzi.github.io/web/intro_1.html.

②方洁,颜冬. 全球视野下的“数据新闻”: 理念与实践[J]. 国际新闻界, 2013(6).

③卜卫. 计算机辅助新闻报道: 信息时代记者培训的重要课程[J]. 新闻与传播研究, 1998(1).

④祝建华. 从大数据到数据新闻[J]. 新媒体与社会, 2014(4):11-13.

⑤数据新闻手册[OL].http://xiaoyongzi.github.io/web/newsroom_3.html.

⑥韩士皓,彭兰. 融合新闻里程碑之作——普利策新闻奖作品《雪崩》解析[J]. 新闻界, 2014(3).

⑦ 邱悦. 爱啃数据硬骨头的ProPublica[EB/OL].http://djchina. org/2015/01/22/data_newsroom_propublica/.

⑧数据新闻手册[OL].http://xiaoyongzi.github.io/web/intro_0.html.

⑨财新数据可视化实验室[OL].http://vislab.caixin.com/?cat=5#1.

⑩财新数据可视化实验室[OL].http://vislab.caixin.com/?cat=5#1

邹莹. 可视化数据新闻如何由“作品”变“产品”?——《南方都市报》数据新闻工作室操作思路[J]. 中国记者, 2015(1).

编辑:郑晓鹏

打印本页】【关闭窗口】【复制地址

往期回顾

© COPYRIGHT 2014 ALL RIGHTS RESERVED. 深圳报业集团版权所有,未经书面授权禁止使用。