晶数据:读数时代的价值深耕

作者:孙梦圆系晶报全媒体内容聚合中心主编;王彪系晶报全媒体内容聚合中心总监  2020-07-24 15:00  新传播    【字号:  

战疫报道中,晶报APP的数据新闻栏目“晶数据”连出“十万+”“百万+”爆款,成为疫情报道中的特色栏目,为深圳抗疫宣传增添更多的理性、科学精神,取得较大的社会反响。从2020年1月9日推出第一期到4月底,“晶数据”栏目一共推出约100期。“晶数据”强化了新闻报道的数理依据,丰富了新闻报道的产品形态,有效提升了媒体的传播力、影响力、引导力、公信力。本文以案例研究为主,通过对新冠肺炎疫情这个特殊语境下“晶数据”栏目的团队组建、生产流程和生产工具进行分析,尝试探讨一种传统媒体尝试新型业态的可能性。

【关键词】数据新闻  可视化  晶数据


一、读数时代已经到来

(一)什么是数据新闻?

正如“互联网之父”蒂姆·伯纳斯·李(Tim Berners-Lee) 所说,数据新闻就是未来。“数据即讯息”已成为这个时代的共识,而数据新闻也成为新闻界的新宠。

数据新闻(Data journalism),也叫数据驱动型新闻(Data driven-journalism)。数据新闻是以数据为中心,密切围绕数据来组织报道,同时与数据相关的各种技术在新闻生产中都被赋予了重要地位,其内涵就是“基于数据的抓取、挖掘、统计、分析和可视化呈现的新型新闻报道方式”。[1]

在大数据时代,数据对传媒的影响日益加深,一切事物都可以通过数字来解读,数据的无处不在也让数据新闻的持续生产成为可能。另一方面,也正是因为信息和数据暴发,读者更需要对这些碎片信息进行专业梳理和分析,化庞杂为有序,从庞杂的信息和数据里得到有深度的见解,从而对抗这个碎片化时代,读数时代已经到来。

(二)数据新闻的特点

1.数据驱动性。不同于传统新闻的以叙事为主体,数据新闻是基于大数据分析思维的新闻报道,它基于大量真实有效的数据,提取蕴含在海量数据中的具有新闻价值的信息,将数据转化为新闻背景和故事。[2]

2.工具依赖性。当今时代,大数据早已不是计算机、商业领域的专属,作为综合性很强的新闻领域,亦和大数据不断进行深度融合。数据新闻以数据分析为基础,故离不开分析工具、数学模型的运用。常用的基础分析工具以Microsoft Excel为主,比较复杂的则需要用到Tableau或是Python之类的编程专业软件为数据分析提供技术支撑。

3.可视阅读性。早期,新闻的主体是纸上的白纸黑字,图片和图表对文字起补充说明作用;而在全媒体时代,活泼的视频、动画、充满设计感的图表、手绘等,都早已融入新闻的表达形式中。当然,数据新闻不是让读者看表格,而是以形象的图例、卡通图片等将数据展示进一步优化,非常直观、形象、有趣,可读性强,符合“视觉时代”人们的阅读习惯。

4.预测研判性。在迈克尔.苏德森(Michael Schudson)《聚光灯,不是“真相的机器”》一 书中,他提出新闻不是“真相的机器”,而是李普曼所说的“聚光灯”和“探照灯”。[3]当下,数据新闻不仅是一份为读者呈现的当下时空的“调查报告”,而且是在分析的过程中往往会嵌入一些数学模型进行演算,或是根据曲线规律清晰直观地得出某种趋势的判断。这亦是数据新闻的最大价值,从数据中揭露事情真相。

二、国内数据新闻现状概述

数据新闻虽是舶来品,但作为后起之秀,国内仍有不少媒体都开设了相应的栏目或者子品牌。传统平台例如央视、新华社,新兴平台例如搜狐、新浪,都有着各自的数据新闻呈现方式。一流的新闻媒体或平台如财新、澎湃、新京报、界面等都开设了专门的数据新闻栏目。国内的此类产品,主要分为两大类:

一类是侧重于可视化呈现的数据新闻产品。其特点是将新闻中的数据以可视化的形式呈现, 并不涉及太多分析。如新华社在每年两会期间都会制作“两会词云图”“一图读懂xxx报告”等数据新闻产品,将枯燥的文字报告转化成为简单易读的图表、长图等形式,增添阅读趣味性,帮助普通读者理解。再如,每逢春运,央视新闻都会推出“据说春运”等数据新闻产品,以视频动画的形式居多,亦是旨在让新闻“动”起来,活跃严肃新闻的调性。

第二类则是数据分析新闻。其特点是更加注重数据的分析和整理,更加贴近数据新闻以数据驱动的本质。例如腾讯新闻旗下的“谷雨实验室”常常就一线城市房价、毕业生就业等大数据进行分析,直观地展现当下的社会热点问题,可在一定程度上反映目标群体的行为取向。由于拥有专业的设计师,它们在可视化方面通常也表现优异。然而,针对预测研判性这一数据新闻的最大价值,国内媒体的产品长期处于不温不火的状态,没有发挥太大的社会价值。

但2020年却是极为特殊的一年——新冠肺炎疫情突然肆虐,各类信息繁杂纷纭,人们的内心充满焦虑。重大事件往往能够催生新闻生产的创意,此次疫情“黑天鹅”,对于新闻行业尤其是传统媒体来说,是一把双刃剑。

中国广视索福瑞媒介研究开展了疫情期间用户媒介消费及使用预期调查,报告显示,疫情期间用户的媒介接触普遍走高,近八成用户关注传统媒体在网络端的信息。在获取真实可信的疫情信息上,传统媒体网站/客户端成为用户的首选,其次是电视、商业新闻网站/客户端。疫情信息强化了传统媒体、传统媒体网站/客户端的公信力。

三、抗疫报道中晶报App的数据新闻生产探索

2015年5月28日,在经过历时5个月的全线试运营之后,深圳报业集团晶报APP在社会各界代表的共同见证下宣告正式上线,为深圳全媒体矩阵增添了一支重要的生力军。在内容为王的时代,晶报APP一直致力于原创品牌栏目的生产,早在2019年初就已尝试数据新闻,于市区两会期间收集十区GDP数据推出了《深圳十区谁更强,各区最新GDP排名来了》的独家报道,阅读量创APP初期新高。2019年12月,晶报APP收集深圳车牌竞价5年的全部数据,推出了《晶数据|如何低价拍到粤B车牌?我们分析了5年的竞价大数据》,传播效果良好。

受限于数据收集的困难,这一段时间晶报APP数据新闻的产出比较受限。而新冠肺炎疫情期间,数据发布层出不穷,数据收集极为便利,“晶数据”这一栏目迅速成长,持续生产,几乎能够一周生产推送多期,高峰的时候甚至每天一期。

“晶数据”力争做到数据搜集全面,分析理性科学。前期所作的疫情走向分析以及相关政策建议,都在战疫实践中得到应验,包括对疫情阶段的关键性节点来临的时间等的准确预测,既为市民提供了理性的心态建设,又为基层一线抗疫提供数据治理的参考。

2020年1月29日晶数据推出第一期以疫情为主题的作品《晶数据|深圳的新冠肺炎病例都是哪里人?》;1月31日推出《晶数据|深圳确诊病例过百,得病的人有这些规律》,在各平台的阅读数均突破100万;2月1日推出《晶数据|全国疫情曲线会说话,可读出4点变化》更创下168万+的阅读量新高,也是集团战疫报道最早一批过百万的爆款作品。其后该栏目一直坚持生产,到4月底,“晶数据”栏目一共推出各类产品约100期,受到了深圳市委宣传部的肯定和专题阅评表扬,认为“晶数据”充分利用数据科学的发展成就,强化了新闻报道的数理依据,丰富了新闻报道的产品形态,有效提升了媒体的传播力、影响力、引导力、公信力。

晶数据是如何做出数据新闻爆款的?现对产品的团队组建、生产流程和生产工具等作简要的介绍,并分享数据新闻的实战经验:

(一)“晶数据”的生产模式

1.团队的组建和合作

“晶数据”栏目生产小组没有专职人员,是全媒体内容聚合中心在完成正常的APP端监控发稿与首页更新维护的本职工作之外的主动探索,由对数据新闻感兴趣的主编、编辑和视觉设计灵活组成。

抗击新冠肺炎疫情既是一场大战,也是一场大考。打破既定分工、按照需要随时重新分组协作是许多媒体此刻不约而同的行动。在此次抗疫报道中,数据新闻的选题既有由上而下,可由分管编委或总监主编点题,也可又由下而上产生,编辑监控发现选题,只要讨论感觉可执行、有报道的价值就根据小组成员的时间来灵活分工协作执行。正常的由数据收集、文案撰写和制表制图,可各环节有人承担,特殊情况下则可能是一专多能,一人承担起所有的环节,自己出文案,自己制图,自己编辑成推文。

2.“晶数据”的生产流程

关于数据新闻的生产流程,比较有名的是数据记者米尔科·洛伦兹提出的数据(Data)-过滤(Filter)-视觉化(Visualize)-故事(Story)四个步骤模式。

事实证明,多数数据新闻都采用了这样的生产模式,“晶数据”也不例外,亦是在这个大框架下根据实际情况作细微的灵活调整。

image.png

但由于疫情来得突然,晶报全媒体内容聚合中心人力资源有限,数据小组的成员通常都身兼多职,每个编辑都同时具备找数据、整理数据、分析数据、可视化制作的能力,根据不同的选题和工作时限动态分工,多线并行,极大地提高了生产效率。

image.png

3.“晶数据”的生产工具

(1)数据采集。数据新闻的生产基础,依赖于多样性的数据。与互联网公司或是专业的数据公司相比,传统媒体的记者、编辑缺乏海量的流量入口和数据库;对于“晶数据”栏目而言,更是没有专业的数据工程师提供技术支持。如何破局?“晶数据”栏目利用官方媒体所独具的敏锐的新闻触觉、渊博的社会知识积累、专业的判断力以及丰富的政府资源,将难题一一破解。

方式一:自建数据库。如2月8日发布的《晶数据 | 深圳公布的339个确诊病例的背后,藏着什么规律?》一文,通过对深圳确诊病例的性别构成、年龄分布、发病原因等进行统计分析,得出了两个结论:一是所有群体都是易感人群,所有人都应该做好防护,不可掉以轻心;二是深圳确诊病例多为聚集性传染,多为去过湖北探亲以及从湖北来深探亲的人群。此文的数据来源则是通过编辑手动建立数据库,将深圳卫健委每日公布的病例个案按年龄、性别、离深日期、返深日期、发病时间等十几项数据一一录入Excel,再进行分类分析。

image.png

方式二:政府数据再整合。作为权威媒体,晶报从深圳市新型冠状病毒肺炎疫情防控领导小组(指挥部)办公室等官方渠道,获取每日报送的入深人数、疑似病例数、发热楼栋数、轻重症人数等数据,根据自己的需要进行分类整合,建立动态更新的数据库,随取随用。

再如2月9日发布的《晶数据 | 从北上广深数据看,深圳迎接“抗疫大考”压力最大》一文中,从医疗压力、外来人口数、现有病例数等不同角度,对比分析了北京、上海、广州、深圳四大一线城市的抗疫压力,数据里的常居人口数量、公立医院数量、人均床位数等数据,都来源于各地卫健委官网、市政府官网的公报,权威、准确,编辑24小时监控,将其一一搜集整合,为我所用。

方式三:第三方平台合作。“晶数据”与深圳大学可视计算研究中心合作,发布了《深圳市新冠肺炎可视分析》,随后通过加载深圳市公交车刷卡历史数据,大致模拟全面复工后的各区域间的人群流动情况。再基于现有涉病小区,计算出与其有强关联的地区(不局限在地理位置相近),为疫情潜在的流向区域。对每个潜在区,按∑人口输入量 ×输入小区涉病例数,估算潜在风险系数,最终得出下图,区域颜色越深,表示潜在风险越大,不同颜色的连接线段指示出几个潜在高风险区域及其潜在病例来源,可以作为政府重点防控地区、居民出行计划的决策依据。

“晶数据”在后疫情期推出的《晶数据 | 深圳人的复工奶茶:大杯、超大杯,顺便多加料》一文,通过跑线记者与饿了么平台的合作,拿到复工前两周的深圳白领点餐数据统计,发现“奶茶”这一新闻点,对数据进行筛选和整理,设计制作。

(2)数据处理。如果说数据搜集是数据新闻的基石,那么数据处理/分析则是数据新闻的“灵魂”所在。数据新闻编辑需要具备一定的数据库设计、数学统计能力,以及对数学模型的运用能力。

采集到的数据,如何分析、如何呈现?柱状图、饼状图、折线图还是散点图?在工具方面,“晶数据”则是将简单的excel用到了极致。Excel能够处理绝大部分复杂、抽象的数据,用一定的函数进行计算,再自动生成简易的图表,直观地显示出数据的对比、趋势等。

(3)可视化制作。速读时代,保障受众的阅读体验非常重要,除了保证新闻内容和新闻价值,在美观方面也需要做成自己的特色。初期的“晶数据”还比较简陋,通常使用Excel自动生成的图表,但中后期通过不断的学习,形成了一套自己的视觉表达系统,从配色、字体、布局方面独具特色,强化了“晶数据”栏目的品牌形象。

其次,在平面视觉传达技术方面,“晶数据”也在不断探索——设计师将PowerPoint、Photoshop、After Effects等设计软件混合使用,尝试了GIF动态图表,让趋势曲线“动”起来,更加直观、具有冲击力;还将数据新闻和长图产品合二为一,将内容融入图中,打破了“文+插图”的传统编排模式,给读者带来全新的阅读体验。

image.png

(二)数据新闻生产者的专业素养

1.编辑角色、身份的转变

传统媒体中的编辑是一个什么样的角色?在很多人的印象中,编辑就是拿到了记者的文字、图片稿件,再进行进一步的编排和优化。而数据新闻的价值来源于对非结构式的混杂数据的二次加工,编辑此刻不仅只是一个文字编排者,更是一手信源的挖掘、整合者,相当于一个记者的角色。只是这与传统的记者采集事件不同,数据新闻接触到的,是纷繁的数据。此刻的编辑,是采集者、制作者、把关人,同时也是传播者、数据搜集员、数据分析员、平面设计师……编辑的身份不再设限。

2.传统媒体从业者的思维创新

传统的新闻制作理念,是通过一条线索进行深度挖掘,直至找到隐藏在新闻背后的真相,为公众提供知情权。虽然说数据新闻也是深度挖掘,但挖掘的方式和对象却有所不同——根据主题或猜想,从数据库下手,再从中总结规律,发现新闻线索,以此验证最开始的猜想,形成一个闭环式的模式。这就要求新闻编辑在参与数据新闻生产的时候,要跳出处理传统新闻的思维模式,以预测性思维来推动生产。若一个编辑身兼传统新闻稿编辑、数据新闻编辑二职,则需要具备快速切换思维的能力。同时在日常生活中,也应时刻具备数据收集意识。

四、从“晶数据”中看数据新闻的社会价值

疫情把人们关在了家里,用户在信息的在汪洋大海中,更加信赖权威传统媒体。晶报APP作为传统媒体的新媒体平台,以积淀已久的公信力为基础,在形式方面不断创新,“晶数据”这样的数据新闻栏目才能够获取公众的信任和传播。在疫情初期,全深圳乃至全国的人民都处在一种恐慌、无序的氛围中,各类传言纷杂,有人过度紧张、有人盲目乐观、有人无端臆测。在这样的氛围中,客观理性的科学精神是公众迫切需要的。“晶数据”发出了不偏颇、非主观的声音,摆出事实,让公众自行判断,发挥了数据新闻巨大的社会价值。

(一)疫情之中:科学理性价值与预测研判价值

回到本文开头所说的数据新闻的特点之一——预测研判性。舍恩伯格说,“大数据的核心就是预测,不是要教机器像人一样思考,而是要把数学计算运用到海量数据上,来预测事情发生的可能性。”[4]虽说传统的新闻也会有预测性的报道策划,常见的形式就是邀请专家解读,个人主观性较强。而数据是不会撒谎的,通过图表的展示,趋势、分布一目了然,无需专家解说,也具备很强的说服力。

如《晶数据 | 深圳公布的339个确诊病例的背后,藏着什么规律?》一文发布之前,流传着武汉人恶意出逃传播病毒的谣言,而此文通过对深圳卫健委公布的个案病例进行统计,分析了339个确诊病例的患病原因——大部分都是家庭聚集传播。由于临近春节,许多深圳常住市民回武汉探亲再返回深圳,或是武汉市民来深看望自己的亲人,不知不觉携带了病毒,并非恶意传播,谣言不攻自破。此文也在24小时内全网阅读量突破100万,不仅被人民网等官媒转发,也被深圳本地一些有影响力的自媒体转发。

再有,《晶数据 | 从北上广深数据看,深圳迎接“抗疫大考”压力最大》通过累计病例数、医疗压力指数、湖北迁徙热门城市排行等数据分析,提出武汉“封城”后A类人员的流动已得到有效控制,目前最大的隐患是流动的B类和2B类人员,随着返深复工人数不断增多,会给深圳带来较大压力,故应把防控力量集中在保障复工人群安全返程上。《晶数据 | 到了最吃劲的时候了,疫情潜在风险区域赶紧了解下》一文,分析发现深圳本地二代传播控制较好,而一些出现较高密度确诊病例逗留的区域应当成为防疫工作的重中之重,亦是为公众提供了“风险预警”,具有很强的实用价值。

针对此类突发公共事件,类似“晶数据”的数据新闻,能够充分发挥预测研判的作用,帮助官方以及民众更加冷静从容地应对接下来的风险。

(二)疫情之外:政策解读、民生服务与“智库”

不可否认的是,大数据时代,数据新闻的前景十分广阔,且无孔不入,成为生活、经济、政治的一部分,数据分析、利用、共享必定成为新闻的主要方向之一。

虽然“晶数据”栏目在疫情期间飞速成长,但并非是一个“新生儿”。晶报APP推出第一期“晶数据”栏目是在2019年12月24日,题为《晶数据 | 如何低价拍到粤B车牌?我们分析了5年的竞价大数据》,本身就以民生话题为切入口,为读者提供有趣的参考决策型资讯。2020年2月之后,随着疫情迎来重大转折,“晶数据”主动呼应深圳市委市政府提出的“变两难为两全”要求,拓展“晶数据”内容,将主题转向如网课、消费、复工等与疫情相关的民生话题,贴近市民衣食住行,客观反映社会现状。如3月8日推出的《晶数据 | 深圳人的复工奶茶:大杯、超大杯,顺便多加料》就抓住了复工后年轻人面对久违的饮品的“报复性消费”心理,表达了上班族的共同情感,一天的阅读量突破100万。

经过一段时间的探索,不难发现,数据新闻最大的价值其实仍是新闻本身的价值——服务性、贴近性,注重从用户需求出发,以市民的工作、生产为出发点,关于吃喝玩乐、环境保护、健康医疗、教育等一系列民生话题,表达群众呼声,服务大众。以内容为主,尊重新闻本质,发挥新闻最本质的价值。

此外,由于数据新闻是从普通老百姓最关心的点出发,进行大量的数据采集和分析,很大程度上能够代表某一时期关于某一议题老百姓最真实的想法,这也能够为政府的相关决策、措施提供参考价值,相当于是新闻版的“智库”。兼顾民生性、时效性、趣味性、服务性,数据新闻的未来前景可期。


注释:

[1] 李婷婷.大数据时代数据新闻的传播特点与报道策略[J].传媒,2017(12).

[2] 刘银娣.从海量数据中挖掘新闻故事:数据新闻内涵探析[J].中国出版,2016(9).

[3] 喻国明,李彪.新闻传播的大数据时代[M].北京:中国人民大学出版社,2014:21.

[4] [美]维克托·迈尔·舍恩伯格.大数据时代[M].周涛,译.浙江人民出版社,2013:45.

编辑:郑晓鹏

打印本页】【关闭窗口】【复制地址

往期回顾

© COPYRIGHT 2014 ALL RIGHTS RESERVED. 深圳报业集团版权所有,未经书面授权禁止使用。