新闻机器人在国内的应用现状与前景

新闻机器人在国内的应用现状与前景

作者:广州大学新闻学院教授 程道才  2017-08-07 15:11  新传播    【字号:  

  新闻机器人具有写稿速度迅速、报道客观、处理数据差错率低等优势,同时也具有缺乏对资讯的深度理解、对信息的提炼和概括能力不足、写作领域较为单一等不足。因此,对新闻机器人进一步优化与升级,是新闻界和科技界面临的新课题。

【关键词】新闻机器人 新闻写作 信息处理 优势与不足

 

据人民网2017年3月15日报道,今年全国两会期间,人民日报、光明日报、新华社、深圳特区报等十多家新闻媒体,都将新闻机器人应用于两会报道。新闻机器人再次崭露头角,成为媒体报道新闻的新宠。

实际上,从2015年起,我国新闻界便开始运用新闻机器人写作新闻报道了,如腾讯推出的“梦幻写手”、新华社推出的“快笔小新”、今日头条推出的“张小明”、第一财经日报推出的“DT稿王”等。新闻机器人的问世,标志着科学技术对新闻传播业的促进和影响迈出了新的一步,也揭开了新闻写作史的新页。

 

一、新闻机器人的起源与发展

 

所谓新闻机器人,是指运用算法对输入或搜集的数据自动进行加工处理,从而自动生成完整新闻报道的一整套计算机程序。与以往人工智能在传媒业的应用不同,新闻机器人最大的特点就是新闻生产的完全自动化;除前期的技术开发外,新闻生产的主体实现了由人向机器的转变。

20世纪80年代,随着计算机技术的广泛运用,数据处理成为新闻生产中的重要环节。21世纪初,人类进入了大数据时代,各类文档资源、软件、版权的空前开放,让数据的获取更加简便、快捷、高效。于是,利用特定语言程序、对所搜集的数据进行模式化加工、将目标数据文本“嵌入”已有模板、用于新闻报道“文本再生产”的新闻机器人应运而生。

新闻机器人最先诞生在科学技术发达的美国。据清华大学新闻与传播学院副院长史安斌等人撰文介绍:2006年初,美国商业数据供应商汤普森公司(Thomson Corporation)开始使用计算机程序对相关财经数据进行加工处理,并整合成完整的新闻报道文本,用以取代传统财经新闻记者所从事的事实类报道工作。2009年,美国西北大学智能信息实验室研发并推出了一款名为“统计猴”(Stats Monkey)的软件。该软件能对棒球比赛中选手、比赛得分和获胜率等数据进行抓取和筛选,并在12秒内自动生成一篇完整的报道。2010年初,“统计猴”被运用于财经报道中,该项目的两位研发人员随即“下海”成立了“叙事科学”(Narrative Science)公司。

新闻机器人真正引起人们的广泛关注,始自“地震机器人”(Quakebot)在2014年3月发表在洛杉矶时报上的报道。“地震机器人”是该报记者肯·史文克(Ken Schwencke)所编写的一套程序,能够将美国地震局测量到的数据直接转化、编写成短消息。在不到五分钟的时间里,新闻机器人所写的报道就经过人工校对,上传到了洛杉矶时报的网站。

当前,欧美三家企业主导了整个新闻机器人行业,分别是总部位于美国伊利诺伊州的“叙事科学”公司, 总部位于美国北卡罗来纳州的“自动化洞察力”(Automated Insights)公司和总部分别位于美国德克萨斯州、纽约州和法国巴黎的“伊索”(Yseop)公司。他们一方面开发出各具特色的软件产品,供不同类型的新闻媒体机构使用;另一方面,通过与传统媒体机构的合作来深度参与新闻产品的开发。例如:“自动化洞察力”公司2014年与美联社达成合作协议,直接参与“企业季度营收”类新闻的写作。美联社称,双方合作后此类新闻的创作数量增长了近15倍。除了写作外,他们还启用“编辑机器人”来审查由软件自动生成的新闻报道。由此,美联社成为第一家全面引入新闻机器人的传媒机构。①

 

二、新闻机器人在我国新闻传播业中的应用

 

2015年以来,新闻机器人在我国新闻传播业中也得到重视并开始应用,发展迅速。

最先应用新闻机器人进行新闻报道的是我国互联网巨头腾讯公司。2015年9月,该公司所属的腾讯财经,推出新闻机器人“Dreamwriter”(梦幻写手),负责财经类新闻的写作。新华通讯社也不甘落后,于2015年11月7日正式推出新闻机器人“快笔小新”,用于写作体育新闻和财经报道。2016年5月,第一财经日报也步其后尘,推出新闻机器人“DT稿王”,用于撰写财经新闻。2016年8月,今日头条也正式推出新闻机器人“张小明”,用于报道体育新闻。

在今年的全国两会期间,又有十多家新闻媒体隆重推出本媒体的新闻机器人,服务于两会报道。它们分别是:人民日报中央厨房推出的“小融”“小端”,新华社推出的“i思”“小新”,光明日报融媒体中心推出的“小明AI两会”,深圳特区报推出的“读特”,人民网推出的阿里云ET机器人,广州日报推出的“阿同”“阿乐”,香港大公文汇传媒集团推出的“小宝”,南方都市报推出的“小南”,浙江卫视推出的“小聪”,河南广播电视台推出的“飞象V仔”,湖北广播电视台推出的“云朵”。

上述新闻机器人投入运作后,都获得了可喜业绩,并受到业界好评。下面试举几例:

腾讯财经开发的新闻机器人“Dreamwriter”(梦幻写手),根据算法在第一时间自动生成稿件,瞬时输出分析和研判,可以在一分钟内将重要资讯和解读送达用户。腾讯的新闻机器人属于批量生产型,每天大约要写成百篇稿件。2015年9月11日,腾讯财经发布了由“Dreamwriter”(梦幻写手)撰写的第一篇报道,标题为“8月CPI涨2% 创12个月新高”,引起了业界轰动,激起一阵记者将要“下岗”的议论。②

今日头条启用新闻机器人“张小明”后,迅速投入到2016年8月举行的里约奥运会报道。在奥运会开始后的13天内,“张小明”共撰写了457篇关于羽毛球、乒乓球、网球的消息简讯和赛事报道,每天30篇以上。不仅囊括了从小组赛到决赛的所有赛事,且其发稿速度之快,也让人惊讶——几乎与电视直播同时。③

光明日报融媒体中心今年推出的新闻机器人“小明AI两会”,为了实现智能识图功能,学习了数万张代表委员照片;为了解代表委员的履职情况,学习了40多万篇两会新闻报道;通过智能分析和数据挖掘,整理了29万个词汇,并从中挖掘出近5000个与两会相关的关键词,据此整理出每一位代表委员的履职报告。该新闻机器人可从事日常语音交互问答、两会代表委员查询等工作,不仅节省了人力,也提高了工作效率。④

深圳特区报今年推出的新闻机器人“读特”,具有语音识别交互、人脸识别和动作控制等功能,能够从事语音交互问答、采访人大代表、提供智能人脸识别、播报天气等工作。⑤

湖北广播电视台早在2016年湖北省两会期间就率先推出机器人记者“云朵”,进行现场新闻采访。今年全国两会期间,“云朵”再次来到会议现场采访,且新闻技能进一步增强:可以进行人脸识别,能与参会代表、委员进行简短对话,能将代表、委员的回答自动进行收录,并进行全媒体传播。⑥

 

三、新闻机器人的优势与短处

 

(一)新闻机器人的优势

1. 可以提高发稿速度和新闻时效性

时效性和真实性一样,直接影响新闻价值。在网络新闻时代,新闻时效体现在分秒必争上。新闻机器人凭借自身快速的信息处理能力,可以在极短的时间内写出符合某个媒体或者记者写作风格的作品来,有效地提高新闻时效。

以今日头条新闻机器人“张小明”为例。在里约奥运会期间,它生成一篇稿件的时间约在2秒左右,即比赛刚一结束,稿件就已经写好并且发布了。这让今日头条在发稿速度上要快其它媒体一步,在众多类似消息中脱颖而出。而且,“张小明”可以实现全天候24小时监测赛事热点,不漏掉任何一场赛事,这是记者难以做到的。

2. 可以加速劳动分工

新闻机器人所从事的是技术含量较低的工作,即进行数据分析和写作比较简单浅显的新闻报道。新闻机器人的运用,可以为编辑和记者省去大量机械性工作和力不能及的数据分析,可以让记者从疲于奔命式的抢新闻中解脱出来,有更多的时间和精力去从事有创造性的深度报道的采访与写作。这对记者编辑素质的提升极为有利。

3.可以明显降低大数据处理时的出错量

经济新闻和体育新闻,常常有许多数字、数据需要整理汇总。记者在处理这些数字和图表时,常常因为数据量大而忙中出错。但是,新闻机器人凭借其超强的运算能力,可以正确处理海量数据,且不容易出错。

4. 可以增强新闻报道的客观性

新闻机器人属于智能机器,不带有任何人类情感和倾向性,新闻报道的生成完全依赖于数据。在报道体育赛事时,不会因为喜爱某支球队而厚此薄彼,而是严格按照数据,客观地陈述事实。因此,在某种程度上,机器人新闻更接近新闻报道对客观性的要求。

(二)新闻机器人存在的不足

1. 缺乏对资讯的深度理解

新闻机器人所能做的,只是在现有数据库的支持下,对新闻报道进行词汇和语句的抓取,然后进行排列组合,就像在进行一个复杂的填字游戏。机器人对报道的深度理解能力,远远不能与人类相提并论。例如,今日头条的新闻机器人“张小明”在2016年8月16日的一篇关于奥运会男乒半决赛的报道中写道:“奥运乒乓球男子团体半决赛在里约会议中心3号馆如期举行,耗时3场大战,比赛中韩国队表现不理想,绝望之际,失败女神朝其抛出了橄榄枝……”

在这段信息中,“张小明”显然没能领会“橄榄枝”在自然语言中的含义。由此看来,新闻机器人在语义理解上具有较大的缺陷。

2. 对信息的提炼和概括能力不足

对新闻信息的概括和提炼能力,是记者必备的职业素质,直接影响新闻报道的质量;要想把一篇新闻报道写好,具备这种能力十分重要。提炼与概括的前提是理解。目前,新闻机器人显然还不具备这种提炼和概括能力,对于人类语言的理解能力还十分弱,这就限制了新闻机器人撰写新闻报道的体裁和领域。例如,报道一场体育比赛,记者会用虽败犹荣这类词语来描写失利方,而新闻机器人就难以具备这样的情感,写出的报道自然就缺乏情感。

3. 写作领域较为单一

新闻机器人当前的应用还停留在以使用数据为主的新闻领域,主要工作是报道年度财报新闻以及体育赛事新闻。这类稿件都具有标准化程度较高的特征,稿件中提到的时间、地点、人数和相关数据,都具有标准化格式特征。这既是机器人新闻的优势,但也体现出机器人新闻全靠数据支撑内容,比较生硬、缺乏感情交流的一面。因此,目前新闻机器人在程序的设定下只能固定写会议、财经、体育、天气这些“模式化内容”的资讯,很少能“身兼数职”“一机多能”。

4. 写出的新闻千篇一律,缺少亮点和重点

仍以新闻机器人“张小明”的里约奥运会的报道为例。它对每场比赛都进行了报道,然而由于报道过于模式化,所写的新闻报道都显得千篇一律,报道的结构、角度、用词都差不多;每篇报道都写得面面俱到,却缺乏重点和亮点,读者读后难以留下印象。

 

四、对进一步优化新闻机器人的建议

 

新闻机器人是智能科技在新闻传播业界的具体应用,有着光明的发展前景。但是,与其它新生事物一样,新闻机器人也有一个从不太成熟到成熟的成长过程。对其进一步进行改进和优化,是摆在新闻传媒界和科技界面前的重要任务。本人认为,进行改进和优化的重点主要有以下三个:

(一)进一步增强其变通性,使之成为跨多个报道领域的“全能写手”

眼下,新闻机器人的写作能力还仅仅停留在某一领域。造成这一状况的原因有二:一方面,现有的新闻机器人,不能像人类一样眼观六路耳听八方,处理器的适应能力比较单一,对交叉数据的处理能力较弱。另一方面,数据库的开源也是制约新闻机器人跨领域工作的一个障碍,新闻机器人只有接入到相应的数据库中才能继续进行分析数据,加工模板,再套用写作。不同数据库之间的开源以及数据的整合使得机器人的跨领域写作有一定阻力。在这种情况下,努力增强新闻机器人的数据处理能力,并有效解决数据库的开源问题,是使新闻机器人成为跨多个报道领域的多面手的关键,也是对新闻机器人进行优化和改进的主要方面。

(二)进一步增强其理解能力和思维能力,使之成为平等的交流者

目前,由于对自然语言和信息的理解能力、提炼能力和概括能力较弱,新闻机器人还停留在单向接受指令、进行运算的层面。在这种情况下,如何提高新闻机器人对于自然语言的理解能力和对信息的提炼能力和概括能力,也是对新闻机器人进行优化和改进的重要方面。如果这个问题能够成功解决,新闻机器人的作用就能明显提升。

(三)进一步增强其使用新闻工具的能力,使之成为现代媒介融合的体现者

眼下,新闻机器人的新闻作品多以文字报道面世,表现形式相对单一。今后,新闻机器人是否可以将视频、音频甚至虚拟现实技术整合起来,实现真正的媒介融合呢?是否可以出现在新闻现场,根据新闻对象需要,安装相应的新闻模块,装配虚拟现实摄像头,快速写稿、现场直播、制作VR作品呢?笔者认为,这也是新闻机器人优化与改进的重要方面。

综上所述,新闻机器人既具有明显的传播优势和广阔的发展前景,也存在一些不尽如人意之处。我们应在现有的基础上有针对性地对其进行改进和优化,让其进一步扬长避短,有效提升其功能和应用性,更好地为人类的新闻传播事业服务。

 

 

注释

①史安斌 ,龙亦凡 .新闻机器人的溯源、现状与前景【EB/OL】. 中国机器人网 . http://www.robot-china.com/zhuanti/show-2013.html .2016-08-16.

②成年龙. 腾讯机器人“梦幻写手”:每天上百篇稿件【EB/OL】.扬子晚报网. 2015-09-11 .

③赵禹桥. 新闻写作机器人的应用及前景展望——以今日头条新闻机器人张小明(xiaomingbot)为例【EB/OL】. 人民网研究院. http://media.people.com.cn/n1/2017/0111/c409691-29014245.htm .

④王培志 . 厉害了,我的“神器”——2017两会报道中的智能新闻机器人【EB/OL】 .人民网. http://media.people.com.cn/n1/2017/0315/c14677-29146493.html .2017-03-15.

⑤同④

⑥科技圈内.十家媒体“机器人”报道两会萌翻天【EB/OL】.

https://baijiahao.baidu.com/po/feed/share?wfr=spider&for=pc&context=%7B%22sourceFrom%22%3A%22bjh%22%2C%22nid%22%3A%22news_3684927795971917556%22%7D .2017-03-14 .

编辑:郑晓鹏

打印本页】【关闭窗口】【复制地址

往期回顾

© COPYRIGHT 2014 ALL RIGHTS RESERVED. 深圳报业集团版权所有,未经书面授权禁止使用。