扫码购物

请用微信扫一扫购物

热线电话
152 9152 5458

手机扫码访问

新闻中心

News center

数据新闻的比较优势与隐忧

日期:2025-01-26 07:57:53浏览量:

  时效性考量之下★★★,利用社会化媒体和搜索引擎搜寻网民爆料和关注话题,对此加以归类分析并设置热点,可能受制于网民特定群体的使用特征、亚文化时尚或某种倾向性社会情绪★★★。在对女歌星汤灿案★★、官员案等的反腐报道时,有些只用数据链接的方式★★,将网上众说纷纭的人物和事件作短时处理的数据新闻★★,并没有尽如人意地还原出事件的真相,反而受到倾向性情绪误导★★★,让用户甚至点读出人物存亡与否的不真实报道★★。

  孟威★:《网络互动:意义诠释与规则探讨》,经济管理出版社2002年版★,第214页★★★。

  孟威:《媒介伦理的道德论据》★,经济管理出版社2012年版,第11页、55页。

  孟威:《习的新闻舆论观——深入学习习在党的新闻舆论工作座谈会上的讲线期★★★。

  这涉及数据的获取渠道、数据提供者身份、习惯以及数据使用中的权力关系。计算机行业从结构上划分,将数据主要视作两种类型,一种为结构性数据★★★,一种是非结构性数据。前者是“指存储在数据库当中★★★、有统一结构和格式的数据”,后者指“无法用数字或统一的结构来表示的信息”★,⑨两者获取渠道不同,结构性数据包括政府组织、市场调查机构、基金会等发布的多种统计数字★★、报表报告等★。非结构性数据则包括网络上或社会中流传的视频语音、信息图片、产品广告等,其蕴藏的信息量之大无法计数。有研究表明,目前中国新浪★★、搜狐★★、网易、腾讯四大商业门户网站数据新闻中结构性数据占近80%,非结构性数据占比20★★.20%。⑩在获取数据的过程中,权威组织与各种类型的社会机构,以及普通公众都是不可忽视的信息来源,而信息源的造价和不真实问题一直是网络传播中难以治愈的顽疾★。获取数据中的信息源陷阱存在于各个方面,如背弃承诺的个体★、爱炒作的记者★★、“客里空★”的善意、交易时效压力下的公司★★★、容易上当的编辑,一旦数据信息出现判断力失误,所导致的后果将是连锁性、系列化的新闻失实★★★,这比单条新闻失实的影响更为糟糕。

  对于信息传播实践来讲★★★,上述数据新闻的种种隐忧,其实都指向一个可能造成纠结的核心问题——如何实现数据价值★?数据新闻的价值实现既体现为数据本身蕴含的市场潜力★,包括市价与用户吸引力,又考验着媒体的专业角色价值★。在这样一个“信息信息到处都是信息★★,唯独没有思考的头脑★★”的时代★,五花八门的免费使用模式,快餐一样随处可寻,无数胃口庞大的组织机构或个人★★,淘金迷般地攫取每一粒数据,如果媒体丧失了领先的技术水平与其内容打造的专业化优势★★★,无论是何种类型的机构或新闻呈现,都难以持续一场“没有地图”指南的美妙旅行。

  在强调技术引进的同时也要警惕媒体文化优势的流失问题★★★。近十几年来,随着互联网日益跻身主流传播领域,新闻专业人才的市场价值一降再降★★★,媒体入职选择出现一哄而上过度偏向科技、跨学科人员的极端化趋势,新闻文化价值遭到贬值★★★,连带造成新闻机构、采编从业人员和文科院校淡漠人文素质★★。新一批新闻从业人员职业素养、伦理导向、文字能力、智识文化欠缺引发的媒介事件不断,在“南京彭宇案★”★★“东北农村约炮★★★”等事件中★★★,严重影响到新闻媒体的公信力。专业竞争能力的减损,也使原本更具技术优势的商业信息机构能够借机再起,争锋信息内容领域★★★。

  就盈利模式和核心竞争力来看,数据新闻的完美实践还有较长的路要走★。广告获利的主导性模式需要打破,以“看图说话”★★、动态图表、信息图三种模式为主打的数据报道定型亟待破局,技术与专业人才等资源能否合作匹配也是保持市场获利的大问题。不对此一一解决,随着市场消费热情的渐趋平淡、用户新消费习惯的渐趋适应,如今看似热闹的数据新闻★★★,难免遭遇数年前精确新闻报道昙花一现的运命。

  信息处理环节中的数据清洗,也使新闻真实暗藏“短板”。数据清洗通常采用两种做法★★:其一是“检查数据的一致性★★★,将新获取的数据转换成与已使用数据相一致的形式★”;其二是★★★“处理无效值和缺失值等★”。因为重复、损坏条目、格式错误、数据丢失等问题普遍存在★,常需借助Excel、GoogleRefine等软件进行整理或清洗,而其中的个人因素、公司倾向等对于“重建”数据的真实性干预同样令人担忧★。

  第三,凸显信息服务,整体化视野与个体影响的关联性是数据新闻形成吸引力的核心要素。数据新闻处理过程中的两个重要层次★,表现出这种信息服务的★★★“关联性★★”特征★★:一是分析不断变动的数据以发掘意义结构和宏观价值,二是通过数据设计展示让用户了解和自主选择哪类信息对他们自身具有重要性和相关性,正如荷兰的数据报道记者范艾斯(VanEss,H★.)所说:★★★“它们着重于呈现问题在哪里……你既可以深入了解个性化细节★,也能看清整体状况”⑥★★★。

  成也萧何败也萧何,数据新闻的前景同样要看市场的脸色与竞争的法则。2013年数字新闻网站EveryBlock关闭,美国在线(AOL)的Patch网宣布裁员转型。2014年4月★,号称“数字第一”的媒体(DigitalFirstMedia)关闭了着重打造的“霹雳★★”(ThunderDome)项目★★★。HomicideWatch因负担不起每年6万美元数据库维护更新费用而关闭也成为前车之鉴。有研究分析,“失败个案的共同特点是,媒介组织拥有丰富的数据资源,但对传统的盈利模式依赖大,数据驱动的新盈利模式不清晰”。

  这一特征在2011年的伦敦骚乱事件过后,《卫报》的数据新闻“解读骚乱★★★”中即有体现★,新闻报道机构对骚乱参与者、警察、市民★★、政界人士搜集数据展开深度访谈★★★,搜索法庭案件卷宗及政府★★、社会组织统计资料、社交媒体内容,将Twitter上257万条骚乱相关信息用作分析来源依据,并与学者合作推出《解读骚乱》小册子,使得新闻报道更带有前瞻性的研究价值,所做报道和结论收获了新闻业界和公众层面的广泛认同★★★。

  刘义昆、卢志坤:《数据新闻的中国实践与中外差异》,《中国出版》2014年下★。

  数据新闻的比较优势构成了对它自身的特殊要求。数据新闻生产周期一般会比传统新闻采写周期长★★★,对技术与专业人才的需求也更为迫切。目前的现状是,我国转型中的新闻媒体大多技术力量较为薄弱,一方面吸纳和培养技术人才是其当务之急,一方面也应着重探索新闻媒体与技术公司★★、企业、院校协同发展的多元化合作途径,以各施其长“借力发力★”,从而实现媒体的后发突进。

  来源于网络主体的某种偏向,可能造成数据新闻代表性方面的普遍性缺陷★★,不仅如此,数据中所包含的★★★“刷人气”干扰也常常避免不了★★。淘宝“信用星★★★”、PaPi酱之类“新网红”背后的资本操纵力量★,不仅让用户也常让媒体公司感到很难把握和辨别数据价值★★。而基于此上的数据化媒介议程将加大新闻客观性评价的难度和偏差。

  ⑧周碧帆:《〈新闻联播〉中数据新闻的可视化表达》,《新闻研究》2015年12月★★★。

  来源于网络主体的某种偏向,可能造成数据新闻代表性方面的普遍性缺陷★★★,不仅如此★★★,数据中所包含的“刷人气”干扰也常常避免不了★★★。淘宝“信用星★★★”、PaPi酱之类★“新网红”背后的资本操纵力量,不仅让用户也常让媒体公司感到很难把握和辨别数据价值★★。而基于此上的数据化媒介议程将加大新闻客观性评价的难度和偏差★★★。

  ⑩周善★★:《数据新闻★:网站专业生产内容的可循之途》,《编辑之友》2014年第8期。

  这类问题出现在政治新闻报道中,也常让人感到遗憾:★“图解天下”的★★“黄岩岛争端”数据新闻,虽然信息量丰富,南海诸岛地图和纵向伸展的时间线也很清晰,可新闻关键部分的观点★★★、行为编排表达,却★★★“密密麻麻排满了文字,阅读起来难度较大,缺乏吸引力”。

  但这还是基于技术所能完成的,更重要的是★★★,即便拥有多元化、动静态交织甚至VR的模拟呈现,如果只是对文字信息、观点信息★★,做形象符号化的简单转换★★,视觉化的魅力能走多远★★★?这是值得进一步追问的。新闻要更多地避免“刻板印象★”的干扰,通过繁复的多样化互动数据,挖掘出真正的新闻价值所在是其一★★,数据技术工具的掌控者、表达者责任是其二。

  数据新闻市场价值的可持续实现,不能单靠流量的贡献★★,还需开发建立多渠道的盈利模式★。从数据新闻项目立项到数据收集整理、分析挖掘,再到呈现方式选择★★★,数据新闻生产的各个环节都潜藏着盈利的可能。在这方面,彭博社通过30万台终端机向客户提供金融数据,供客户查询、比较、分析并作出决策,该项业务每年至少为公司带来约63亿美元的收入。美国的德克萨斯论坛报(TexasTri-bune)、荷兰DeCorrespondent,西班牙的ElEspanol等媒体机构,其独立调查数据新闻探索了通过网络平台众筹经费的途径。Propublica开放免费和收费两种类型数据商店★★★,虽然大部分是免费版本,但收费数据4个月内即带来超过3万美元的收入★★,谨慎地成功尝试了扩展数据库售卖的业务★★。《卫报》等媒体则提供第三方的API开放服务,付费部分允许获得使用权限的第三方修改原内容并自由推送新应用,而同类免费应用则要承诺义务链接卫报广告。实际上不管付费与否★★★,《卫报》都没有发放★“免费的午餐”★★,但交易条件对双方都具有吸引力,因而成为一种颇有成效的“双赢★★★”策略。此外,数据整理★★、数据分析★★★、数据应用也孕育着经济价值,为媒体盈利模式的探索提供了开放的空间。但尽管如此,同样也不应忽视数据运用背后的安全隐患以及数据营销的合法性风险★★。

  孟威:《网络互动★:意义诠释与规则探讨》★,经济管理出版社2002年版,第214页。

  这是包括网站、论坛、博客★★、视频、★“两微一端”等新媒体新形态都在发问的★★“古老★★”的新问题★★。对于数据新闻来说,难点在于一要找准市场价值点,二要形成核心竞争力。

  ③参见郭晓科:《大数据》,清华大学出版社2013年版★★。卜卫★★:《计算机辅助新闻报道:信息时代记者培训的重要课程》★★★,《新闻与传播研究》1998年第1期★★。方洁、颜冬:《全球视野下的★“数据新闻★”:理念与实践》,《国际新闻界》2013年第6期。蒋欣欣、张超:《数据新闻在中国的发展阶段及其特点研究》。

  受制于不同类型的政治、经济、文化形态的不同程度的信息管控,加之信息公开化、透明度一致是全球范围内相关法律规范亟待完善的共同目标,数据生成、分析★★★、运用,常常变成“数据搬运”过程中的二次加工、二次★★“咀嚼”,权力关系的制约和和数据开放程度的限制,使得数据存储、提取和消化、可视化中不可避免地会出现实质性问题★★,如数据来源受阻、数据变形失真★★、数据意义降解以及数据的滥用等,从而影响数据质量和新闻的真实可靠★。

  对于信息传播实践来讲★★,上述数据新闻的种种隐忧★★★,其实都指向一个可能造成纠结的核心问题——如何实现数据价值?数据新闻的价值实现既体现为数据本身蕴含的市场潜力,包括市价与用户吸引力★★,又考验着媒体的专业角色价值。在这样一个★“信息信息到处都是信息,唯独没有思考的头脑”的时代,五花八门的免费使用模式,快餐一样随处可寻★★★,无数胃口庞大的组织机构或个人,淘金迷般地攫取每一粒数据★,如果媒体丧失了领先的技术水平与其内容打造的专业化优势,无论是何种类型的机构或新闻呈现★★★,都难以持续一场★★★“没有地图★★”指南的美妙旅行。

  这是包括网站、论坛★★、博客★★★、视频、“两微一端”等新媒体新形态都在发问的“古老★★★”的新问题。对于数据新闻来说,难点在于一要找准市场价值点,二要形成核心竞争力★★。

  ③参见郭晓科:《大数据》,清华大学出版社2013年版。卜卫:《计算机辅助新闻报道:信息时代记者培训的重要课程》,《新闻与传播研究》1998年第1期。方洁、颜冬:《全球视野下的“数据新闻”:理念与实践》,《国际新闻界》2013年第6期。蒋欣欣、张超:《数据新闻在中国的发展阶段及其特点研究》。

  学界有一种较为流行的偏颇观点③,只将数据新闻作为以往的计算机辅助报道和精确新闻的延伸发展看待★,笔者不能认同★★★。事实上,从新闻生产起点和系统性上看,不论是计算机辅助报道还是精确新闻★,虽然都不同程度地强调技术运用和技术功能的发挥,但数据新闻对于技术的依赖性★,已表现出断裂于两者的本质上的大跨步,它不是技术的辅助性局部修饰和内容补充★★★,而是从新闻生产起点开始让技术逻辑说话★★★,彻底将技术要素、技术思维贯穿于新闻获取★★★、生成、处理★、发布系统整个流程★,从而造就将数据本身提炼为事实的一种特殊的信息方式,以求得主观让位于客观性表现的传播效果,数据新闻突破了信息“量”的阈限达到新闻生成“质★★”的变化★★★,因其如此★,才可能获得人们畅想的效果——“用数据化的事实说话★★★,比用一般形态的事实说话更显言之凿凿,因而更为有力★、更能服人。”④

  在《通信的数学原理》这部信息论奠基论著里,香农(C★.E.Shannon)认为“从一组可能信息中挑选★★”“真实信息★★★”的前提在于,★★★“系统一定要有计划地操作每个可能性选择★★★”。①新闻是当代生活中最重要的一种真实性信息形态,计算机网络、大数据技术的创新采纳为确保新闻“有计划地”★★“减少不确定性”提供了更新更有效的方式★。当前★,数据新闻被视为其中最具前景的一种报道手段,蒂姆·伯纳斯·李(Timburners-Lee)甚至宣称★:★★“数据新闻就是未来”★★。②

  孟威:《习的新闻舆论观——深入学习习在党的新闻舆论工作座谈会上的讲线期。

  如何吸引注意力,是数据新闻市场竞争力的关键★★。尤·斯卡利(TuroUskali)和库梯(HeikkiKuutti)分析数据新闻在英美媒体的应用认为★,数据新闻产品可作三种类型划分★★★,一是时效类数据新闻(Real-TimeDataJournalism,RDJ)、二是一般类数据新闻(GeneralDataJournalism★,GDJ)三是调查类数据新闻(InvestigativeDataJournalism★★,IDJ)。从资源消耗的角度看,三者的难易程度是由低到高的。理解这一分类,时效类数据新闻注重以庞大的数据库依托★,讲求在事件第一时间做出反应,通过“倒金字塔★”方式将新闻快速融入数据背景之中。机器人写作可算是完成这类任务的重要派生★★,在模式中规中矩的财经报道★★★、体育新闻等领域中被较多采用。一般类数据新闻的范围最广,深度和时效紧迫性要求都介于其他两类之间★,多为非及时性热点★★★,而数据在一定的时段内生成较多★★、易获得,可以给予新闻生产者相对富裕的时间进行较深层面的报道设计与探索,从而综合不同角度★★★,梳理与阐释社会议题★★。因而这一类型的运用最广,如关于某类食品的安全问题★★★、国际动荡地区的热点事件分析等,既不失时效,也可照顾到深度★★。资源耗费最多的是调查类数据新闻,像2016年数据新闻奖(DataJournalismAwards★,DJA)中摘取“公众选择奖★”的《如果叙利亚内战发生在你的国家会怎样?》,针对叙利亚内战状况开发出长达数年的资源,才做出全球领域立体化数字预测报道★★:选择用户所在国,便可查看假设内战发生在此国的悲剧★★★。包括战争、事故死亡人数、缺乏安全用水、需要健康救助★★、流离失所、饥饿、难民人数等状况的数据分析,警醒人们认识战争危害。这类新闻数据获取难度较大★,非多人参与团队难以完成,不仅要展现出数据挖掘★★、处理★★、分析、阐释上的机器采集能力,还需延伸相关采访报道甄别★、剔除冗余,预测数据结果,才能建立起新闻的竞争力。不同类型数据新闻的竞争力要求有所差别,媒体的技术实力、专业能力、用户需求定位准确与否都是决定其市场价值的重要指标。

  强调用户需求★、个人影响关联的数据新闻更关注个性化。但因此而乐观地结论为个性化和数据化、可视化的连接自然能够“更好地服务于公众利益”也未必尽然。从策划选题★★★、内容采集、到发现新闻、找出观点议题、做出数据结论,这一系列过程,虽然伴有筛选验证★★、核实对比★★★,但网络群体倾向化的非客观性因素仍然在所难免。

  数据新闻市场价值的可持续实现,不能单靠流量的贡献,还需开发建立多渠道的盈利模式★。我国转型中的新闻媒体大多技术力量较为薄弱,一方面吸纳和培养技术人才是其当务之急,一方面也应着重探索新闻媒体与技术公司、企业★、院校协同发展的多元化合作途径★,以各施其长“借力发力★★”★,从而实现媒体的后发突进。

  第三,凸显信息服务,整体化视野与个体影响的关联性是数据新闻形成吸引力的核心要素。数据新闻处理过程中的两个重要层次,表现出这种信息服务的★★“关联性”特征★★★:一是分析不断变动的数据以发掘意义结构和宏观价值★,二是通过数据设计展示让用户了解和自主选择哪类信息对他们自身具有重要性和相关性,正如荷兰的数据报道记者范艾斯(VanEss★,H★★★.)所说:“它们着重于呈现问题在哪里……你既可以深入了解个性化细节,也能看清整体状况★★”⑥。

  在强调技术引进的同时也要警惕媒体文化优势的流失问题★。近十几年来★★,随着互联网日益跻身主流传播领域,新闻专业人才的市场价值一降再降,媒体入职选择出现一哄而上过度偏向科技、跨学科人员的极端化趋势,新闻文化价值遭到贬值,连带造成新闻机构、采编从业人员和文科院校淡漠人文素质。新一批新闻从业人员职业素养、伦理导向、文字能力★、智识文化欠缺引发的媒介事件不断★★,在“南京彭宇案”“东北农村约炮”等事件中,严重影响到新闻媒体的公信力。专业竞争能力的减损★,也使原本更具技术优势的商业信息机构能够借机再起,争锋信息内容领域。

  钟瑛★★、李苏:《数据新闻的发展现状★★★、问题及对策》★★,《新闻与写作》2015年第8期。

  受制于不同类型的政治★★、经济、文化形态的不同程度的信息管控★,加之信息公开化、透明度一致是全球范围内相关法律规范亟待完善的共同目标★★,数据生成、分析★★★、运用,常常变成“数据搬运★”过程中的二次加工、二次★★“咀嚼”,权力关系的制约和和数据开放程度的限制★,使得数据存储、提取和消化、可视化中不可避免地会出现实质性问题★★,如数据来源受阻★★★、数据变形失真、数据意义降解以及数据的滥用等,从而影响数据质量和新闻的真实可靠★★。

  凝练数据内涵★★★,将宏观数据与个体日常生活相联系,告诉人们宏观数据是用作什么、说明什么、怎么影响个人生活的,数据新闻要做得“像科学一样严谨,它公开其方法,呈现其结果,才经得起核实验证”⑦从而确保其吸引力★★。

  第二,生产外部化,“PGC★★”“UGC”“OGC”协作,公共传播建构新闻价值是数据新闻的内容特质。★★“开源★★”互联网的共享合作推动和web2.0、web3.0拓展趋势,将用户生产内容的UGC(User-generatedContent)理念深深嵌入新闻业,并带来中国本土化实践中媒体“用户核心意识★★★”前所未有的提升。移动互联网的快速发展,网上内容创作又细分出强调专业、职业生产内容的PGC(Professionally-generatedContent)和OGC(Occupationally-generatedContent)等。数据新闻注重发掘三者的协同作用★★★,体现草根、职业和专业三个层面人力与智力资源的融合★★,构建公共传播的价值,进而“改变传统、昂贵★、费事的信息搜集运用情形,日新月异★”。⑤

  学界有一种较为流行的偏颇观点③★★,只将数据新闻作为以往的计算机辅助报道和精确新闻的延伸发展看待,笔者不能认同。事实上★★,从新闻生产起点和系统性上看★★★,不论是计算机辅助报道还是精确新闻★,虽然都不同程度地强调技术运用和技术功能的发挥,但数据新闻对于技术的依赖性,已表现出断裂于两者的本质上的大跨步,它不是技术的辅助性局部修饰和内容补充,而是从新闻生产起点开始让技术逻辑说话★★,彻底将技术要素、技术思维贯穿于新闻获取、生成★、处理、发布系统整个流程,从而造就将数据本身提炼为事实的一种特殊的信息方式,以求得主观让位于客观性表现的传播效果,数据新闻突破了信息“量”的阈限达到新闻生成“质”的变化,因其如此★,才可能获得人们畅想的效果——★★★“用数据化的事实说话,比用一般形态的事实说话更显言之凿凿,因而更为有力、更能服人★。★”④

  在这方面,美国媒体的一些经验,可以借鉴消除新闻行业的数据技术恐惧★。一些商业公司提供新工具和新服务来帮助人们应对数据挑战★★★,数据新闻编辑并非必须学会所有程序★,但他们能够应用类似TableauPublic、TimeFlow等工具生成新闻、发布可视化数据或分析时间数据。一些商业公司积极探索与媒体建立联系,如IRE(InvestigativeReportsandEditors)与今日美国(USAToday)的合作★,使后者能够扎根在调查报道领域深挖数据★。GoogleSpreadsheets将数据项目“后台”开放给采编人员,使他们可以径直访问应用程序、图表或地图。加强培训和进修提高数据技能也是一种途径★★★,此外,基金会等社会组织参与★,对数据新闻发展亦有贡献★★★。如奈特基金(TheKnightFoundation),每年投入500万美元在★“奈特新闻挑战★★★”(KnightNewsChallenge)竞赛及其他一些合作的项目上,资助了如Every-Block,DocumentCloud等一些数字革新者。

  第一,无技术不新闻,数据新闻的技术依赖性是信息获取、内容生成和新闻呈现的根本性特征★★。数据与大数据发掘★、计算机搜索筛选、储存等功能紧密结合★★★,将数字技术提升至基础性位置,在新闻生成的根本上区别于传统新闻报道中的“数据引用”或“数据采纳”方式。

  刘义昆、卢志坤:《数据新闻的中国实践与中外差异》,《中国出版》2014年下。

  周善:《数据新闻:网站专业生产内容的可循之途》,《编辑之友》2014年第8期。

  但这还是基于技术所能完成的,更重要的是,即便拥有多元化、动静态交织甚至VR的模拟呈现,如果只是对文字信息、观点信息,做形象符号化的简单转换,视觉化的魅力能走多远?这是值得进一步追问的。新闻要更多地避免“刻板印象”的干扰,通过繁复的多样化互动数据,挖掘出真正的新闻价值所在是其一★★,数据技术工具的掌控者、表达者责任是其二。

  在《通信的数学原理》这部信息论奠基论著里★,香农(C.E.Shannon)认为“从一组可能信息中挑选★★★”“真实信息★★★”的前提在于★,“系统一定要有计划地操作每个可能性选择”。①新闻是当代生活中最重要的一种真实性信息形态,计算机网络★、大数据技术的创新采纳为确保新闻“有计划地”“减少不确定性★★★”提供了更新更有效的方式。当前,数据新闻被视为其中最具前景的一种报道手段★★★,蒂姆·伯纳斯·李(Timburners-Lee)甚至宣称★★:“数据新闻就是未来”。②

  RUC新闻坊:《2016全球数据新闻将(DJA)今早颁布!“元老级★”数据新闻奖带来了那些新启示?》2016/06/17。

  在这方面,美国媒体的一些经验★★★,可以借鉴消除新闻行业的数据技术恐惧★。一些商业公司提供新工具和新服务来帮助人们应对数据挑战,数据新闻编辑并非必须学会所有程序★★★,但他们能够应用类似TableauPublic★、TimeFlow等工具生成新闻、发布可视化数据或分析时间数据。一些商业公司积极探索与媒体建立联系,如IRE(InvestigativeReportsandEditors)与今日美国(USAToday)的合作★★★,使后者能够扎根在调查报道领域深挖数据。GoogleSpreadsheets将数据项目“后台★★★”开放给采编人员,使他们可以径直访问应用程序、图表或地图★。加强培训和进修提高数据技能也是一种途径,此外★,基金会等社会组织参与,对数据新闻发展亦有贡献。如奈特基金(TheKnightFoundation)★★★,每年投入500万美元在“奈特新闻挑战”(KnightNewsChallenge)竞赛及其他一些合作的项目上,资助了如Every-Block,DocumentCloud等一些数字革新者。

  数据新闻市场价值的可持续实现★★,不能单靠流量的贡献,还需开发建立多渠道的盈利模式。从数据新闻项目立项到数据收集整理★★、分析挖掘,再到呈现方式选择★,数据新闻生产的各个环节都潜藏着盈利的可能★★★。在这方面,彭博社通过30万台终端机向客户提供金融数据★,供客户查询、比较★、分析并作出决策★,该项业务每年至少为公司带来约63亿美元的收入。美国的德克萨斯论坛报(TexasTri-bune)★★、荷兰DeCorrespondent★★★,西班牙的ElEspanol等媒体机构,其独立调查数据新闻探索了通过网络平台众筹经费的途径★★。Propublica开放免费和收费两种类型数据商店★★,虽然大部分是免费版本★★★,但收费数据4个月内即带来超过3万美元的收入★,谨慎地成功尝试了扩展数据库售卖的业务。《卫报》等媒体则提供第三方的API开放服务,付费部分允许获得使用权限的第三方修改原内容并自由推送新应用★★★,而同类免费应用则要承诺义务链接卫报广告。实际上不管付费与否,《卫报》都没有发放★“免费的午餐”,但交易条件对双方都具有吸引力,因而成为一种颇有成效的“双赢”策略★。此外,数据整理、数据分析、数据应用也孕育着经济价值,为媒体盈利模式的探索提供了开放的空间★。但尽管如此★★,同样也不应忽视数据运用背后的安全隐患以及数据营销的合法性风险。

  ⑧周碧帆:《〈新闻联播〉中数据新闻的可视化表达》,《新闻研究》2015年12月★★★。

  周善:《数据新闻:网站专业生产内容的可循之途》,《编辑之友》2014年第8期★★★。

  成也萧何败也萧何,数据新闻的前景同样要看市场的脸色与竞争的法则。2013年数字新闻网站EveryBlock关闭,美国在线(AOL)的Patch网宣布裁员转型。2014年4月,号称“数字第一”的媒体(DigitalFirstMedia)关闭了着重打造的“霹雳★★”(ThunderDome)项目★★。HomicideWatch因负担不起每年6万美元数据库维护更新费用而关闭也成为前车之鉴。有研究分析★,“失败个案的共同特点是,媒介组织拥有丰富的数据资源,但对传统的盈利模式依赖大★,数据驱动的新盈利模式不清晰”★。

  第二,生产外部化,“PGC”“UGC”★★“OGC★”协作,公共传播建构新闻价值是数据新闻的内容特质。★★★“开源”互联网的共享合作推动和web2.0、web3.0拓展趋势,将用户生产内容的UGC(User-generatedContent)理念深深嵌入新闻业★★,并带来中国本土化实践中媒体★★“用户核心意识”前所未有的提升。移动互联网的快速发展,网上内容创作又细分出强调专业★、职业生产内容的PGC(Professionally-generatedContent)和OGC(Occupationally-generatedContent)等。数据新闻注重发掘三者的协同作用★★,体现草根、职业和专业三个层面人力与智力资源的融合,构建公共传播的价值★★★,进而“改变传统、昂贵、费事的信息搜集运用情形,日新月异”。⑤

  这类问题出现在政治新闻报道中★,也常让人感到遗憾:“图解天下”的“黄岩岛争端★★★”数据新闻,虽然信息量丰富,南海诸岛地图和纵向伸展的时间线也很清晰,可新闻关键部分的观点、行为编排表达★,却“密密麻麻排满了文字,阅读起来难度较大,缺乏吸引力”。

  ⑩周善★★:《数据新闻:网站专业生产内容的可循之途》★★,《编辑之友》2014年第8期★。

  数据信息怎样实现多样化呈现也是一个问题。首先要解决的是方法匮乏。有研究者梳理国内媒体所制作的数据新闻认为,“所制作的数据新闻基本都是单一的图解新闻形式★★★”、“中国的数据新闻仍停留在平面编辑的层面”★★★。数据新闻的表现形式不仅包含图表★、地图、画册等静态形式★★,也要有多态的动感交互。采用编码、互动图表★、视频短片、3D动画、虚拟游戏等最新的新闻生产技术,增强数据新闻报道的生动表现力。在2016年数据新闻奖(DataJournalismAwards,DJA)获奖作品中★★,获得★★★“最佳数据可视化奖”的BuzzFeedNews专题报道《天空中的密探》,通过分析航班追踪网站Flightradar24上得到的200架美国联邦飞机定位数据,形成了★★★“一幅前所未有的关于行动规模和范围的途径★”,地图形式不仅展示出★“变化的时间序列★★★,并同时展现了累积的飞行路线及随时间变化的航班动态”,其视觉表现和内容解释相得益彰令人震撼★★★,给评委留下了深刻的印象★★。而在如百度等搜索公司呈现的大多公交、餐饮“数读”中,一座城市的地图★★,虽已可用放大镜标示出人流聚集区域或标志物的分布★★★,但大多还是静态的★★★。若能够进一步制作成为动态十足、基于移动端消费的新闻应用,如做出个性定位使用、街区、餐饮★★、娱乐导航、新闻传递等更深挖掘,数据的新闻价值能量恐怕远非今日的★“数读图”所能企及。

  钟瑛★★、李苏★★★:《数据新闻的发展现状、问题及对策》,《新闻与写作》2015年第8期★★。

  这涉及数据的获取渠道★★、数据提供者身份★★、习惯以及数据使用中的权力关系★。计算机行业从结构上划分,将数据主要视作两种类型,一种为结构性数据,一种是非结构性数据。前者是★★★“指存储在数据库当中、有统一结构和格式的数据★★★”,后者指“无法用数字或统一的结构来表示的信息”★★★,⑨两者获取渠道不同★★,结构性数据包括政府组织、市场调查机构★★★、基金会等发布的多种统计数字、报表报告等。非结构性数据则包括网络上或社会中流传的视频语音★、信息图片、产品广告等,其蕴藏的信息量之大无法计数。有研究表明,目前中国新浪、搜狐、网易★★、腾讯四大商业门户网站数据新闻中结构性数据占近80%,非结构性数据占比20★★.20%。⑩在获取数据的过程中,权威组织与各种类型的社会机构,以及普通公众都是不可忽视的信息来源★★,而信息源的造价和不真实问题一直是网络传播中难以治愈的顽疾★★★。获取数据中的信息源陷阱存在于各个方面,如背弃承诺的个体★★★、爱炒作的记者、“客里空”的善意★★、交易时效压力下的公司★★★、容易上当的编辑,一旦数据信息出现判断力失误,所导致的后果将是连锁性、系列化的新闻失实,这比单条新闻失实的影响更为糟糕。

  凝练数据内涵★★★,将宏观数据与个体日常生活相联系,告诉人们宏观数据是用作什么、说明什么★★★、怎么影响个人生活的★★★,数据新闻要做得★★★“像科学一样严谨,它公开其方法★,呈现其结果,才经得起核实验证★★”⑦从而确保其吸引力。

  孟威★★★:《媒介伦理的道德论据》,经济管理出版社2012年版★★★,第11页、55页。

  信息处理环节中的数据清洗,也使新闻真实暗藏“短板”。数据清洗通常采用两种做法:其一是“检查数据的一致性,将新获取的数据转换成与已使用数据相一致的形式”;其二是“处理无效值和缺失值等”。因为重复★、损坏条目、格式错误★★、数据丢失等问题普遍存在★★★,常需借助Excel★、GoogleRefine等软件进行整理或清洗,而其中的个人因素★、公司倾向等对于★★★“重建”数据的真实性干预同样令人担忧★★。

  数据新闻市场价值的可持续实现,不能单靠流量的贡献★,还需开发建立多渠道的盈利模式。我国转型中的新闻媒体大多技术力量较为薄弱,一方面吸纳和培养技术人才是其当务之急,一方面也应着重探索新闻媒体与技术公司、企业、院校协同发展的多元化合作途径,以各施其长“借力发力”,从而实现媒体的后发突进。

  第四★★★,讲故事重理趣★,多维、互动、可视化呈现,数据新闻立体化阐释抽象概念、逻辑、观点★★,这是其形态上的新突破。可视化是数据新闻的表达亮点,视觉元素不仅可以丰富报道形式,还可以让信息去枯燥化,充满美感和理趣。目前,数据可视化已形成了9种主要表达方式★★★:地图★、简单图示★★★、饼状图★、柱状图、坐标图★★★、交互动态图★★★、三维动画、虚拟人物、虚拟场景⑧★★,数字技术将平面化的图像立体化★★★、活起来,增加了表义的生动性。如在央视2015年3月2日《国家忙碌一年百姓怎么看》一则数据新闻中,配合数据解析★,主持人谈到“反腐倡廉★★”打★“苍蝇”话题时,又挥手拍了身边的正在嗡嗡作响的三只动画苍蝇★,并评论道“拍苍蝇也绝不能含糊★★”,通过虚拟空间和数据可视化技术将表达的内涵变得更加立体清晰、形象鲜活。

  数据新闻指运用互联网数字化技术★★,通过数据抓取、挖掘★、统计★、分析等生成、推出的一种新型新闻报道方式★★。其生产流程主要包括数据获取——数据聚焦——数据分析——数据可视化★★★。虽然对数字新闻的定义还远未统一★★★,但作为一种新型新闻应用,全球化数字新闻的实践尝试已风声鹊起。21世纪初基于对开发大数据的重视,互联网开源软件市场更加成熟★★★,“开放数据运动”因之勃兴。英国《卫报》★、英国广播公司(BBC)、美国《》(NewYorkTimes)、《华尔街日报》(TheWallStreetJournal)、ZEITONLINE新媒体等相继探索数据新闻报道模式,形成了诸如“数据商店”(Data-store)、“数据博客”(DataBlog)★★★、“无所不知的电话”(Tell-allTelephone)等数据新闻频道★★★、专栏★★、品牌。近年来★★★,中国数据新闻实践也快速跟进,2012年前后★★★,网易“数读”★★★、新浪“图解新闻”★、搜狐“数字之道”、腾讯★“数据控”等数字频道相继开办。2013年传统媒体加紧涉足这一领域。2014年8月,国家《关于推动传统媒体和新兴媒体融合发展的指导意见》出台★,传统媒体和新兴媒体融合迅速进入发展快车道,实践界以可视化、数据化★★★、智能化为重点,尝试建立新型数据新闻编辑室★★、推广机器人写作等创新方式,对传媒业者提出了数字新闻报道的更高要求。2015年8月,中国政府颁布《促进大数据发展行动纲要》,进一步促进了全社会信息应用和数据价值实现★,引发了信息领域新一轮媒介数字新闻发展高潮★。人民网★★、央视等媒体大跨度推进,携手百度★★★、亿赞普和腾讯微博等互联网企业,共同发挥优势,合作打造信息版块,在数据新闻方面推出了像★★★“数字两会”、★★“H5读懂‘十三五★★’★”等大型数据新闻报道★★★,通过大数据收集、挖掘、分析和可视化呈现★★★,为用户带来全新收视体验和分享视角。深度融入信息化环境,传媒新闻领域数字红利释放★,拓宽报道途径丰富了新闻生态。

  就盈利模式和核心竞争力来看,数据新闻的完美实践还有较长的路要走★★。广告获利的主导性模式需要打破,以“看图说话★★★”、动态图表、信息图三种模式为主打的数据报道定型亟待破局★★,技术与专业人才等资源能否合作匹配也是保持市场获利的大问题。不对此一一解决,随着市场消费热情的渐趋平淡、用户新消费习惯的渐趋适应,如今看似热闹的数据新闻,难免遭遇数年前精确新闻报道昙花一现的运命。

  第一,无技术不新闻★★★,数据新闻的技术依赖性是信息获取、内容生成和新闻呈现的根本性特征。数据与大数据发掘、计算机搜索筛选、储存等功能紧密结合,将数字技术提升至基础性位置,在新闻生成的根本上区别于传统新闻报道中的★“数据引用”或★★★“数据采纳★★★”方式。

  时效性考量之下★,利用社会化媒体和搜索引擎搜寻网民爆料和关注话题,对此加以归类分析并设置热点,可能受制于网民特定群体的使用特征★、亚文化时尚或某种倾向性社会情绪★★★。在对女歌星汤灿案、官员案等的反腐报道时,有些只用数据链接的方式,将网上众说纷纭的人物和事件作短时处理的数据新闻,并没有尽如人意地还原出事件的真相,反而受到倾向性情绪误导★★★,让用户甚至点读出人物存亡与否的不真实报道★★★。

  数据新闻指运用互联网数字化技术,通过数据抓取、挖掘、统计、分析等生成★★、推出的一种新型新闻报道方式★。其生产流程主要包括数据获取——数据聚焦——数据分析——数据可视化★★★。虽然对数字新闻的定义还远未统一,但作为一种新型新闻应用,全球化数字新闻的实践尝试已风声鹊起★★。21世纪初基于对开发大数据的重视,互联网开源软件市场更加成熟,★“开放数据运动”因之勃兴。英国《卫报》、英国广播公司(BBC)、美国《》(NewYorkTimes)、《华尔街日报》(TheWallStreetJournal)、ZEITONLINE新媒体等相继探索数据新闻报道模式★,形成了诸如“数据商店”(Data-store)、“数据博客”(DataBlog)、“无所不知的电话”(Tell-allTelephone)等数据新闻频道、专栏、品牌★★。近年来★,中国数据新闻实践也快速跟进,2012年前后★★,网易“数读”、新浪★“图解新闻”、搜狐“数字之道”、腾讯“数据控★★”等数字频道相继开办★。2013年传统媒体加紧涉足这一领域。2014年8月,国家《关于推动传统媒体和新兴媒体融合发展的指导意见》出台★★,传统媒体和新兴媒体融合迅速进入发展快车道★★,实践界以可视化、数据化、智能化为重点,尝试建立新型数据新闻编辑室、推广机器人写作等创新方式,对传媒业者提出了数字新闻报道的更高要求。2015年8月,中国政府颁布《促进大数据发展行动纲要》,进一步促进了全社会信息应用和数据价值实现,引发了信息领域新一轮媒介数字新闻发展高潮。人民网★★、央视等媒体大跨度推进,携手百度、亿赞普和腾讯微博等互联网企业,共同发挥优势,合作打造信息版块,在数据新闻方面推出了像★“数字两会”★★、“H5读懂‘十三五’”等大型数据新闻报道,通过大数据收集★★★、挖掘★、分析和可视化呈现,为用户带来全新收视体验和分享视角★★。深度融入信息化环境★,传媒新闻领域数字红利释放★★★,拓宽报道途径丰富了新闻生态★★。

  第四,讲故事重理趣,多维、互动★、可视化呈现,数据新闻立体化阐释抽象概念、逻辑、观点★★,这是其形态上的新突破。可视化是数据新闻的表达亮点,视觉元素不仅可以丰富报道形式★,还可以让信息去枯燥化,充满美感和理趣★★。目前,数据可视化已形成了9种主要表达方式:地图、简单图示、饼状图、柱状图、坐标图★、交互动态图★、三维动画、虚拟人物、虚拟场景⑧,数字技术将平面化的图像立体化、活起来★★,增加了表义的生动性。如在央视2015年3月2日《国家忙碌一年百姓怎么看》一则数据新闻中★★,配合数据解析,主持人谈到“反腐倡廉”打★“苍蝇”话题时,又挥手拍了身边的正在嗡嗡作响的三只动画苍蝇★★★,并评论道★“拍苍蝇也绝不能含糊”,通过虚拟空间和数据可视化技术将表达的内涵变得更加立体清晰★★★、形象鲜活。

  数据新闻的比较优势构成了对它自身的特殊要求★。数据新闻生产周期一般会比传统新闻采写周期长,对技术与专业人才的需求也更为迫切。目前的现状是,我国转型中的新闻媒体大多技术力量较为薄弱,一方面吸纳和培养技术人才是其当务之急,一方面也应着重探索新闻媒体与技术公司、企业★★、院校协同发展的多元化合作途径★★★,以各施其长“借力发力★★”,从而实现媒体的后发突进★★。

  如何吸引注意力,是数据新闻市场竞争力的关键。尤·斯卡利(TuroUskali)和库梯(HeikkiKuutti)分析数据新闻在英美媒体的应用认为,数据新闻产品可作三种类型划分★★,一是时效类数据新闻(Real-TimeDataJournalism★★★,RDJ)★★★、二是一般类数据新闻(GeneralDataJournalism,GDJ)三是调查类数据新闻(InvestigativeDataJournalism,IDJ)★★。从资源消耗的角度看,三者的难易程度是由低到高的★。理解这一分类,时效类数据新闻注重以庞大的数据库依托,讲求在事件第一时间做出反应★★★,通过★“倒金字塔★★”方式将新闻快速融入数据背景之中★★★。机器人写作可算是完成这类任务的重要派生,在模式中规中矩的财经报道、体育新闻等领域中被较多采用。一般类数据新闻的范围最广,深度和时效紧迫性要求都介于其他两类之间,多为非及时性热点★★,而数据在一定的时段内生成较多★、易获得★★,可以给予新闻生产者相对富裕的时间进行较深层面的报道设计与探索,从而综合不同角度,梳理与阐释社会议题。因而这一类型的运用最广★★★,如关于某类食品的安全问题、国际动荡地区的热点事件分析等★★,既不失时效,也可照顾到深度。资源耗费最多的是调查类数据新闻★,像2016年数据新闻奖(DataJournalismAwards,DJA)中摘取★“公众选择奖”的《如果叙利亚内战发生在你的国家会怎样★?》,针对叙利亚内战状况开发出长达数年的资源,才做出全球领域立体化数字预测报道★★:选择用户所在国★★★,便可查看假设内战发生在此国的悲剧。包括战争、事故死亡人数、缺乏安全用水、需要健康救助、流离失所★★★、饥饿、难民人数等状况的数据分析,警醒人们认识战争危害。这类新闻数据获取难度较大★★★,非多人参与团队难以完成,不仅要展现出数据挖掘、处理★★★、分析★★★、阐释上的机器采集能力★★,还需延伸相关采访报道甄别、剔除冗余★★★,预测数据结果★★,才能建立起新闻的竞争力。不同类型数据新闻的竞争力要求有所差别★★,媒体的技术实力、专业能力、用户需求定位准确与否都是决定其市场价值的重要指标。

  RUC新闻坊★★:《2016全球数据新闻将(DJA)今早颁布!“元老级★★★”数据新闻奖带来了那些新启示?》2016/06/17。

  强调用户需求、个人影响关联的数据新闻更关注个性化★★★。但因此而乐观地结论为个性化和数据化、可视化的连接自然能够★“更好地服务于公众利益”也未必尽然。从策划选题、内容采集、到发现新闻、找出观点议题★、做出数据结论,这一系列过程,虽然伴有筛选验证★、核实对比,但网络群体倾向化的非客观性因素仍然在所难免★★。

  这一特征在2011年的伦敦骚乱事件过后,《卫报》的数据新闻★“解读骚乱”中即有体现★★,新闻报道机构对骚乱参与者、警察★、市民★★★、政界人士搜集数据展开深度访谈,搜索法庭案件卷宗及政府★★★、社会组织统计资料★★★、社交媒体内容,将Twitter上257万条骚乱相关信息用作分析来源依据,并与学者合作推出《解读骚乱》小册子,使得新闻报道更带有前瞻性的研究价值,所做报道和结论收获了新闻业界和公众层面的广泛认同。

  数据信息怎样实现多样化呈现也是一个问题。首先要解决的是方法匮乏。有研究者梳理国内媒体所制作的数据新闻认为★,“所制作的数据新闻基本都是单一的图解新闻形式★★★”、“中国的数据新闻仍停留在平面编辑的层面★★”★。数据新闻的表现形式不仅包含图表★★、地图、画册等静态形式★★,也要有多态的动感交互★★。采用编码、互动图表★★、视频短片、3D动画、虚拟游戏等最新的新闻生产技术★,增强数据新闻报道的生动表现力。在2016年数据新闻奖(DataJournalismAwards,DJA)获奖作品中★★★,获得“最佳数据可视化奖”的BuzzFeedNews专题报道《天空中的密探》★,通过分析航班追踪网站Flightradar24上得到的200架美国联邦飞机定位数据★,形成了★★★“一幅前所未有的关于行动规模和范围的途径”,地图形式不仅展示出★“变化的时间序列,并同时展现了累积的飞行路线及随时间变化的航班动态”,其视觉表现和内容解释相得益彰令人震撼★,给评委留下了深刻的印象。而在如百度等搜索公司呈现的大多公交★★、餐饮★★★“数读”中★,一座城市的地图,虽已可用放大镜标示出人流聚集区域或标志物的分布,但大多还是静态的。若能够进一步制作成为动态十足★★★、基于移动端消费的新闻应用★★★,如做出个性定位使用、街区、餐饮、娱乐导航★★★、新闻传递等更深挖掘,数据的新闻价值能量恐怕远非今日的“数读图”所能企及。