您所在的位置:福建记协> 经营堂 > 正文

大数据时代传媒业的变革

2014-02-14 15:15:07  来源: 人民网  作者: 张 潇?  
视频加载中...

摘 要:大数据时代来临之后,传媒作为信息产业也不可避免的收到了冲击。本文分析了大数据的四个特点,分别从传播效果、新闻价值、新闻业务、传媒数据库、媒体的功能和媒体从业人员探讨了大数据带来的冲击和影响。最后分析了大数据带来的负面影响:泄露隐私的危险。

关键词:大数据;传媒业;变革;隐私

2002年,有一部上映的科幻片——《少数派报告》,讲述的是在2054年的美国,谋杀已经消失,犯罪可以被预知。有三个具有感知未来超能力的人——先知,可以在事前得到犯罪的信息,经过司法部的预防犯罪小组破译犯罪证据之后,罪犯在实施犯罪之前就会得到惩罚。而这一切似乎将要变为现实,只不过电影中用的是超能力,而今运用大数据。

2009年,在甲型H1N1流感爆发的前几周,谷歌通过观察人们在网上的搜索记录就提前预测了流感的传播。谷歌保存了多年来所有的搜索记录,每天收到来自全球超过30亿条的搜索指令,通过分析这些庞大的数据资源,而得出了这个结论。

世界著名咨询机构麦肯锡公司于 2011年5月发布了《大数据:下一个创新、竞争和生产力的前沿》报告,掀开了大数据研究的序幕。作为从经济和商业维度诠释大数据发展潜力的第一份专题研究成果,该报告系统阐述了大数据概念,详细列举了大数据的核心技术,深入分析了大数据在不同行业的应用,明确提出了政府和企业决策者应对大数据发展的策略。

一、大数据简介

麦肯锡认为,“大数据”是指其大小超出了典型数据库软件的采集、储存、管理和分析等能力的数据集。该定义有两方面内涵:一是符合大数据标准的数据集大小是变化的,会随着时间推移、技术进步而增长;二是不同部门符合大数据标准的数据集大小会存在差别。目前,大数据的一般范围是从几个TB到数个PB。

大数据(big data),究竟这个数据有多大。很多人试图测量出一个确切的数字。南加利福尼亚大学的马丁?希尔伯特(Martin Hilbert)试图得出人类所创造的、存储和传播的一切信息的确切数目。据他估算,2007年,人类大约存储了超过300艾字节的数据[1]。他预测,到2013年,世界上存储的数据能达到约1.2泽字节。这意味着:如果把这些数据全部记在书中,可以覆盖整个美国52次,如果将其存储在只读光盘上,这些光盘可以堆成五堆,每一堆都可以延伸到月球[2]。

IBM将大数据的特点总结为4个V:

(一) Volume

数据体积巨大,在我们需要处理数据的时候,不再需要随机样本,而是全体数据。即样本=全体。小数据时代随机抽样,我们用最少的数据获得最多的信息。因为技术的限制,取得过多的样本会消耗大量的成本和精力。现在,技术环境已经有了很大的改善,依然进行抽样分析就类似于在汽车时代依然骑马一样。大数据注定对社会科学有最大的撼动,因为我们再也不用依赖抽样调查了。

(二)Variety

数据的类型及来源繁多并且包含越来越多的非结构化数据(如图像、声音等信息);大数据的来源主要有这样几个方面[3]:

一是媒体数据,特别是互联网、社交媒体产生的数据,包括人们浏览网页的数字化记录等;

二是各类企业的生产、销售、管理等等数据;

三是政府部门的数据;

四是物联网、各种传感器产生的数据,以及未联网的各种摄像头拍摄的数据;

五是民众个人留存的数据,包括个人、家庭文字及音像数据。

数据类型和数量的繁多,各种数据鱼龙混杂,直接带来的结果就是错误数据的增多,精确度的下降。在小数据时代,在抽样调查的时候我们要对我们的调查的信度和效度负责,所以数据越精确越好。但是现在不是这样了,在大数据时代,我们掌握的数据越来越全面,它不仅包括现象的一点点数据,而是包括了与这些现象相关的大量甚至全部的数据。我们要做的就是接受这些纷繁的数据并从中获益,而不是以高昂的代价消除所有的不确定性。