“大数据”爆发的时代已经到来

        “数据爆炸”已经出现。大数据会使全球制造业、政府、零售商、金融机构获得很多数据,并由此产生巨大的商业价值。例如全球个人用户使用地理信息数据的商业价值就高达6000亿美元,美国医疗行业数据价值每年可达3000亿美元。

1. 从 “数据”到 “知识”

       最早提出“大数据时代已经到来”的机构是全球知名咨询公司麦肯锡。

       2011年,麦肯锡在题为《海量数据,创新、竞争和提高生成率的下一个新领域》的研究报告中指出,数据已经渗透到每一个行业和业务职能领域,逐渐成为重要的生产因素; 而人们对于海量数据的运用将预示着新一波生产率增长和消费者盈余浪潮的到来。

       维基百科对于“数据”一词的定义是:“数据(Data)是载荷或记录信息的按一定规则排列组合的物理符号,可以是数字、文字、图像,也可以是计算机代码。对信息的接收始于对数据的接收,对信息的获取只能通过对数据背景的解读。数据背景是接收者针对特定数据的信息准备,即当接收者了解物理符号序列的规律,并知道每个符号和符号组合的指向性目标或含义时,便可以获得一组数据所载荷的信息。亦即数据转化为信息,可以用公式‘数据+背景=信息’表示。”

数据与信息的区别在于: 数据是对信息数字化的记录; 信息是指把数据放置在一定的背景下,对数字进行解释、赋予意义。

       在进入信息时代之后,人们趋向把所有存储在计算机上的信息,无论是数字还是音乐、视频、图片,都统称为数据。正因为数据承载着信息,所以在应用过程当中,这些数据就不再仅仅是对客观现象的记录或纷繁无序的数值,而是带着特殊意义和价值。人们通过对这些数据的交换、整合、分析,来解释各种现象背后的原因,同时预测事物的发展趋势,这样一来,数据就成为了“知识”,可以说,数据正是知识的来源。当下的政府、医疗卫生、公共安全、环境气象、交通道路等等各个行业都在利用数据指导决策、预测趋势。

2.从“数据库”到“大数据”

       涂子沛所著的《大数据》用专门的章节讲述“商务智能的前世今生”,并梳理了近年来人类社会活动当中数据搜集、处理和分析这一行为的发展过程。1970年,IBM研究院的埃德加·科德发明了关系型数据库,成为软件发展历史上一个跨越性的里程碑,也是大数据处理技术最为原始的起步。1992年,被称为数据仓库之父的比尔·恩门出版了《数据仓库之构建》,将数据仓库定义为:一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理中的决策制定。再之后,“联机分析”出现,人类开始把分离的数据库相联,进行多维度的分析。于是,以关系型数据库为基础的运营式信息系统出现。联机分析是对数据仓库中数据信息的一种挖掘与运用操作,是将数据转化为信息和知识最主要的手段。如果说联机分析是对数据的一种透视性的探测,数据挖掘的主要目的则是发现潜藏在数据表面之下的历史规律和对未来进行预测。

进入21世纪之后,数据可视化成为数据挖掘的另一项结果性要求,通过把复杂的数据转化为直观的图形,并呈现给最普通的用户,使之成为浅显易懂、人皆可用的工具和手段。在不断发展与演变的基础之上,云计算和大数据出现。

       大数据是指那些大小已经超出了传统意义上的尺度,一般的软件工具难以捕捉、存储、管理和分析的数据。人类对于数据的计量单位已经从位、字节、千字节、兆字节、太字节走向了泽字节甚至尧字节。麦肯锡全球研究所认为,我们并不需要给“什么是大数据”一个具体的尺寸,因为随着技术的进步,这个尺寸本身就在不断增大,而且对于各个不同的领域,“大”的定义也不尽相同,无需统一。自从人类有印刷术以来,过往上千年所有的印刷材料只相当于200PB;而在2011年全球数据使用量已达到了1.8ZB(1ZB约为1PB的100万倍)。据市场研究公司IDC的统计,全球数字信息在未来几年将呈现惊人增长,预计到2020年总量将是现在的44倍,全球数据使用量将达到大约35.2ZB(1ZB=10亿TB)。大数据技术正是从海量的、多样化的数据中,快速获得有价值信息的能力。

3.“数据”与营销的“科学性”

        人类所有的知识,可以划分为三个大类: 自然科学、社会科学和人文艺术。其中,自然科学最为“精确”; 社会科学研究的是社会现象,探讨的是人和社会的关系,在追求精确的同时又因为关系到个性化极强的“人”和变化无穷的“心理”影响而常常出现“测不准”的现象,因此也被称为“准科学”;人文艺术则主要包括文学、艺术和哲学,并不强调精确。而营销属于社会科学的大范畴之类,广告又与人文艺术相关联,因此才被称为是科学与艺术的结合,是一种交叉性的学科。

       2007年,雅虎的首席科学家沃茨博士在《自然》上发表了一篇题为《21世纪的科学》的文章,认为得益于计算机技术和海量数据库的发展,个人在真实世界的活动得到了前所未有的记录,这种记录为社会科学的定量分析提供了极为丰富的数据。由于能够测得更准、计算得更加精确,他认为社会科学将脱下“准科学”的外衣,真正走进科学的殿堂。对于营销来说,也是同样。一直以来,营销的科学性正是因为运用了自然科学中的数据收集手段,严谨地记录、搜集和分析消费者的各项数据和行为轨迹,同时又采纳了社会心理学的方法,透过现象去解释人的内心世界。这种主客观的结合让营销能够无限接近真实的推测市场需求的方向,让生产者与消费者能够达到和谐交换。因此,数据与营销之间存在着密不可分的关系。当联机分析、数据挖掘出现之后,人类获取知识的手段也有了跨越式的发展。营销与广告学科也在此时能够综合运用各种数据与信息进行交互式的分析,日臻成熟。然而随着大数据时代的到来给社会科学、营销学带来巨大全新可能的同时,也使得原本的营销体系和理论模型有效性出现了崩塌。

蜀ICP备15035023号-4