你知道大数据长什么样吗?

我相信很多人都有工作时来杯咖啡的习惯,咖啡有很多种类,比如美式、拿铁、卡布奇诺、意式浓缩……美式是1份浓缩咖啡+2份水;拿铁是一份浓缩咖啡+1.5份热牛奶+0.5份奶泡;卡布奇诺是一份浓缩咖啡+0.5份热牛奶+1.5份奶泡;意式浓缩是一份浓缩咖啡……我花了很长的时间去看文字版解说,但是依然印象模糊。直到看到下图:

“视觉是人类最强的信息输入方式,是迄今我们最主要的感官,人类感知周围世界最强的方式,占用着我们大脑中一半的资源。“所以如上所说图像概念比文字概念更容易了解。类比到大数据也是同样的。如今,大数据这个名词肆虐,提到大数据你的脑海中是否会出现这样一张图像:

这种借助于图形化手段,清晰有效地传达与沟通信息的方式,我们叫做数据可视化。接下来,我将通过可视化的方式为大家展示“大数据长什么样”。

如何通过数据可视化描述“大数据的模样”

用信息图专门针对数据进行描述而设计的过程我们通常称为数据可视化。举个栗子:

中国2233家大数据企业名单

(1)通过网络收集,我们获得了一份真实数据表格:

(2)把企业数量,按照注册地,用统计图表达出来,我们可以得出北京、上海、深圳、杭州、广州、江苏、广东、成都、武汉、天津这些城市的大数据企业数量排名全国前十,也可以看出我国的数字产业更集中于东部沿海城市,西部数成都、武汉发展最快。

(3)把2233家企业的业务领域根据词频生成的标签云中,我们可以看出,此标签云图像对我国的大数据企业进行了简单的数据画像,更多的企业业务为数据营销、医疗健康、金融、AI技术、云服务平台……

由此我们可知,“数据的样子”就是进行数据画像,通过各种信息图对数据进行清晰、易懂的可视化展示。而上述的例子都只是单维度的数据可视化展示,对于拥有多源、多维数据的企业/政府来说,这完全展示不出他们的“数据的样子”,所以我还要引入一个大屏数据可视化的概念。

什么是大屏数据可视化

大屏数据可视化就是指通过整个超大尺寸的LED屏幕来展示关键数据内容。利用面积大、可展示信息多的特点,通过关键信息大屏共享的方式可方便团队讨论和决策,故大屏也常用来做数据分析监测使用。大屏数据可视化目前主要有信息展示、数据分析及监控预警三大类。

比如:

这是探码科技开发的一个投融资与并购大数据平台,聚合资本市场上的所有并购信息。同时以大屏展示实时成交数据、历史数据以及周报数据。通过大屏数据可视化,成千上万的投融资项目再也不是互联网里面杂乱无章的数据,拥有了自己的“模样”,同时也更好的起到了决策支撑作用。

一个好的大屏数据可视化平台的构建需要包含以下功能:

  • 数据采集:数据采集是数据分析和可视化的第一步,俗话说“巧妇难为无米之炊”,数据采集的方法和质量,很大程度上就决定了数据可视化的最终效果。
  • 数据处理和变换:数据处理和数据变换,是进行数据可视化的前提条件,包括数据预处理和数据挖掘两个过程。通过这两个过程提高数据的质量、挖掘数据的特征。
  • 可视化映射:对数据进行清洗、去噪,并按照业务目的进行数据处理之后,接下来就到了可视化映射环节。可视化映射是整个数据可视化流程的核心,是指将处理后的数据信息映射成可视化元素的过程。可视化元素包括柱形图、折线图、条形图、饼图、面积图、玫瑰图、环形图、散点图、气泡图、雷达图、仪表盘、组合图、地图、甘特图、gis地图、圆环图、漏斗图、框架图、矩形树图、词云图等几十种图表大类。

  • 人机交互:良好的交互分析体验,可以帮助用户更好的阅读报表,发现数据价值。好的交互,包括图表钻取、图表联动、数据联动、参数查询、数据分析等环节。例如,成都高新区双创企业电子地图。

  • 用户感知:可视化的结果,只有被用户感知之后,才可以转化为知识和灵感。用户在感知过程,除了被动接受可视化的图形之外,还通过与可视化各模块之间的交互,主动获取信息。

随着大部分企业对数据存储和数据可视化的逐渐重视,大屏数据可视化需求正在逐步扩大,例如实时监测中心、应急指挥中心这些需要依据实时数据快速做出决策的场所,以及如政府展厅、企业展览中心之类以数据展示为主的展示场所,还有如电商平台在大促活动时对外公布实时销售数据来作为广告公关手段等等。除此之外,还同样适用于会议演示、商业智能、生产可视化、IT运维、智慧城市、园区管理等场景。

IT 技术的不断发展,数据可视化的形式将不断的升级,大数据也将慢慢揭开神秘的面纱,以通俗易懂、清晰明了的形式展现在人们的眼前。

蜀ICP备15035023号-4