结构化数据和非结构化数据是大数据的两种类型,了解两者之间的差异是充分利用这两者的关键,特别是在从Web数据中获益时。
什么是结构化数据
什么是非结构化数据
典型的人为生成的非结构化数据包括:
- 文本文件:文字处理、电子表格、演示文稿、电子邮件、日志。
- 电子邮件:电子邮件由于其元数据而具有一些内部结构,我们有时将其称为半结构化。但是,消息字段是非结构化的,传统的分析工具无法解析它。
- 社交媒体:来自新浪微博、微信、QQ、Facebook,Twitter,LinkedIn等平台的数据。
- 网站: YouTube,Instagram,照片共享网站。
- 移动数据:短信、位置等。
- 通讯:聊天、即时消息、电话录音、协作软件等。
- 媒体:MP3、数码照片、音频文件、视频文件。
- 业务应用程序:MS Office文档、生产力应用程序。
典型的机器生成的非结构化数据包括:
- 卫星图像:天气数据、地形、军事活动。
- 科学数据:石油和天然气勘探、空间勘探、地震图像、大气数据。
- 数字监控:监控照片和视频。
- 传感器数据:交通、天气、海洋传感器。
结构化数据与非结构化数据:有何区别

博客