大数据包括结构化、半结构化和非结构化数据,非结构化数据越来越成为数据的主要组成部分。根据IDC的调查报告,企业80%的数据是非结构化数据,每年按指数增长60%。大数据只是互联网发展到现阶段的一种表象或特征。没有必要神话或敬畏它。在以云计算为代表的技术创新帷幕的背景下,这些看似难以收集和使用的数据开始易于使用。通过各行各业的不断创新,大数据将逐步为人类创造更多的价值。
其次,要想对大数据进行系统的认知,就必须从三个层面进行全面细致的分解:
第一个层次是理论,理论是认知的唯一途径,也是广泛认可和传播的基线。从大数据的特征定义理解行业对大数据的整体描述和定性,深入分析大数据的价值,了解大数据的发展趋势,从大数据隐私的特殊和重要视角审视人与数据之间的长期博弈。
第二个层次是技术,技术是反映大数据价值的手段和前进的基石。从云计算、分布式处理技术、存储技术和感知技术的发展来看,大数据从收集、处理、存储到结果形成的整个过程。
第三个层次是实践,实践是大数据的最终价值体现。这里从互联网大数据、*大数据、企业大数据和个人大数据四个方面描述了大数据的美丽场景和即将实现的蓝图。