舍恩伯格的三个观点:
一、不要随机样本,而要全部数据
在小数据时代,由于我们处理数据的能力有限。无法做到采集和处理全部的数据,所以采用抽样的方式来分析数据,存在很多的缺陷。而在大数据时代,由于我们采集数据的能力大大的提高,存储数据的代价越来越低,处理数据的工具越来越强大,可以做到全部数据的采集,存储,分析。
二、不要精确性,而要混杂性
在小数据时代,由于我们采取的是抽样分析少量的数据,细微的偏差 就会导致完全不同的分析结果。所以必须要求数据的精确性。 而在大数据时代,由于我们处理的全部的数据,数据量非常庞大,少量的数据偏差不会影响数据分析的最终结果。而且这是大数据的特性之一。
三、不要因果关系,而要相关关系
在大数据时代由于信息的及时性是大数据价值的一个主要标准,如果事件A发生了,事件B也同时发生。知道这个信息对于数据分析者来说已经足够,并且提供给决策者使用。因果关系并不是大数据分析所必须的。
大数据时代的三个角色:
一、基于数据本身的公司
用于大量的数据,单其本身并不从数据中提取价值
二、基于技能的公司
拥有专业的技能,但其本身并没有大量的数据。
三、基于思维的公司
本身没有大量的数据,也没有专业的数据处理技能,但是可以提供数据处理的创新性思维。