2)第七百九十七章敲打_我的1999
字体:      护眼 关灯
上一章 目录 下一章
  极大的增强,在这样的背景下,就出现了大数据。”

  顿了一下,徐良调整了一下PPT。

  “那么数据和大数据怎么运用呢?

  大致可以分为以下流程。

  获取数据→分析数据→建立模型→预测未知。

  我们举一个简单的例子。

  现在我们想要了解一家电影院的观众年龄分布,以便做市场推广。

  假定我们把观众群分为15岁以下,16~25岁,26~40岁和41岁及以上四个人群。

  要了解每个人群的比例,一个简单的办法就是到电影院门口去问一问那些看电影的人的年龄。

  比如我们通过调查了解到大约有343人在15岁以下,459人在16~25岁,386人在26~40岁,490人在41岁及以上。

  根据这个数据,我们大致可以得出以下结论:

  15岁及以下的观众占20%左右,16~25岁的观众超过四分之一,但不到三成;

  26~40岁的观众略少于四分之一,41岁及以上的观众最多,大约占到三成。

  但是,如果我们只在周末的晚上抽样调查10个人,我们就会发现。

  有三个15岁及以下的观众,五个16~25岁的观众,2个26~40岁的观众。

  我们显然不能说25岁以下的观众占了八成,而41岁及以上的中年人从来不来电影院,这样的结论。

  但我想各位也都承认一点,在统计样本不充分的情况下,得到的结果跟实际结果存在很大的偏差。

  所以,越想要得到准确的统计结果,需要的统计数据量就越大。

  在上面的例子中,统计的样本总数是1678人。

  但是如果我们一定要说‘41岁及以上的观众就是29.2%’,或者‘15岁及以下观众一定超过20%’。

  请收藏:https://m.mrroaz.com

(温馨提示:请关闭畅读或阅读模式,否则内容无法正常显示)

上一章 目录 下一章