当前位置:网站首页 >> 游戏

大数据还是大错误

时间:2019-08-15 19:05:24 来源:互联网 阅读:0次

  大数据是对于大规模现象的一种模糊的表达。这一术语如今已经被企业家、科学家、政府和媒体炒得过热。

  五年前,谷歌的一个研究小组在全球的科学杂志《自然》上宣布了一个令人瞩目的成果。该小组可以追踪美国境内流感的传播趋势,而这一结果不依赖于任何医疗检查。他们的追踪速度甚至比疾控中心(CDC)要快的多。谷歌的追踪结果只有一天的延时,而CDC则需要汇总大量医师的诊断结果才能得到一张传播趋势图,延时超过一周。谷歌能算的这么快,是因为他们发现当人们出现流感症状的时候,往往会跑到络上搜索一些相关的内容。

  谷歌流感趋势 不仅快捷、准确、成本低廉,而且没有使用什么理论。谷歌的工程师们不用费劲的去假设哪些搜索关键字(比如 流感症状 或者 我身边的药店 )跟感冒传染有相关性。他们只需要拿出来自己站上5000万个热门的搜索字,然后让算法来做选择就行了。

  谷歌流感趋势的成功,很快就成为了商业、技术和科学领域中趋势的象征。兴奋的媒体们不停的在问,谷歌给我们带来了什么新的科技?

  在这诸多流行语中, 大数据 是一个含糊的词汇,常常出现于各种营销人员的口中。一些人用这个词来强调现有数据量的惊人规模 大型粒子对撞机每年会产生15PB的数据,相当于你喜欢的一首歌曲重复演奏15000年的文件大小。

  然而在 大数据 里,大多数公司感兴趣的是所谓的 现实数据 ,诸如页搜索记录、信用卡消费记录和移动与附近基站的通信记录等等。谷歌流感趋势就是基于这样的现实数据,这也就是本文所讨论的一类数据。这类数据集甚至比对撞机的数据规模还要大(例如facebook),更重要的是虽然这类数据的规模很大,但却相对容易采集。它们往往是由于不同的用途被搜集起来并杂乱的堆积在一起,而且可以实时的更新。我们的通信、娱乐以及商务活动都已经转移到互联上,互联也已经进入我们的、汽车甚至是眼镜。因此我们的整个生活都可以被记录和数字化,这些在十年前都是无法想象的。

  大数据的鼓吹者们提出了四个令人兴奋的论断,每一个都能从谷歌流感趋势的成功中印证:

  1) 数据分析可以生成惊人准确的结果;

  2) 因为每一个数据点都可以被捕捉到, 所以可以彻底淘汰过去那种抽样统计的方法;

  ) 不用再寻找现象背后的原因,我们只需要知道两者之间有统计相关性就行了;

  4) 不再需要科学的或者统计的模型, 理论被终结了 。《连线》杂志2008年的一篇文章里豪情万丈的写到: 数据已经大到可以自己说出结论了 。

首发产业互联网赋能回收行业爱博绿获Pre-A轮两千万融资
东莞B2B/企业服务A+轮企业
2012年西安大健康上市后企业

相关文章

一周热门

热点排行

热门精选

友情链接:
媒体合作:

Copyright (c) 2011 八零CMS 版权所有 备案号:苏ICP备17012668号-2

网站地图