最常见的八大数据误区
作者:编辑部
2020-11-12
摘要:围绕着“大数据”的炒作让这一切看起来过于简单,对企业造成了伤害。

数据分析和“大数据”有望彻底改变营销。大多数公司都坐拥来自各种来源的大量数据:财务数据、移动数据、交易数据、客户研究数据、行为数据、社交媒体数据等。新的分析技术、强大的计算机能力和即时在线资源的结合,产生了令人难以置信的强大工具,彻底改变了游戏规则。事实上,如此强大的分析能力,已经不仅仅是借力支持,而是可以解锁新的机会和战略,以及开启前所未有的可能性。

但是,分析“大数据”的便捷性也被夸大了。实际上,驾驭大数据仍然是一项杂乱无章、非常耗费人力的工作。从两个真正从事这项工作的人那里得知:一些炒作对我们不利,因为它给我们造成了一种错误的预期,认为这将是多么容易的事情。

为了让我们开始真正了解大数据,现在是时候消除这些常听到的迷思了。

大数据误区一:大数据并不“大”

它是多样化的。“大”有误导性。我们说的是大量的数据点,实时高频更新,来自各种来源。它的颗粒度非常大。它是单个的交易数据,是某张信用卡,在某加油站支付了一定的油费。大数据其实是很多很多非常小的数据。它不是数据的山崩地裂,而是沙尘暴。而沙尘暴会让你失明、迷失方向。那么,为了帮助在风暴中看清,我们还需要揭穿哪些神话呢?

大数据误区二:你需要马上应用它

生活中大多数重要而有价值的事情都是困难的,大数据的分析也不例外。解决的办法是采取小步骤,从非常具体的目标开始。在开始囤积数据之前,先仔细思考你想用这些信息做什么。

大数据误区三:数据的颗粒度越大越好

实时和精细的数据就一定好吗?不,不是的。一场足球比赛的第一节并不能预测整场比赛的结果。实时可以离行动太近。有时,你需要拉开长镜头来揭示真正发生的事情。

大数据被大量的白噪声所包围。噪声在总信号中所占的比例会随着分辨率的提高而增加,例如,数据是按分钟而不是按周计算的,或者是城镇级而不是州级的数据。不要把精确性和准确性混为一谈。大数据的原始分类形式可能会产生误导。需要有一个适当的汇总水平,以消除所有的白噪声。

大数据误区四:大数据就是好数据

数据多和数据好是有区别的。劣质的数据有很多错误,很多缺失的数据,会产生误导。照片和视频可能会被打上错误的标签,青少年写的非结构化文字是反映了积极的情绪还是消极的情绪?有时需要一个聪明的模型才能弄清楚。为了让数据有意义,你需要扔掉一些数据。要分析大数据,你首先要搞清楚的是,哪些数据要纳入分析,哪些数据需要扔掉。

大数据误区五:大数据意味着分析师变得万能

人们常说,大数据将迎来分析师的崛起,“信息时代的新神”。但分析团队的崛起被夸大了。数据速度的急剧增长意味着现在没有时间去“向分析团队做简报”。我们需要能够应对数据速度、数量和粒度的快速工具。理想情况下,一小群分析大师将利用技术赋予营销人员权力,让他们自己做更多的分析和情景建模以及决策支持。我们预测,分析部的死亡,以及自我服务的崛起。数据科学家一统天下的时代不会永远持续下去——数据实在是太多了!

大数据误区六:大数据能给你具体答案

模糊性是大数据的主要特征。多个数据源会让你偏离证据告诉你的内容。不同的数据,经过不正确的分析,会产生相互矛盾的证据。你相信哪些数据?大数据需要人的判断力来干预和解决看似矛盾的证据,这就是熟练的分析师的作用。

你拥有的数据越多,越容易出现矛盾和歧义,需要解决。大数据不是万能的。事实上,恰恰相反。更多的数据为你提供了更多的证人,但并不能让你更接近真相,直到你利用有经验的人类判断来调和矛盾的证据。分析学的未来就是要结合、权衡和判断多个信息源和不同的分析。

大数据误区七:大数据是一个神奇的8号球

你需要问的问题完全正确的方式。这有点像当一个精灵给你三个愿望。你必须非常谨慎地表达你的愿望。在处理复杂的数据集(如手机或通话网络数据)时,在缺乏精确性或事先建立详细假设的情况下应用分析法,实际上会让你误入歧途,给出一个错误的答案。你需要对“大数据”的水晶球非常谨慎地提出你的问题。

大数据误区八:大数据可以创建自学习算法

来自流氓数据的假阳性(例如,来自直接响应电视广告的呼叫中心呼叫量预测)表明,从营销角度来看,自动模型的局限性。来自超级周末的恶意数据可能会扭曲自动更新算法。

当以正确的方式设置时,算法可以非常强大,但它们总是需要人为干预。例如,手机运营商已经展示了很好地利用非营销数据进行营销。他们知道你的朋友是谁,他们可以猜测你的年龄,他们知道你在城市的哪些地方闲逛,他们知道你访问什么网站,你使用什么应用程序,以及何时使用。保险公司可以利用遥测技术来获取营销的数据,而不仅仅是核保。

从根本上说,揭穿这些神话,就是要摒弃盲目的信仰,认为商业成功的公式都是在数据中确定下来的。事实上,大数据本身就是一种工具,就像电脑或智能手机一样,是一种令人敬畏的、改变游戏规则的工具,但只有当人们知道正确的指令和坐标时,才会使用它。

 

热门文章