刘德寰:数据科学的整合与细分 数据科学的七个
来源:网络整理 作者:编辑-文芳 分类:大数据 热度:

本演讲是2015年10月29日,在CMRA大会上的主题演讲。主要探讨数据科学的整合与细分,特别分析了数据科学的七个危险趋势。自从大数据这个词出来以后,数据已经成为一个非常明确的科学领域。在这当中很少有人详细地探讨数据科学的结构和它面临的问题。本演讲探讨了数据科学有三个非常重要的层次:数据的获取、数据的描述和数据的分析。

下面是详细的PPT及文字:

自从大数据这个词出来以后,数据已经成为一个非常明确的科学领域。在这当中很少有人详细地探讨数据科学的结构和它面临的问题,包括我们行业面临的问题。

数据科学有三个非常重要的层次:数据的获取、数据的描述和数据的分析,这三件事是不同的,不要把它混淆了。

1.数据的获取

大数据

以前数据的稀缺导致行业内出现非常大的非良性循环。

大数据


在这个过程当中,又正好赶上了一个新的时代——机器化数据横空出世,突然之间,甚至一夜之间数据不再稀缺了。单靠获得数据,你能拿到高额利润的可能性微乎其微,这样就必然导致执行公司如果要继续作弊必死无疑,未来五年内我们可以清楚的看到,研究公司不好好做研究,也照样是必死无疑,无论你是国际的,还是国内的,因为时代变了。所以数据获取这一块,要有非常清醒的认识。

大数据

在这个时候大数据,正常的讲叫机器化数据已经被神话,而市场研究公司被积压在这里,市场研究数据的结构化,它必须满足两个条件,一是真的,二是价格是低的,这两件事造成的后果是什么,我相信业内的所有公司都会有体会。

大数据

2.数据的描述

再看数据的描述,由于整个社会大环境巨大的变化,在描述环节上出现了非常大的问题,这个问题中你会发现形成了新的、不同的非良性循环。为什么?数据不稀缺了。而在这个时候,机器化数据出来的东西做点频率表,做点交互表很简单。如果数据描述能够替代数据分析,这个世界一定会毁掉,因为数据想骗人太容易了。

大数据

接下来的过程当中,机器化数据由于资料收集简单,整理数据的过程非常容易。所以直接面向销售,这个面向销售就出现了充满荆棘的历程。

大数据


再看研究公司的结构化数据,大型公司由于没有应对,我在行业这么多年,一直在这些时期,有机会就在呼吁洞察这个词。实际上我们的研究员正在日益变成填数工具,而不是洞察。数据不再稀缺,你在机器化数据面前,你填数的过程当中,数据的真假还在存疑,这时候你不败谁败,必然败。而且别忘了机器化数据的成本趋近于零,所以大中型研究公司的解体、兼并、重组在不远的将来一定会频现,这是没有办法的趋势。

大数据

现在数据科学有七大危险趋势:

大数据

大数据

精英物联网-物联网大数据前沿科技信息资讯网,内容只代表作者观点,如有侵权请联系站务处理。

上一篇:一个优秀的数据产品经理是怎样炼成的? 下一篇:微服务架构下的分布式数据管理
猜你喜欢
各类观点
热门排行
精彩图文