BTV《财经峰汇》:未来无处不在的大数据


“十三五”规划,大数据上升为国家战略。互联网+大数据,可以对哪些领域进行变革?政府数据共享,企业创新转型,数据安全如何保障?中国商业联合会数据分析专业委员会会长邹东生带您进行深度剖析。
 
一、主持人:邹会长先给我们解读一下这个大数据的内涵到底还包括哪些内容?
邹会长:我觉得我们一直在聊大数据,但是其实我们被大数据经常的一个概念所迷惑,就是认为大数据只是数据很大,但实际上大数据真正的起因是大体量的数据产生的决策,使企业更加精准地判断。实际上大数据的应用、大数据的研究使它加以落地,给企业带来实际的决策价值,才是大数据真正的内涵所在。
 
二、主持人:我们在政府层面的应用,那十三五同时也说企业化,提出企业化数据建设,邹会长在这方面有没有什么例子呢?
 
邹会长:我觉得就是从我们角度来讲,我们一直是从事数据研究的,那么我们协会2008年就开始成立。就像刚才两位似的,我们第一次在这次五中全会中明确提出来,国家提出来大数据战略,这个也是我们兴奋的,为什么?因为从国家角度开始推进这件事了,而且明确提出来企业要构建自己的这种数据化的一些服务,或者不管是技术也好,不管是分析也好,这个意义重大。拿一句心里大家经常会聊到的话,就是目前来讲,现在来讲业务即数据,在未来几年以后,数据即业务。这句话怎么理解?你现在是把企业的所有的行为、所有的业务,把它数据和进行存储和分析。那么到了几年以后,企业去运维自己的数据,实际上就是在经营自己的业务。那么这就意味着一句话,如果企业在几年以后没有自己的数据化存储基础,没有自己的数据分析能力,那么企业将来我们可以肯定的说,将来最大的可能性你会被淘汰,去做这个东西。

所以说尤其再加上中国的经济在转型,从粗放型向节约型转型,那么要提升企业的竞争能力,那么一定要从这种科技创新、技术创新和研究创新上去做。那要做这件事情,企业的数据化必然要在这个节点上迅速地推动起来。我们也接触了很多企业,那么有一些做得比较早的,比如说电商,比如说零售,比如说一些金融行业,他们自己存储的数据和信息化建设做得非常好。那么在这个节点上,他们就可以再迅速地利用大数据,就能产生一些效果。你比如说零售行业,他把自己的信息和数据进行整体地规整,我们就可以迅速地去判断消费者的兴趣爱好,组织什么样的商品上架。同时把一些现在很多传统的零售行业也开始在引入动态标签,什么叫动态标签?就是在你的这种传统店面上要放一个电动标签,这种电动标签实际上是大量地去收集互联网同类产品的价格和变化。
那么根据互联网竞价的原则和一些东西,我们也形成一个传统店面上的动态价格。那么在这种情况下,就可以使传统行业在跟电商竞争过程当中,就可以解决一部分问题,就取得他的竞争优势去做这个东西。所以我们现在作为行业协会,也接触到我们很多的事务所,他们在做最多的事情就是帮助企业去构建自己的信息化平台,构建自己的数据平台,帮企业把数据存储起来,进而可以解决未来的决策变化。
 
三、主持人:现在就是很难招到特别对口的一个人才是吧?
 
邹会长:我来说说这个问题,其实协会一直在致力大数据人才的培养和这个东西,我们在前天我们还了北京七所高校的面试节,大数据行业的一个面试节。我们也在关注高校人才的这种培养,就是像刚才王总说的,其实大数据人才非常非常地难得,他一定是个复合型人才,他不仅仅要求有懂统计、懂经济学、懂管理、懂决车、懂投资,而且他要求还有其他方方面面的知识,这种人才非常非常难得。
但是我们之所以在高校去做这件事情,我们并不指望一下子高校能给我们带来非常棒的人才,但是我们要从高校就开始铺设这样的一个大数据人才的这种理念去做这件事情。而且国内现在确实已经开始了有大数据的专硕培训这样的东西,已经有了,我没记错是北大、人大他们组了一个专门的课题去做这个东西。但是这样的人才,坦率地说跟国外这方面的人才培养方向还是有比较大的区别,还是有问题。那么我们协会也在做中国的从业类人才的培训和认证,就是中国的数据分析的认证和培训。那么虽然这些工作我们已经走了12年,但是实际上我们培养的这些人进入社会以后,还有一个相当长的一个时间跟理论知识结合去做这件事情。真正优秀的数据分析,实际上您在网上去搜一搜,基本上他的年薪是非常高的。
 
四、主持人:有技术,有应用场景,就是很抢手的人才了?
 
邹会长:在国外把大数据人才分成两个领域,一个是偏技术型,就是偏技术型人才,虽然他也需要懂后面的东西,但是他对于技术构建这方面要求是比较高的。还有一方面是偏后面的基于研究和分析这一块的人才。实际在欧美国家他也有一个大数据发展的轨迹,在刚开始的时候他们更多地偏技术型引入的人才。
但是在这几年以后,大量地尤其是在美国这种发达国家,大量地偏向于数据科学家后面的这个研究领域的深化。为什么呢?因为他的数据构建已经比较好的情况下,他更多地要对各种行为,消费者行为、企业行为,各种数据做深层次的判断和研究,而这方面他更强调深度数据分析、深度能力。而在这个方面领域的人员,他对不仅仅是需要技术,他更多地需要经济学决策型人才的知识储备去做这件事情,把他两个结合起来当然是最完美的。
 
五、主持人:准确度的偏差不是大数据本身的问题?
 
 
邹会长:我补充一下这个,我觉得数据体量的增大,确实它使原来小体量的数据的不准确性得到了提升。我原来做一个数据调研我可能是几百个,甚至于可能到不几百个,100个,几十个样本量,我现在在收集的时候我轻松地就可以做到几千个样本量,那么它越来越趋近于总体,而趋近于总体的研究当然在精准性上就会得到很大的一个提升。但是为什么还会产生偏差?产生偏差是有原因的,第一个大数据本身密度在下降,我原来做小数据体量的调研的时候,我的自断选择是非常有针对性的。我做大数据收集的时候,我可能会收集到很多未知数据,就是这些数据有些是有关的,有些是无关的,所以它密度下降了。那么在这种情况下确实会,叫做我们在分析过程中如果我们人为的能力有问题就会出现偏差。
还有一个原因产生偏差,就是大数据很多我们现在的基于大数据的分析,我们属于后延性分析,什么叫做后延性分析呢?就是我们先要基于我们以前针对数据找到的一些规律,找到的一些辨别,然后把它形成一些模型和方法,然后基于后面的数据体量,然后我逐渐地进行判断。这种后延性的其实是基于人的经验进行判断的,就会产生偏差。但是随着数据体量的增大,还会产生新的问题,就是我基于各种复杂的数据通过机器计算,去找到背后产生新的规律,探索性研究。而这种探索性研究可以使企业或者个人找到你不知道的各种新型的规律,而这种东西实际上是大数据更有吸引力的一个方向。
 
六、主持人:还有一个是隐私的问题,隐私的问题说起来比较复杂了,这个问题比较大。
 
邹会长:我觉得隐私问题不用太纠结,隐私是保证不了的,我们讨论过。做大量数据研究的工作,包括我们要想获取数据,他现在社交网络数据很多都是公开的,这个很难真正个人的隐私进行这种过度保护。除非说我什么都不用,我进入原来的农业社会,我什么都不接触,这个难度是比较大的。
 
七、主持人:上升到这样一个国家战略的高度。最后我想几位能不能再为我们总结一下,这个大数据上升到国家战略这种意义是什么呢?
 
邹会长:我觉得很关键的一点就是什么呢?它能够帮助中国的企业,包括中国的经济进行合理地转型,让大数据真正能够助推企业发展,让大数据真正能够帮中国的企业产生越来越好的、越来越棒的竞争力。然后这种变化是中国的经济会带来你想想不到的蜕变,我觉得这个是非常有意义的一件事情,做这个事情。