数据科学50年演进数智化的基石

治疗白癜风的专科医院 https://jbk.39.net/yiyuanfengcai/yyjs_bjzkbdfyy/

50年,在这个科技飞速跃迁的时代意味着什么?

对基因科学来说,DNA双螺旋结构被提出之后,涌现出基因克隆、基因组测序等多项技术,直接促进了现代生物技术产业的兴起;

对通信工程来说,低损耗光纤的发明直接推动了数据通信、视频数据流、云计算的发展,造就了当今世界万物互联的生活方式;

对数据科学来说,被提出后的50年中不断丰富自身的内涵和外延,构成了今天数智化时代的基石。

五十年前,很难想象到这些开创性的事件对当今世界的影响。

百分点科技董事长兼CEO苏萌

苏萌说,这50年来非常幸运——在信息技术起飞的年代里亲历了数据科学1.0-3.0,见证了每一个关键时刻。

3月30日,当他站在数据科学峰会的演讲台上,以自身和百分点科技的视角全面解构数据科学的四个代际之时,吸引了上百万人次沉浸式体验这场数据科学穿越之旅。

数据科学1.0:小数据时代求学任教

数据科学从诞生之日起,就与数据演进的每一个阶段息息相关。

年发生了三件事:

因科学研究计算机模拟产生了大量数据,需要依靠算法发现其中规律,图灵奖得主PeterNaur首次提出了数据科学(DataScience)的概念:基于数据处理的科学,这标志着数据科学的开端;

IBM发明了结构化查询语言SQL,奠定了关系型数据库的基础;

互联网之父罗伯特.卡恩和文顿.瑟夫成功实验了数据包在网络和电脑之间的信息传输,并公布了TCP/IP协议,这奠定了互联网的基础。

这一年,在远离科技中心的中国东北,苏萌刚刚出生。

之后的30多年里,被称为数据科学的小数据时代,主要面向结构化数据、历史数据和线下数据,运用关系型数据库、统计、ETL和数据仓库等技术,服务于商业和公共事务。

例如,金融行业较早地将数据分析技术应用到风险管理和投资决策等方面;电信运营商通过用户画像进行套餐营销;零售行业通过RFID等技术进行供应链数字化改造。

在小数据时代,数据整合、描述性分析和商业智能分析是重点需求。

这些需求催生了一批老牌的数据科学公司,如SAS、SPSS、MathWorks、Wolfram、Alteryx、Palantir等等,带来了数据科学技术应用的早期繁荣。

在这个信息技术起飞的时期,苏萌以求学和科研为主。

年到美国留学,完成了统计学、计量经济学和营销模型等学科的学习,在康奈尔大学师从国际营销模型领域大师VithalaR.Rao教授,获得了博士学位。期间也曾就职于全球顶尖的计算软件公司Wolfram,并推动了数据科学软件Mathematica与三十所中国高校的合作。

年,北大在全球范围招聘教授,苏萌从两百多位世界知名高校博士毕业生中脱颖而出,受聘北大光华担任助理教授,成为国内高校引进的博士毕业于美国常青藤大学营销模型专业的第一位全职教授,为硕士博士生开设数据建模方面的课程。

年前后,美国的Yahoo、Google、Facebook、Twitter等互联网公司纷纷崛起,中国也出现了BAT等巨头,世界进入到了互联网时代。

互联网开启了崭新的数据空间,为数据科学创造了更大的舞台。

这些互联网企业需要用分布式集群的方式来存储、分析和挖掘海量互联网数据,以提高业务运营和决策效率。年,Google发布MapReduce,随后Hadoop的诞生,一个崭新的时代正在开启。

数据科学2.0:大数据时代创业之初

时隔30多年后,无论是数据量还是数据处理能力,都发生了量变到质变,数据科学迎来了进阶时刻。

年也发生了三件事:

这一年,中国网民数量2.53亿,首次超过美国,网民规模跃居世界第一;

这一年,中国使用手机上网的人数占网民总数的近30%,进入了手机上网的大众化阶段;

这一年,自然科学国际顶级期刊《Nature》上首次提出了“BigData”的概念。这犹如一声惊雷,开启了接下来近10年的数据科学大数据时代。

互联网和移动互联网的浪潮不仅带来了更海量的数据,也催生了数据处理分析技术的更迭。

这个阶段,大数据技术风起云涌,Storm、Spark、Flink等新型分布式计算框架像雨后春笋般不断涌现,极大地提高了数据处理的深度、广度和速度。Python语言开始流行,机器学习开始成为数据科学的重要技术手段。

市场端的数据科学应用以单点技术和场景为主,最典型的包括个性化推荐、数字竞价广告、金融风控等。其中,个性化推荐算法是苏萌在康奈尔大学读书期间跟导师共同的研究方向之一。

年,他和几位美国顶尖高校的教授合作发表了一篇关于个性化推荐的文章。

苏萌认为,科研不能只体现在论文的发表上,也应该能真正地为产业带来价值。年夏天,怀着这个朴素的想法,他在北大附近的中关村公馆租了一间80平米的小公寓,向家人借了50万元,注册成立了百分点科技,专注于研发个性化推荐引擎的算法与技术实现。之后的几年,服务了2,多家互联网电商和媒体客户,并成为了国内规模最大的推荐引擎技术服务商。

数据科学赛道的独特性在于,它是利用科学方法、流程、算法和系统从数据中提取价值的跨学科领域,一方面是人才培养门槛高,一方面是要具备领域知识。

百分点科技之所以成为国内用数据科学为产业赋能的先行者,并逐渐成长为标杆性企业,与公司创始团队具备深厚的数据科学理论功底和实践经验分不开。

随着资本与技术人才的涌入,以及大数据技术的采纳周期和新的市场需求,互联网领域的大数据浪潮,迅速扩展到了传统行业,一批龙头企业开始拥抱大数据,探索数字化转型。

他和团队感受到了这股浪潮,并率先将在互联网端沉淀下来的大数据技术应用到ToB端的企业数字化转型中,并在服务零售、金融、媒体、制造、地产等各行业头部客户的过程中,积累了扎实的行业知识、业务理解和行业上下游生态。

然而,数据科学被更多人


转载请注明:http://www.xxcyfilter.com/zyxz/zyxz/17336.html

  • 上一篇文章:
  •   
  • 下一篇文章: 没有了