数据科学家:关于数据科学家,我们应该知道的这些事



几年前,Harvard Business Review 赞扬数据科学家是“ 21 世纪最性感的职位”。但是你知道成为一个数据科学家意味着什么吗?让我们首先看看数据科学家和专家们的一些著名的观点吧。

 

  • 数据科学家“趋向于”自然科学家,尤其是物理学家,而不是计算机科学家。 物理学家有着很强的数学背景、计算机技术,并且笃信这样的原则:生存依靠的是从数据中发掘出最多的信息。他们必须考虑的都是宏观的格局、重要的问题。 —DJ Patil,VP of Product at RelateIQ

  • 他们必须在数据中找出最宝贵的真相,并且解释给商业领导者们。—Rchard Snee Emc

  • 数据科学家就是那些比计算机科学家知道更多统计知识、比统计学家知道更多计算机科学的人。—Josh Blumenstock

  • 数据科学家只是比统计学家更性感的一个称呼罢了。—Nate Silver

  • 数据科学家涉及的工作有:收集数据、把数据整理揉合成一个易处理的模式,让数据讲出自己故事,并把这些故事展示给其他人。— Mike Loukides,VP,O’Reilly Media

  • 半开玩笑的说,数据科学家被称为穿斗篷的超人。— Ben Rooney

  • (数据科学家会)解析地、严密并且系统地思考一个商业问题,并根据可用数据得出解决方案。—Michael O’Connell, Sr. Director of Analytics, TIBCO

  • 数据科学家 = 统计学家 + 程序员 + 教导者 + 讲故事的人 + 艺术家 —Shlomo Aragmon

  • 他们是一半黑客、一半分析师。他们使用数据得到产品并发现独到的见解。—Monica Rogati

  • 数据科学家是那些可以获取、清理、发掘、建模并解释数据、还混杂了具备黑客技术、统计学和机器学习知识的人。数据科学家不仅仅擅长处理数据、同时意识到数据本身就是一流的产品。—Hillary Mason

现在,给出一个来自 Drew Conway 的有趣的图表,它解释了成为数据科学家意味着什么:

 

图表

 

再看看另一个简单图表。这是我自己对整个数据科学过程的描述。

 

过程

 

那么,数据科学家是做什么的呢? 简单的说,数据科学家收集数据并清理数据,创建数据集,分析它们并得出新的见解。他试图依靠手中的数据预测未来并帮助企业提升产品、服务和客户订单的质量。更优秀的品质意味着更好的客户满意度和更丰厚的收入。

 

以下是每个数据科学家应该具备的三个重要特质:

  • 一个好的数据科学家知道需要提出的正确问题;

  • 理解自己所拥有数据的结构

  • 能够把数据很好的翻译解释出来

 

总之,提问正确的问题,并得出有益于作出合理决策的见解,这就是数据科学家该做的事儿。