且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

你了解数据科学家有几类吗?

更新时间:2022-10-12 23:16:47

你了解数据科学家有几类吗?

统计根据不同的领域(生物,营销,产品,金融等)分有多类统计学家,比如:生物统计学家、经济学家、运筹学专家、精算师和商业分析师等。在数据科学领域,也有不同类别的数据科学家。他们首先工作职位不同,比如我的工作职位就是一个数据公司的联合创始人(译者:DataScience Central公司,主要业务是给业界提供大数据的在线服务。包括从数据分析到集成和实现可视化全套流程。)

你了解数据科学家有几类吗?


我们将数据科学家分为以下九类:

(1)精于统计类。他们的主要工作是针对大数据开发新的统计理论。他们专注于非传统统计的统计建模,实验设计,抽样,聚类,数据缩减,置信区间,测试,建模,预测建模等相关技术。


(2)精于数学类。比如NSA(国家安全局)和国防/军事工业领域内的大数据专家,天文学家和运筹学家。他们专注于对业务的分析和优化,比如库存管理和预测,定价优化,供应链,质量控制,成品率优化等。他们主要的工作在于收集,分析数据并从中提取关键价值。


(3)精于数据工程,Hadoop,数据库/记忆/文件系统最优化和架构,API,作为服务的分析,数据流最优化,数据探究。


(4)精于机器学习/计算机科学类(算法,计算复杂性)


(5)精于商业类,ROI最优化,决策科学。这些领域实际是大公司中商业分析师们所做的的一些传统的工作的一部分(例如数据报告设计,考量的混合选择以及考量的定义,ROI最优化,高水平的数据库设计)。


(6)精于生产代码的开发,软件工程(他们懂得很多编程语言)。


(7)精于数据可视化类。


(8)精于GIS,空间数据,图形数据建模,图形数据库。


(9)精于以上多样。有着20年在大大小小的公司跨领域的工作经历,有些数据科学家既精通统计,又懂得机器学习,商业,数学而且还擅长可视化和数据工程。随着时间的推移,随着经验的积累,你也可以变成这样的多面手。我之所以提到这点是因为很多人仍然认为开发跨多项领域的专业技能是件不可能的事情或传统上认为跨领域的技能是分隔开来的。事实上,这种多能手便是数据科学的定义。


以上所提到的这些人中绝大多数都非常熟悉大数据甚至可称得上大数据专家。


此外,我们还有其他几种数据科学家分类法,具体可参看我们之前的文章“数据科学家的分类”(Taxonomy of datascientists)。有一种分类法是基于有无创新性的差异。有创新性前景会更好,而缺乏创新容易被外包。任何已出版的教材或已流行于网络上的都可以实现自动化或外包,而我们的工作保障就是不可替代性,是基于你知道多少别人不知道的内容或者你比别人更容易学会什么。按照这样的思路,我们可分为科学应用型人才(指那些使用科学且通常不具有博士学位的从业者),科学创新型人才(指那些创造新科学的研究人员),以及混合型人才。大多数的数据科学家都属于科学应用型人才,比如会预测地震的地质学家,会为制药公司设计新的药物分子的化学家和科学家们,他们多属于此类数据应用型人才。

对IT行业人士的启示

如果你是工程师或商业分析师,那么你的工作很可能已包括一些数据科学,而转型成为数据科学家的难度,或许也没有那么难。而如果你关心的是数据科学家这个潮流职业是否会对你现有的工作构成威胁,那么请阅读原文中的参考链接,它会给你有效建议,拓宽你的职业前景。


原文发布时间为:2015-02-05

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号