2019数据科学家最需要的技能盘点Python大火Pytorch职位需求翻番

2018年medium上一篇博文分析了数据科学家最需要的技能,那篇文章引起了很大的反响,在medium上有超过11000次点赞,并被翻译成几种语言,成为了2018年11月KD Nuggets最受欢迎的文章。

一年多过去了,2019的作者也发布了最新的分析,让我们看看有什么变化。

9,巴特熊:净值600万刀

数据科学家对云平台技能的需求越来越大。AWS的出现频率高达20%,Azure约10%。Azure在排名中跃升了四位。

4,神猴水晶:每集挣12000刀

Pal 是一只柯利犬,对于数百万早期电视粉丝来说,他是“莱西(《灵犬莱西》)”,18岁的他死于1958年,也被视为后续诸多“莱西”扮演者的鼻祖。Pal 一周能挣4000刀,放在今天相当于51000刀。

电视演员帕西2012在《英国达人》的抢镜表现让他成了国际明星——而他幸运的主人,Ashleigh Butler——凭借狗狗的天赋已经赚了将近100万英镑,也就是1574555刀。包括在2014年主演一部电影。

•1978年以来的第一个三连冠得主,美国法老王在肯塔基赛马上赢了124万美元,斯赛马上赢了90万,贝蒙锦标上赢了80万。他用2015场胜利赢得337万美元奖金。而整个职业生涯,他一共挣了453万美元,一些未统计的代言费可能让这个数字更高。

12,喵咪Maru:一年挣18万刀

喵上校2岁时就不幸离世了,然而他的油管视频依然带给主人一年5000刀的收入。这只喜马拉雅猫在2012年一炮成名,他野性、蓬乱的皮毛和气势汹汹的眼神在脸书和IG上疯狂传播。2014年,上校9英寸的毛使他获得了世界毛最长的猫的吉尼斯纪录。

10,小家伙:一年挣30万刀

基于这些原因,LinkedIn被排除在本文2019年和2018年的分析之外。

这是上文方法3对应的图表,显示了每年的百分比变化。2018年,PyTorch上榜职位需求数平均增长了108.1%。

同时手动调查了新的搜索词以及那些看起来很有前途的词。在2019年,没有新的搜索词达到占全体5%的占有水平,这是下述结果中使用的截断指标。

虎鲸Keiko 在出演《人鱼童话(又名威鲸闯天关)》时给他的经营公司挣了3600万刀——2002年还给自己挣到了自由权,不幸的是,Keiko在被放归大海一年后死于肺炎。

这只可爱的喵咪“小家伙”给主人挣了多少没有被公开。但足以让主人数年前就辞掉全职工作,并给动物慈善机构捐了20万刀。小家伙仅油管版税一年能赚30万刀。

汉密尔顿要帅出天际啦——地球上的时尚潮流已经满足不了这只猫咪了,汉密尔顿在脸书上获赞超过11万次,IG上有55万个粉丝。《华盛顿邮报》评估他每年可以赚15900刀。

SQL使用量快速提升。它几乎快要超过获得第二高平均分数的R语言。如果继续保持该趋势,SQL很快将成为真正的第二。

以下是我推荐的学习路径:

在完成上面的第一个步骤之后,计算每个关键字相对于该年度其他关键字的排名,然后计算每一年的排名变化。

尽管这只可爱的小猎犬出演了许多电影,Terry 最广为人知的角色还是她(没错,是她)在《绿野仙踪》中出演的Toto ——很可能是好莱坞历史上最著名的混血狗。特里的薪水比当时绝大部分美国人都高,甚至比出演同部电影的演员都高。

19,狗狗特里:一周挣125(相当于现在2200,下同)刀

18,时尚达喵汉密尔顿:一年挣1900~15900刀

如果你刚开始从事数据科学,我建议你专注于需求增长和有发展潜力的技术,并且每次只专心学习一种技能

女士们先生们,请坐稳了,接下来出场的这位可能会让你震动。这个永远一脸不爽表情的小动物价值1亿刀,使她成为宠物界的比尔盖茨和巴菲特。她本来被主人叫做塔塔酱,在她主人成为网络名人后被改名为不爽喵。她是最受欢迎的网络文化传播现象之一。超过700万脸书粉丝,她油管的官方频道获得了超过1700万次观看。不爽喵有数个上市授权产品,包括以不爽喵的名义写的两本书:《一本不爽的书》和《喵生智慧:不爽喵眼中的世界》。

无论如何,LinkedIn的数据可能无法提供从去年到今年的苹果公司职位对比。今年夏天,LinkedIn的一些技术职位搜索词每周都会出现大幅波动。这可能是由于他们试图通过使用自然语言处理来衡量搜索目的,因而对他们的搜索结果算法进行了实验。相比之下,另外三个搜索网站在过去两年中出现的“数据科学家”相关职位列表数量则相对接近。

稳居榜首的python,落寞的R

17,小花生,世界上最丑的狗:赢得1500刀

以下是上述图表中的信息用表格形式展示的结果,按2018年至2019年上榜职位比例在三家网站平均后的变化百分比排序。

这只杰克罗素梗在《欢乐一家亲》中扮演Eddie,一集挣10000刀。有传闻,在这个长篇情景喜剧中,慕斯收到的粉丝邮件比其他任何人类演员都多。在06年慕斯死时,他积累了320万刀的财富。

不仅仅是宠物身份,这只大灰熊凭借出演他最大一部电影《边缘》而赚了100万刀,但巴特还出演了许多其他电影和电视节目。总共赚了超过600万的薪水。

铃叮叮,是一只在一战时期被一名士兵发现的德国牧羊犬,在1922年~1932年间,出演了大量华纳兄弟的电影。拯救了这家电影制作厂免于破产。这只狗一周最多挣2000刀,相当于现在的26000刀。

3,慕斯:净值320万刀

2018年的文章考察了对统计和沟通交流等一般技能的需求以及对Python和R等技术的需求。软件技术的变化一定快于一般技能需求上的变化,所以在本更新中只包括技术部分。

女士们先生们,请坐稳了,接下来出场的这位可能会让你震动。这个永远一脸不爽表情的小动物价值1亿刀,使她成为宠物界的比尔盖茨和巴菲特。她本来被主人叫做塔塔酱,在她主人成为网络名人后被改名为不爽喵。她是最受欢迎的网络文化传播现象之一。超过700万脸书粉丝,她油管的官方频道获得了超过1700万次观看。不爽喵有数个上市授权产品,包括以不爽喵的名义写的两本书:《一本不爽的书》和《喵生智慧:不爽喵眼中的世界》。

学习Python以掌握常规编程; 学习pandas来进行数据操作; 通过Scikit-learn库学习机器学习; 学习用于高效查询相关数据库的SQL; 学习Tableau以进行数据可视化; 关于云计算平台,基于AWS的市场份额,它是一个不错的选择; 学习一个机器学习框架,Keras现在与TensorFlow紧密结合,因此它是一个很好的起点,PyTorch也在迅速发展。

尽管亨利的首部视频发布于2007年,但他五年后才出名,电影评论家Roger Ebert 把《Henri 2, Paw de Deux》称作“史上最棒的网络猫视频”,他的主人在一家网上商店上一周收入大概1000刀。

事实证明,LinkedIn的爬取要困难得多,因为查看工作的列表的准确数字需要身份验证。我决定使用Selenium进行无头浏览。2019年9月,美国最高法院对LinkedIn做出了判决,允许其数据被爬取。尽管如此,在几次抓取尝试后,还是无法访问账户,这个问题可能源于刷新率限制。

观察前三个带有柱状图的选项,然后我们将展示一个包含数据的表并讨论结果。

专有的统计软件包MATLAB和SAS使用量急剧下降。 MATLAB在排名中下降了四位,而SAS从第六位下降到第八位。与2018年的平均水平相比,两种语言均出现了大幅下降。

在加利福尼亚猫咪塔拉从邻居家狗的魔爪中救下主人的孩子后,这只猫咪获得了国际赞誉。视频片段像疯了一样地传播,仅仅两天就获得了近1700万点击量。《华盛顿邮报》评估塔拉一年能挣55600~463700刀。

16,喵上校:一年挣5000刀

对于每个工作搜索网站,我们计算了该网站中出现的每个关键词在所有数据科学家工作列表中所占的百分比。然后,在三个站点上为每个关键字取这些百分比的平均值。

最初的键盘喵视频公开于2007年——而他的主人是在1984年录制的。该视频已经被观看了近7100万次,“猫弹钢琴”是油管上最火的视频之一。《华盛顿邮报》评估这只死于1990年代的猫,如今价值达175800刀。

狗狗Boo:一年挣100万刀

这是上文中方法1对应的2019年图表,显示Python出现在近75%的列表中。

他的名字源于电影《惊爆点》中Patrick Swayze 扮演的角色,而他的另一个名字更加出名:男装犬模。他疯狂追求时髦的主人让犬穿人衣这种疯狂的点子在主流媒体上大获成功。Bodhi 已经在《GQ》、《时尚先生》、《尼龙》、《时代周刊》等媒体上多次露面。

这是我的总体学习路径建议。按照你的需要各取所需吧。

Python仍然排名第一。到目前为止,它是最常用的语言。几乎霸占了四分之三的榜单,与2018年相比,Python使用量有了可观的增长。

许多Apache产品受到欢迎,包括Pig,Hive,Hadoop和Spark。Pig的排名下降了5位,比任何其他技术都下降得多。Spark和Hadoop仍然是人们普遍希望掌握的技能,但是我认为,转向其他大数据技术已经成为一种趋势。

拥有“世界上最可爱的狗”(the Worlds”s Cutest Dog)头衔的Boo还是维珍美国航空“发言犬”。Boo 2010年开通了自己的脸书主页,在收获了超过500万粉丝之后,Boo 出演了一本书,该书被译成11种语言。Boo 一年能赚100万刀,有1700万脸书粉丝。

混血救援犬小花生在一场火灾中被烧毁了脸和身体。但他们并没有自哀自怨,小花生和主人Holly Chandler 参加并赢得了2014年世界最丑狗狗大赛。Chandler 决定用这1500美元奖金帮助支付其他动物的诊疗费。

水晶在《动物行为》中一集能挣12000刀——但很不幸的是这部演出只有9集。不过没关系,这只可爱的小猴子,已经在商业演出领域工作了20年。出演的电影总共赚了超过15亿刀,包括《宿醉2》、《博物馆惊魂夜》。

方法3:看看2018年至2019年这些列表的平均比例变化的相对百分比。

方法2:看看2018年至2019年这些列表的平均比例变化的绝对值。

杰出的深度学习框架得到了广泛使用。PyTorch在所有关键字中的增幅最大,Keras和TensorFlow也表现出色。Keras和PyTorch在排名中均上升了4位,TensorFlow上升了3位。请注意,由于PyTorch的起始平均值较低,TensorFlow的当前平均值仍是PyTorch平均值的两倍。

13,灵犬帕西:净值157万刀

我们搜索了SimplyHired、Indeed、Monster和LinkedIn以查看在美工作的列表中哪些关键词和“数据科学家”共同出现。这一次,我们决定用Request和Beautiful Soup包来获取工作列表,而不是手工搜索。

这是上文中方法2的图表,显示了2018年至2019年职位列表中某项技能需求的变化。AWS显示上升了5%。在2019年和2018年上市的公司中,这一比例分别为19.4%和14.6%。

15,黑喵亨利:一周挣1000刀

方法1:对于每个求职网站,在每个年度用包含关键词的列表数量除以包含data scientist的搜索词总数。然后取三个网站的平均值。

这只因喜爱钻箱子而出名的苏格兰折耳猫已经在日本出演了两本书、一部DVD和一些商业演出。如今,Maru 一年能从油管伙伴项目、书籍、商品和代言活动中赚得18万刀。

在不到14个月的时间内技术需求发生了相当大的变化!

我们采用四种方法来查看每个关键字的结果:

R语言的总体平均下降幅度最大。基于其他调研,这一趋势不足为奇。Python显然已经取代R成为数据科学的首选语言。 尽管如此,R仍然非常受欢迎,出现在55%的榜单中。如果您熟悉R语言,请不要沮丧,但如果您想要掌握需求量更大的技能,请考虑学习Python。

1,不爽喵:净值1亿刀

You may also like :