我一直记得我的伙伴决定卖掉他的比特币的那个时刻。在2017年,我们一起在星巴克。我们被一个中年女士吸引,她在给每个人发放小册子。“比特币:让你提前退休的方法“这句话用大写加粗的方式出现在最上边。
我非常好奇,因此我询问她关于加密货币市场的看法,但是她并不知道除了比特币之外的任何一种加密货币。Ethereum?“没听说过”。Litecoin?“是比特币的一种廉价版本吗?”
现在,作为一条经验法则,连无所事事的中年女士都在星巴克里想你推荐最新的科技趋势时,你很可能正在接近炒作的高峰。或者说是“泡沫”。
当然,这并不是一个新的观察现象。每个人同意,在投资方面,如果你做其他人也正在做的事情,你很可能不会得到任何回报。奇怪的是,人们在投资自己的时候就不能正确应用这条准则。
假设你想要获得一个数据科学家的职位。如果你做了所有“我想成为一个数据科学家”的标准的事情,那么这就意味着你不能如愿地获得你梦想的工作。市场中充满了有初级人才,因此一个能力平庸有抱负的数据科学家不可能获得太多关注。如果你想要避免平庸,为什么要做大家都做的事情呢?
问题就在于,大多数人在开始数据科学家这条路的时候不这么想问题。我曾经和数百位有抱负的数据科学家聊天,他们中的80%都有着类似的故事:
- 首先,他们学习工具(Python+sklearn+Pandas+可能还有SQL等)
- 其次,他们都参加千篇一律的各种MOOC
- 他们阅读职位描述,担心自己不具备上面提到的任何东西
- 可能参加别的MOOC,可能开始申请职位
- 没有收到回应(好一点的,参加几个面试)
- 沮丧,考虑要不要拿一个学位,申请更多的职位
- 做出决定:重复2-7直到一些不同的事情发生
如果这些也发生在你身上,那么你很可能也处在自我提升的泡沫中:你做了其他每个人都在做的事情,不要期望会有不同的结果。你首先要做的就是停止。
如果你想要超越平均的结果,你就要做不一样的事情。但是避免平庸事情之前,要知道什么是平庸的事情。
这里有一些例子:如果你需要参加MOOC学习工具,那这就是一个。不要陷入MOOC的漩涡:MOOC课程是为大多数人设计的,因此你不可能通过更多的MOOC变得杰出。类似的,如果你的GitHub有了号几个Jupyter notebooks,它们有相同无聊的sklearn、pandas、seaborn、Keras堆栈,那就不要再做新的。
总的来看,规则是这样的:如果一些事情接下来的步骤结果显而易见,因为每个人都会这样做,那这件事最好就不要做。相应的,你需要发现那些别人不会做的事情,并且尽力去做好这一类事情。
都有什么这样的工作?基于我的观察,大概分为下面5种:
- 复现论文。如果你是一个深度学习爱好者,这是很有必要的。人们不这样做是因为这比抓取数据集使用简单的ANN或者XGBoost去做千篇一律的分类要难得多。发现感兴趣的文章(理想情况下是相对新点的文章),阅读并理解他。然后,复现,用一个新的数据集去实验。写下博客记录。
-
走出舒适区。如果你开始一个新的项目,最好要学习新的框架/库/工具。如果你已经有了6个Jupyter notebook都是以
df=pd.read_csv(filename)开始,以f1=f1_score(y_true, y_pred)结尾,那就是时候改变你的策略了。 - 学习无聊的事情。其他人不做这些是因为没有人喜欢无聊琐碎的事。但是学习适当的git flow,使用docker,通过flask构建自己的app,在AWS或者Google Cloud上部署模型,以及其他公司急切希望申请者具有的技能,但是大多数申请者并不重视的。
- 做自己讨厌的事。1)在当地的数据科学会议上发表一篇论文,或者说至少出席一个数据科学会议。2)在LinkedIn上发送冷消息。尝试提前提供一些价值(“我注意到你们网页上的一些拼写错误”)。不要直接跟他们聊工作。让你的问题尽可能具体(“我想在我的博文中得到你的反馈“)。你要尽量去构建你的关系并且扩展你的社交网络,这需要耐心。3)参加会议和网络工作。4)创建一个学习小组。
- 做一些疯狂的事情。每个人都使用UCI仓库数据或者其他常见的现有数据集构建他们的项目。不要这样!学习使用网络抓取仓库,或者说一些不常见的API去创建你的自己的定制数据集。数据是很难获取的,公司往往需要依赖他们的工程师去获取。你的目标是成为一个痴迷数据的科学疯子,为了完成工作需要去构建自己的数据集。
这些策略中的每一个都是在招聘中超越其他人的方式之一。它们不是silver bullets,但都是能让你在数据科学家这个职位中更具竞争优势的方法,并且可以帮助你成为一个更有实力的数据科学家。
在最后,记住当你在学习你的技能时,你是在对自己进行投资。这意味着所有的经济学准则都适用于此:如果你想要获得杰出的成果,你就需要做杰出的事情。
参考文献:
To get hired as a data scientist, don’t follow the herd










网友评论