正文
数据科学有许多需要特别洞察力的很酷的技术和工具。然而,就像软件工程一样,即使你可以做到所有那些很酷的事情,如果没有过程,你会跟不上项目,做出来的产品表现也不好,并且不能维护已经完成的项目。
这意味着你需要把你的过程写成文档。
这看起来好像是在浪费时间,但等你的项目出现内部故障的时候你就知道记录过程有多重要了。所以确保你从一开始就有很棒的数据科学过程。
不要用你的知识范围来限制你的数据科学团队。挑战你的团队,问问他们怎么想的,问问他们的建议,不要限制他们的发展。
让他们知道你支持他们并且相信他们的能力。数据科学家都是十分聪明的人,他们只是需要知道你相信他们(就像小叮当一样)。
如果要说我们从不同的经历和项目中学到了什么,那就是——你需要计划。这确保你不会超出范围,保证你对所有的数据源和要求有一个很好的掌握,还保证你能成功。不过,如今在商业中事物变化得很快,所以你不能花一年的时间去计划一个项目。
当一个项目提上了日程,你就得赶紧去获得这个项目的具体要求 。只是别把所有时间都用来计划而从来不开发项目。
每个企业都像是一个团队性运动。
你的团队需要和会计处、财务处、运营部、销售部和其他所有部门一起工作。他们通常都有自己的数据仓库,而你需要那些数据。如果你够幸运的话,会有一个中心团队管理所有的数据库。不过即使确实有这样的一个中心团队,你依旧需要来自各个团队的专家。此外,所有这些团队可能都会想要对你的项目提出一些要求。所以,确保和他们好好相处。
像我们在上一点中提到的,你会想要向不同部门的人学习尽可能多的专业知识。数据科学家不是药剂师或医生,也不是会计或财务经理。我们需要从对某一行业或领域了解最透彻的人那里获得一些洞见。当一个新项目开始时,列一份你所需要的数据和相关主题的清单,然后去请教那些行业专家。
然而,即使你要去征求行业专家的建议,不要让他们的偏见阻碍新的洞见。
这种情况一直都在发生。很多时候管理层和其他团队成员对商业模式有固有或者过时的认知,他们会认为提升业务无非是那几个要素。接着,你的团队得出了一个全新的结论。由于这一结论与现状相违背,你的团队把这一新的洞见掩藏了起来,而没有把它提交给经理。这不是你作为一个数据科学家的工作。你的职责是挑战现状!不过是在正确的前提下。
作为一个数据科学家,你有数据站在你旁边支持你。这就意味着当你是对的,那你确确实实就是对的。你对的时候也不能得理不饶人。我们的意思是你要敢于说出真相,不要被你的经理或主管牵着鼻子走。 其实,他们想要你的意见。你的领导想要你提供给他们能够自信地带去见他们的老板的信息。归根结底,你的老板也有自己的老板。当他们向自己的老板汇报的时候,他们的感受和你的一模一样。所以,用数据巧妙地去挑战你老板的观点吧!
我们相信现在你已经看到了一个主题。利用数据!这其中蕴藏了太多的力量。这甚至不是一个新的想法。人们一直都在使用数据证明一些事情。
科学就是依赖于重复利用数据证明理论的这一套方法论,即使是那些我们今天认为是正确的理论。
对你的每个项目也做同样的事情。你为什么做这个项目?是什么在驱动着它?最好是数据。