高效数据科学家那里偷走的15个习惯
数据科学家。 与时俱进仅在过去十年左右的时间里,出现了多少当前的数据科学技术?他们中的大多数。 带着想要在数据科学领域做出巨大成就的动机,你已成为终身学习的一员。不用担心,它听起来并不那么可怕。 但是,你任何时候都应该记住的是,你需要与时俱进。因此,如果你一生都在使用MATLAB进行数据分析,请尝试学习使用Python来编程。如果你一直在使用Matplotlib来可视化数据,请尝试使用Plotly进行一些创新。 如何养成这种习惯:每周花一个小时(或尽可能多的时间),然后尝试新技术。阅读博客文章,找出哪些技术是相关的,然后选择几个你想添加到堆栈中的技术。然后,创建一些个人项目,来学习如何充分利用新技术。 适当维护文档我似乎总是很幸运能够阅读和处理具有糟糕文档的代码,而没有支持注释来帮助我了解到底发生了什么。 直到一天,我意识到这只是一个糟糕的程序员的标志。 我所遇到的的所有优秀程序员都提供清晰,简洁的文档,并通过提供有用的注释来描述某些代码行的用途。对于使用复杂算法和机器学习模型来解决问题的数据科学家而言,这一点尤为重要。 如何养成这种习惯:花一些时间阅读有良好的代码文档或有关如何编写良好的代码文档的文章。要练习,为旧的个人项目写文档,或者花一些时间来修改当前项目的文档。 由于数据科学世界中有很大一部分都运行在Python上,请阅读这篇关于如何记录Python代码的好文章:
融入到数据科学的社群人们曾经认为开发人员是不能融入社会的流浪者,他们束手无策的编写注定要统治世界的代码。这是一种过时的概括。它无法反映整个技术行业的现代复杂性。 “没有人是一个小岛。” ——最受数据科学家喜爱的名言 数据科学的复杂性要求在数据科学界内外建立一个庞大的专业人员支持网络,来解决数据科学家必不可少的各种问题。 但是,社区的重要性不仅限于专业层面。随着数据科学领域的不断扩大,我们有必要为未来的分析师和工程师铺平道路,以便他们也可以发挥影响并进一步支持其他数据科学家。 随着数据科学领域的“性别”逐渐减少,进行必要更改的唯一方法是发起整个社区的运动,以激励行业进行更好的变革。 如何养成这种习惯:成为一名导师,撰写内容丰富的博客文章,加入数据科学论坛并帮助回答问题,建立一个YouTube频道来分享你的经验,参加Kaggle竞赛和黑客马拉松或创建课程来帮助未来的数据科学家学习他们需要进入这个行业的技能。 定期重构你的代码重构是清理代码而不更改其原始功能的过程。虽然重构是软件开发环境中必然产生的过程,但是重构对于数据科学家来说可能是一个有用的习惯。 重构时我的口头禅是“少即是多”。 我发现,当我最初编写解决数据科学问题的代码时,我通常会抛弃良好的编码习惯,而编写在需要时可用的代码。换句话说,我写了很多没有结构的代码。然后,在获得解决方案后,我重新清理代码。 如何养成这种习惯:看一下旧代码,想一想是否可以更高效地编写相同的代码。如果是这样,请花一些时间来学习最佳编码实践,找出可以缩短,优化和阐明代码的方法。 看一下这篇很棒的文章,它概述了代码重构的最佳实践:
优化你的工作区,工具和工作流程现在有许多用可提高IDE效率的扩展,吃惊的是,有些人还没有选择优化其工作流程。 这种习惯对于每个人来说都是如此独特,以至于真正要确定哪些工具,工作空间和工作流程使你成为可能的最有效和最高效的数据科学家。 如何养成这种习惯:每年一次(如果更适合你,则每年一次),评估你的整体有效性和效率,并确定可以改进的地方。也许这意味着早上要首先研究机器学习算法,或者坐在健身球上而不是椅子上,或者在IDE中添加一个新扩展名,从而为你的代码添色。尝试使用不同的工作空间,工具和工作流程,直到输入最佳表单为止。 专注于理解商业问题
据我所知,在数据科学界,75%的工作是理解商业问题,25%的工作是编写模型来解决问题。 (编辑:揭阳站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |