加入收藏 | 设为首页 | 会员中心 | 我要投稿 西安站长网 (https://www.029zz.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 建站 > 正文

数据科学家易犯的十大编码错误,你中招了吗?

发布时间:2019-05-06 19:39:41 所属栏目:建站 来源:机器之心编译
导读:副标题#e# 数据科学家比软件工程师擅长统计,又比统计学家擅长软件工程。听起来牛逼轰轰,事实却是,许多数据科学家有统计学背景,却没有什么软件工程方面的经验,因此在编码时容易犯一些简单的错误。作为一名高级数据科学家,本文作者总结了他在工作中常见

这个结论还有一些争议——Jupyter notebook 就像 CSV 一样常用。很多人都会用到它们。但这并不能让它们变得更好。Jupyter notebook 助长了上面提到的许多不好的软件工程习惯,特别是:

  • 你会把所有文件存在一个目录中;
  • 你写的代码是自上而下运行的,而不是 DAG;
  • 你不会模块化你的代码;
  • 代码难以调试;
  • 代码和输出会混合在一个文件中;
  • 不能很好地进行版本控制。

Jupyter notebook 很容易上手,但规模太小。

解决方案:用 pycharm 和/或 spyder。

原文链接:

https://medium.com/m/global-identity?redirectUrl=https%3A%2F%2Ftowardsdatascience.com%2Ftop-10-coding-mistakes-made-by-data-scientists-bb5bc82faaee

【本文是51CTO专栏机构“机器之心”的原创译文,微信公众号“机器之心( id: almosthuman2014)”】

戳这里,看该作者更多好文

【编辑推荐】

  1. “老司机”划重点!搞定这120个真实面试问题,杀进数据科学圈
  2. 数据科学难在实践,有哪些弯路可以不走?
  3. 数据科学的下一个「超能力」:模型可解释性
  4. 除Kaggle外,还有哪些顶级数据科学竞赛平台
  5. 14个Q&A,讲述python与数据科学的“暧昧情事”
【责任编辑:赵宁宁 TEL:(010)68476606】
点赞 0

(编辑:西安站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读