加入收藏 | 设为首页 | 会员中心 | 我要投稿 西安站长网 (https://www.029zz.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

Google科学家最新整理,给新手推荐的十篇优秀数据科学文章

发布时间:2019-08-20 21:46:53 所属栏目:教程 来源:skura
导读:副标题#e# 作为数据科学的初学者,一些好的文章能够快速带我们入门这一充满了未知和挑战的领域。近日,google 决策智库的主管 Cassie Kozyrkov 整理了十篇给学生们推荐的 优秀 文章。下面这些文章几乎都来自于相同的博客。让我们来看看是哪些文章吧~ #1 理

分析和统计有一个主要的弱点:如果你在假设生成和假设测试中使用相同的数据点,那你就是在作弊。统计的严谨性要求你在采取行动之前先做出决定;分析更像是一场事后诸葛亮的游戏。他们几乎是悲剧性的不相容,直到下一次重大革命,数据分割改变了一切。

数据分割是一个简单的想法,但对于像我这样的数据科学家来说,这是最深刻的想法之一。

后来,机器学习出现了。

使用数据集会破坏其作为统计严格性来源的纯度。如果你有第三个数据集,你可以用它来获得灵感。这个筛选过程被称为验证,它是机器学习的核心。

一旦你可以把所有的东西都扔到一起上,你就可以让每个人都有机会想出一个解决方案:经验丰富的分析师、实习生、茶叶,甚至算法,而不必考虑你的业务问题。无论哪种解决方案在验证中效果最好,都将成为适当统计测试的候选者。你只是让自己自动激发灵感!这就是为什么机器学习是数据集的革命,而不仅仅是数据。

用深度神经网络进行机器学习在技术上被称为深度学习,但它还有一个绰号:人工智能。虽然人工智能曾经有不同的含义,但今天你很可能会发现它被用作深度学习的同义词。

深度神经网络由于在许多复杂的任务上比不太复杂的 ML 算法更容易分类,因此赢得了他们的赞誉。但它们需要更多的数据来训练它们,并且处理要求超过了典型的笔记本电脑。

#5 机器学习——皇帝的新衣?

文章地址:https://medium.com/@kozyrkov/machine-learning-is-the-emperor-wearing-clothes-928fe406fe09

Google 科学家最新整理,给新手推荐的十篇最佳数据科学文章

机器学习使用数据中的模式来标记事物。听起来很神奇?核心概念实际上非常简单。如果有人让你觉得这是神秘的,他们应该感到尴尬。

核心概念非常简单

我们的标签例子将涉及到将茶分类为美味或不美味,所有的想法在数学或代码所需技能上都超级简单!

Google 科学家最新整理,给新手推荐的十篇最佳数据科学文章

原理是什么

数据

让我们想象一下,我品尝了 50 杯茶,并将它们的信息直观地呈现在下面。每一杯都有糖和酿造时间信息,Y 代表美味,N 代表不那么美味。

在我品尝了这些茶并将它们的数据记录在电子表格中之后(左图),在右图中我以更友好的格式展示了这些信息。

Google 科学家最新整理,给新手推荐的十篇最佳数据科学文章

算法

通过选择要使用的机器学习算法,我们将选择我们将要得到的配方类型。机器学习算法的目的是选择一个最合理的地方来在数据中设置一个围栏。

(编辑:西安站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读