揭秘Facebook的AI机器:AI已关乎存亡
2007 年,他加入微软研究院位于英格兰剑桥的实验室。他在加盟不久后获知公司要举行比赛:微软准备推出必应,但需要在搜索广告这一重要组成部分上进行改进——准确预测用户会在什么时候点击广告。该公司决定就此举行内部比赛。胜出团队的解决方案将接受测试看看是否值得推出,团队成员也将获得免费到夏威夷旅游的奖励。 19 个团队参与竞争,最后坎德拉的团队并列获得冠军。他获得了免费出游的奖励,但微软却迟迟没有兑现更大的奖品(展开测试来决定他的作品是否可以推出),这让他感到受骗。 后来发生的事情充分显示了坎德拉的决心。他开启疯狂的穷追不舍模式,以让公司给他一次机会。他进行了超过 50 次的内部讲话,他打造了模拟器来证明其算法的优越性。他也不断游说那位握有决策权的副总裁,不管后者去到哪,包括洗手间,他都伺机接近,不停宣讲自己的系统。 2009 年,坎德拉的算法随必应推出。 2012 年初,坎德拉探访在Facebook供职的一位朋友,在它的门洛帕克园区呆了一个周五。他惊讶地发现,在这家公司,人们并不需要乞求上级批准测试他们的作品。他们直接那么做就行了。在接下来的周一,他去Facebook面试,周末便拿到了要约。 当初的模型并不先进 加入Facebook的广告团队后,坎德拉的任务是领导一个小组展示相关度更高的广告。坎德拉说,虽然当时的系统有使用机器学习技术,“但我们所使用的模型并不是很先进,它们很简单。” 侯赛因·梅汉纳(Hussein Mehanna)是另一位跟坎德拉同时间加盟Facebook的工程师,他同样对该公司的系统在整合AI上缺乏进展感到惊讶。“在我还没有加入Facebook之前,看到该产品的质量,我以为一切都已经成型,但很显然还没有。”梅汉纳说,“在入职几个星期后,我就跟坎德拉说,Facebook真正缺少的是一个合适的世界级机器学习平台。我们有机器,但没有合适的软件来帮助机器尽可能多地从数据学习。”(梅汉纳如今是Facebook核心机器学习主管,也曾在微软供职多年——本文另外几位受访的工程师也是微软出身。巧合?) 对于“机器学习平台”,梅汉纳是说在基于大脑运作方式的模型普及后,那个将AI带出上世纪的寒冬期进入近年的绽放时期的范例的普及。以广告为例,Facebook需要它的系统做某种没有人能够做的事情:即时且准确地预测有多少人会点击给定的广告。于是坎德拉和他的团队着手打造一个基于机器学习程序的新系统。由于该团队想要将该系统打造成平台,让该部门所有的工程师都可以访问,他们采取了一种让建模和训练能够推广和复制的建造方式。 打造机器学习系统的一大重要因素是获得优质数据——越多越好。幸运的是,这是Facebook最大的资产之一:当你有超过 10 亿人每天使用你的产品,你就可以给你的训练集收集大量的数据,一旦开始测试你也可以获得无数用户行为方面的例子。正因为此,广告团队能够加快到每周推出几个模型,而不再是每几周推出一个新模型。由于要将系统做成平台——让公司内部其他的人员也能够用来开发他们自己的产品——坎德拉得联手数个团队来展开工作。这是一个精细的分三步走的过程。“你要先专注于性能,再专注于效用,然后专注于打造社区。”他说道。 坎德拉的广告团队证明了机器学习技术在Facebook的变革性。“我们在预测点击、点赞、转换等方面变得极为成功。”他说。将那种模式扩展到Facebook平台的其它服务也就成了顺理成章的事情。事实上,FAIR领导者乐昆之前就在呼吁设立部门来负责将AI应用到产品当中——准确来说,是在公司内部更大范围地推广机器学习技术。“我的确曾呼吁设立这样的部门,因为你需要这样由优秀工程师人才组成的组织专注于可为很多产品部门使用的基础技术,而不是直接负责产品。”乐昆表示。 (编辑:西安站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |