加入收藏 | 设为首页 | 会员中心 | 我要投稿 西安站长网 (https://www.029zz.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 运营 > 正文

亚马逊的Alexa到底神奇在哪里

发布时间:2017-04-21 22:50:11 所属栏目:运营 来源:Donews
导读:副标题#e# 随着亚马逊的智能音箱Echo销量逼近千万,Alexa无疑成为了全球范围内截至目前最为成功的消费级AI产品,也可谓是亚马逊这家电商公司在人工智能领域一次的跨界奇迹,极大刺激国内各个科技公司也纷纷进入语音交互领域。根据内部人士提供的数据,包括

所以Amazon选择了稳妥的从音箱品类进行升级,当然苹果也选择了从耳机进行升级。这就特别要注意,传统品类升级的时候一定要避免与其他品类的冲突,比如假设给Echo加上屏幕,用户会把这个品类看成音箱还是平板?我想Amazon更愿意用户把Echo看作为音箱,即便他们非常不情愿。

事实上,国内很多创业公司都在验证Amazon的眼光有多么独到,因为我们已经看到太多配置屏幕的机器人和智能音箱,甚至还有不少耳机产品。其销量为什么不好?为什么不换个角度想想,这种场景下,用户买个iPad Mini是不是会是更好的选择?

4当前阶段用户真的需要多轮对话?

Toni Reid的观点很明确,Alexa暂时不需要多轮对话,因为这会让早期用户的体验更糟糕。笔者也坚持这个观点,但是有几点是必须补充的。

首先来看,现在的语音交互实际上都是语音控制,确实这个阶段我们真的很难让计算机理解人类语言。在这个前提下,真正的多轮对话实际上很难做到,当前更多的是解决基于场景的搜索问题。当不能真正理解用户思想的时候,多出的对话若不能解决用户的需求,反而是用户极其反感的地方。简单想想,真正使用一个产品的时候,面对着冷冰冰的机器,难道让用户和机器沟通要比和女朋友沟通还要费劲吗?抱歉,即便作为用户,笔者也只是想要一个绝对听从于我指令的音箱而已,声智科技经常会测试各个厂商的Demo,但凡偶尔唤不醒或者一句没听懂我就挺恼火的。

其次来看,我们怎么理解多轮对话?Toni Reid提到不希望Alexa问到第三遍,这实际上还不是一个多轮对话的问题,而是问答反馈的问题。也就是说,真正的多轮对话可能不需要,但是问答反馈还是必须得,我们知道Echo由于没有了屏幕,先天丢失了用户交互过程中的反馈途径,这个时候语音的反馈就显得比较重要。但是这是一个很大的坑,到底该如何把握这种问答反馈,既让用户快速获取满意的答案,又能在模糊的时候通过一次问答来解决用户问题,我想这个方面真的需要仔细研究Echo,Echo的成功就是仔细思考和打磨了每个细节。

事实上,可以连续唤醒的单轮问答对话才是智能音箱的核心技术所在,简单可以理解为智能音箱的唤醒是第一优先级的,必须支持连续的无数次唤醒,做到有问必答,也就是说用户可以随时唤醒并且打断其他对话直接唤醒,而且必须保障唤醒率和虚警率,虚警率太高显然不行,这会让设备总是莫名其妙自动对话。当然,声智科技的这项技术当前还主要针对大客户定制,开发板暂时还不支持这项功能。

5深度学习真解决了语音交互问题?

这个问题实在不好解释了,引用微软首席研究员刘铁岩的一句话,顺便也推荐感兴趣的同学看看刘研究院所做的《人工智能的挑战与机遇》演讲,这给国内火热的人工智能泼了一盆冷水,但是我相信所有从事这个行业的技术人士都是有清晰认识的。

“所谓深度学习实验室,就是一批会调参的人,没有他们深度学习就没那么好用。虽然是句玩笑,但是深度学习要调的东西确实太多了,比如说训练数据怎么来,怎么选,如果是分布式运算怎么划分,神经网络结构怎么设计,10层、100层还是1000层,各层之间如何连接,模型更新的规则是什么,学习率怎么设,如果是分布式运算各个机器运算出来的结果怎么聚合,怎么得到统一的模型,等等,太多需要调的东西,一个地方调不好,结果可能就大相径庭。这就是为什么很多论文里的结果是不能重现的,不是说论文一定不对,但至少人家没有把怎么调参告诉你,他只告诉了你模型长什么样而已。”

那么,从上面几个问题继续引申,我们到底应该怎么看待持续火热的Alexa和Echo?国内公司该是怎样理解和思考人工智能,笔者拙见,也提几点个人的看法和建议,期望AI能在理性的环境中成长。AI是未来的趋势,创业者长期的事业,绝对不是一蹴而就的事情。

1 AI最大的问题是不懂人脑机制

(编辑:西安站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读