加入收藏 | 设为首页 | 会员中心 | 我要投稿 西安站长网 (https://www.029zz.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 业界 > 正文

搜狗耗资4000万研发的汪仔机器人究竟是怎样的人工智能?

发布时间:2017-02-21 01:35:05 所属栏目:业界 来源:中国网
导读:副标题#e# 在江苏卫视《一站到底》2017 年第一期节目中,搜狗机器人汪仔亮相并以 8:6 的成绩,击败人类选手取得最后胜利。这次人机大战之后,搜狗搜索技术负责人许静芳向《机器之心》详细描述了汪仔参与比赛的技术秘密。 机器之心:比赛中,汪仔需要识别问

5. 抢答: 上面说过整个系统为了能够更快的抢答在多个模块都做了非常极致的优化,这里强调根据部分题目去推测完整题目并回答的能力。实际上这是人相对机器最有优势的方面,也是研发中花了最多时间的问题。我们对全网信息做了大量数据挖掘工作,形成很多有针对性的知识库供答题使用。

机器之心:汪仔在语音识别、语义识别方面的速度性能达到什么水平?准确率如何?进一步提升的技术难点是什么?

许静芳:汪仔语音识别的实时率目前在 0.3 倍实时左右,识别延迟最低可以控制在 100ms 以内,准确率方面,针对主持人语音的识别准确率在 97% 以上。汪仔语音识别部分希望进一步提升的难点在:

吞音问题:主持人读题的过程中,发音较快,很多字或者词一带而过,该现象会导致识别丢字的问题,这部分也是自然语音识别系统的重大问题,我们正在从数据、模型等多个维度进行优化;

新词/专有名词识别:一站到底题目每期都有变化,新词热词以及专有名词层出不穷,识别精度要保持在高水准的话,就需要我们不断推动模型对这几类词汇的学习;

现场观众及音乐的干扰:尽管主持人是头戴式麦克风,但是仍会有现场观众呐喊声以及现场背景音乐声混入到主持人语音中影响到识别性能,这部分我们正通过语音增强的方式进行优化。

机器之心:汪仔使用的计算资源情况是怎样的?节目比拼过程中所用到的分析处理是在现场本地化完成的吗?

许静芳:其实在这个项目中我们对于成本控制是挺严格的,对于语音识别、图像识别我们采用本地完成。答题部分,我们有多套系统,对于基于线下挖掘的知识库我们采用本地检索;而对于基于搜索的问答我们并没有针对一站到底专门搭建系统,因为这样要求较大的计算资源,这部分我们直接利用搜狗搜索的线上系统完成,实际占用的计算资源也较少。当然也可以把基于搜索的问答放到本地完成,它就需要在本地部署一套较大的系统,当然 watson 就是这么做的,但是确实需要较高的成本,我们选择了成本上更为经济的方法。

机器之心:汪仔的背后是搜狗立知问答系统,能否介绍一下这套系统及其大致研发过程?

许静芳:立知是一套智能问答服务系统,从它的名字可以看出,这个服务希望能够让用户在有任何问题时,通过它就可以「立即知道」答案。

搜狗耗资4000万研发的汪仔机器人究竟是怎样的人工智能?

图说:立知问答系统的关键构成模块

从功能上看,整个立知问答系统包含三个核心子系统:事实类问答子系统、分析类问答子系统和观点类问答子系统。当立知接收到用户请求问题时,通过意图分析模块理解问题意图类型后,自动将问题转发到相应的处理子系统。其中事实类问答子系统可以针对客观事实类问题作出响应,比如类似「五环之歌是谁唱的」这样的问题,这类问题的答案一般是明确唯一的客观知识,并可以通过简短的实体或概念将用户需要的信息完整表达出来,搜狗汪仔的智能答题能力背后依赖的就是这个子模块;分析类问答子系统可以处理更加复杂的问题,比如用户想知道某件事情的做法步骤,或者某种现象的原因,答案表述通常需要数十到数百字的一段文本;观点类问答子系统可以响应用户对事物看法的问题,它是群体智慧的集中体现。这三个子系统深度挖掘利用了海量互联网资源,构建有效的知识库系统,并充分结合了推理计算能力,它们集成起来能够响应大多数用户的真实问题需求。可以看出,立知可以回答开放领域各种类型的问题,它不仅支撑了汪仔机器人的答题能力,而且比汪仔的知识面更广,功能更强。

从技术应用角度看,立知系统的各个模块综合运用了自然语言处理、信息检索、机器学习和深度学习以及大数据高并发处理等人工智能领域的多项前沿技术,是一个技术密集型的复杂智能系统。

(编辑:西安站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读