搜狗耗资4000万研发的汪仔机器人究竟是怎样的人工智能?
这套系统的研发难度相当大,从项目组成立到第一版上线,研发过程持续了将近一年的时间。整个系统研发依赖搜狗搜索提供的海量网页数据和基础计算平台。我们整合了多个业务线的优秀算法研究和开发人员,针对不同类型的问题,研发相应的人工智能算法和高效系统架构,让系统逐步拥有快速回答各类问题的能力。这个研发过程目前还在持续优化中,我们希望进一步尽可能多的满足用户的各种真实问答需求。 机器之心:自去年 10 月上线后,立知相关的使用数据表现如何?接下来,还会有哪些场景化应用方向? 许静芳:目前,立知每天为数百万用户提供精准答案服务,回答准确率在 98% 以上,大幅提升了用户使用搜狗搜索的体验,达到了我们的预期。立知系统的后端是一个针对问题提供答案的云端服务,当前的主要应用是在搜狗搜索结果的首条为用户查询提供答案,未来我们的目标是将这一服务嵌入所有存在问答需求的场景。 近期,我们有两个与搜狗已有产品密切联系的应用方向。首先我们会将立知技术融入普通网页搜索服务,尽可能将多条自然搜索结果都以答案的方式呈现给用户,将搜索和问答更加紧密的联系起来,更充分地提升用户获取信息的效率。立知的另一个重要应用场景是搜狗输入法。大家知道输入法是搜狗强大的客户端应用,它可以通过接收语音或者文字输入的方式,每天为数亿用户表达信息提供了快捷服务。但是相比快捷的需求表达过程,用户获取信息的过程目前还不太方便和智能。我们希望通过立知系统,能够更好满足针对问答的一大类信息需求:用户在完成信息需求输入时,答案就会在输入法应用内立刻以语音或者文字的方式呈现出来,这样可以大幅改善信息获取效率和用户体验。整个需求表达和信息获取效率的提升,将会很好地体现搜狗在人工智能领域的核心使命—「自然交互和知识计算」。 机器之心:能否介绍一下,搜狗目前在语音技术研究方面的整体近况?今年还有哪些新的计划? 许静芳:从技术维度来看,作为深度学习应用非常成功的领域,语音识别技术已经全面深度学习化,17 年,我们会继续深耕前沿深度学习技术,尝试更深的模型结构、端到端的终极解决方案以及离线语音识别能力的升级;同时针对语音识别难度较大的场景进行深入的探索,比如远场高噪、口音、中英混输等重点场景,制定出软硬件结合的解决方案。 (编辑:西安站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |