中科汇联游世学:在自然语言处理上,百度第一,微软第二,我们第三

2017-04-19 22:55 VR/AR 来源:创头条 查看原文

雷锋网「新智造」按:本文为“聊天机器人玩家篇”的其中一篇创业报道,报道对象为互联网“老兵”中科汇联,其在2015年推出了爱客服机器人,进入智能客服领域。【新智造】采访了中科汇联的创始人游世学,主要围绕“技术、模式、生态”三个方面,讲述了中科汇联与其他同行玩家的不同之处。

雷锋网正在启动“新智造成长榜2017”评选活动,我们将对人工智能与机器人行业进行大规模报道、梳理和调研,并联合数十家著名投资机构根据这些创新公司的技术实力、商业能力和成长性进行深度评选,最终从多个领域分别选出一些极具潜力成长性的创新公司。如果你想参与我们的评选,可点击「报名」链接,或通过邮箱xinzhizao@leiphone.com联系我们!

中科汇联游世学:在自然语言处理上,百度第一,微软第二,我们第三

中科汇联创始人游世学

2015年,爱客服(AIKF)机器人第一次出现在中关村创业大街。一年之后,根据会计师事务所的审计,这项新业务给中科汇联带来了1500多万的营收,同比增长5倍

在客服机器人这条赛道上,除了看到风口想要飞起来的“小鲜肉”、闻风而至的大资本,还有部分玩家是中科汇联这样“潜伏”多年的老兵。

按理来说,把“创业”的帽子安在老兵头上,显得不合时宜,毕竟他们是和BAT“一辈儿”的老人,距离第一次创业,接近二十年;但在另外一个面向上,漫长的互联网岁月里,他们不得不隐身于BAT的光环之后,以极小的体量应对每一次技术变革,生死往往一线之隔。

创建于1999年的中科汇联,在创始人游世学的带领下,几经起落。据媒体报道,最惨的时候,游世学的兜里只有90块。2011年,在经历了PC互联网、移动互联网时代之后,面对着逐渐升温的AI技术,创始人游世学决定转型。一方面,他开始搜集国内外客服机器人公司的资料,分析其技术和商业模式;另一方面,中科汇联联合清华、北大、哈工大建立联合实验室,围绕自然语言处理(NLP)展开研究。

或许是由于新业务的快速发展验证了当时的转型,或许是出于对联合实验室科研能力的自信,游世学非常肯定地对雷锋网(公众号:雷锋网)新智造说:

我认为在中国目前自然语言处理上来讲,我们应该是前三名。第一名是百度,第二名是微软,因为它们的综合能力比我们强,在限定领域的自然语言处理我们更占优势。。

除了和巨头比较之外,游世学认为,客服机器人领域的众多玩家,表面上似乎是同一层面上的竞争,但实际上却不在一个层面,“从技术、模式到生态上,是完全不同的”。

在技术层面,基于NLP的客服机器人领域,一共有四个阶段需要突破:

  • 第一阶段:已知问题-已知答案

  • 第二阶段:未知问题-已知答案

  • 第三阶段:已知问题-未知答案

  • 第四阶段:未知问题-未知答案

游世学介绍说,第一阶段最为基础,大部分玩家都能做到,通过语义模板和相似度算法,为已知问题和已知答案做匹配,都能完成;在第二个阶段难度提高,对于一个问题而言,有很多表达的方式,甚至成百上千种,但是都对应一个答案。如果靠人工去进行知识梳理,工程量太大,也不能称作智能,这个阶段可以淘汰掉前一部分玩家。两个阶段,本质上还是匹配。

第三阶段,需要机器通过学习进行思考,针对用户的问题,自己“总结、理解”出一个答案。这个阶段的段位,游世学认为玩家已经很少了。中科汇联通过“唐诗宋词”来训练爱客服机器人,通过了社科院唐诗专家的图灵测试,机器人写的诗有40%骗过了中国社科院的唐诗专家,被认为是人类写的。

第四个阶段,是最理想的阶段,机器基本和人类无异,但到目前为止,国内外还没有研究成果出来。中科汇联游世学:在自然语言处理上,百度第一,微软第二,我们第三

除了依靠三大联合实验室在技术上的探索,在商业布局的模式上,游世学也阐述了和其他同行不同在哪。

就新业务而言,中科汇联形成了“一云、一端、一垂直应用”的布局。所谓的“云”,就是云计算平台;所谓的“端”是指语音人机交互技术的板卡,可以内置于智能设备中,使其具备对话能力;而“垂直应用”,指的就是将在客服领域中的应用。

就过去十多年的老业务而言,游世学告诉雷锋网新智造,虽然在表面上看,以NLP为核心的新业务和内容管理搜索、政府网站建设等老业务似乎并不相关,但实际上面对的客户是高度重合的。一方面,老客户需要进行技术升级;另一方面,新老业务配合,推出AI+战略,能够为客户提供全域的解决方案。此外,再加上端、云的配合,让这种解决方案就更为全面了。

对于政府及中小企业客户来讲,游世学认为这依然具有较大的优势和竞争力。通过这样的布局,就形成了一个完整的生态。这也是为什么,他觉得中科汇联与同行,做的不是同一件事的原因。

为您推荐: