确认过眼神,齐悟要做AI “另类独角兽”

2018-06-11 09:54:16作者:黄文凤来源: a&s智慧生活

[摘要] 现实往往很骨感,当前大多数AI是“人工智障”,继而成为被调戏的对象,那么作为AI语音交互技术提供商,应该如何定位语音交互技术研发方向,并开拓国内的市场呢?

  众所周知,2016年是人工智能的元年,这一年,在各路资本狂热追捧和媒体万般宠爱下,一批AI公司陆续崛起,开启AI大业,随着人工智能技术的日益成熟及市场两年时间的洗礼和培育,如今市场上各类AI产品如智能机器人、智能音箱、智能家电等如雨后春笋般争奇斗艳,但是,现实往往很骨感,当前大多数AI都是“人工智障”,继而成为被调戏的对象。

  那么作为AI语音交互技术提供商,应该如何定位语音交互技术研发方向,并开拓国内的市场呢?为此,a&s智慧生活邀请到革命性语音交互技术提供商深圳市人马互动科技有限公司市场部总监李孟威,和我们分享这群海归精英如何做定位自身的角色,如何让机器人拥有更加聪明的大脑,笔者确认过眼神,齐悟(人马互动科技创办的人工智能品牌)就是要做AI技术领域的“另类独角兽”。

201806110949369969.jpg


专访深圳市人马互动科技有限公司市场部总监李孟威

  语义理解铸造AI大脑

  人工智能技术研究领域主要包括语音技术、计算机视觉和机器人,其中语音技术是人工智能取得快速突破的重要领域之一,而且,目前语音识别的错误率已经从2012年的近33%下降到如今3%左右了,这项技术的突破让机器人或智能设备能够听懂并能够从某种意义上理解人的想法和意图。

  虽然AI语音技术发展日益成熟,但目前市场上出现的智能语音产品,大部分都是人工智能初级阶段,用户经过简单几轮对话后,语音助手就开始听不懂,以靠卖萌来化解尴尬。深圳市人马互动科技有限公司市场部总监李孟威表示,之所以被吐槽智障,就是因为这些语音技术还仅仅停留在语音识别和数据积累阶段,语义理解技术水平较低,无法满足用户的特定场景需求,也可称之“伪人工智能”。他认为,一套完整的语音交互系统包括语音识别、语义理解到语音合成,而语义理解才是机器人的大脑和思维,同时也是最难攻克的技术。

  目前市场上Nuance、科大讯飞、云知声等专注于语音识别技术,而齐悟则独辟蹊径,将语义理解当做语音交互的重要研发方向,据悉,齐悟自主研发的语义识别人工智能引擎已经开发了10多年并且获得多项发明专利,被业界称之为革命性的语音交互技术,齐悟技术的核心是采用独特的偏重实例层的多层语义知识网络,基于图模板映射的规则归纳和知识推理,能做到“记忆,认知,理解,问答”,可以实现上下文语义理解及推理,能处理复杂的业务逻辑,使机器人可进行高度拟人的复杂多轮对话,而且在保证顺畅沟通的同时还能越来越"懂你"。

  在提到目前的语音交互技术发展到何种水平时,李孟威称,无法用具体的技术标准来衡量,不过可以用6岁孩子的智商来形象表达,他强调,目前的语音技术还无法满足用户的具体业务场景需求。如果人工智能有10分的话,机器人达到8分就可以在市场做到通用,但是,目前最多仅能达到5-6分,如果说2016年到2017年这两年是人工智能(包括算法和深度学习)的炒热阶段,那么从今年开始,基于某一个领域的人机交互应用场景的通用产品将会逐渐下沉到市场。

  无屏化和情感化是走向

  在万物互联的物联网时代,作为物联网碎片化应用的最重要入口,语音交互技术在智能家居、智能游戏、智能医疗、智能教育、交互广告等垂直领域担当重要的角色,这一点是计算机视觉无法做的,因此,语音交互技术的重要性无可比拟,并且,随着AI语音与行业应用的深度融合,有业内分析人士认为,未来AI语音技术将走向无屏化和情感化方向 。

  语音交互则是我们下达语音指令来完成表达确认、打断、纠错等信息交互的过程,而从目前来讲,屏幕是我们现在和智能设备交互的主要渠道,图形用户界面的点击、滑动、触摸等为我们创造了各样的交互方式,这已经成为我们的交互习惯,因此,在一个满是GUI的页面上,使用语音交互,会让用户充满割裂感,这也是苹果旗下的Siri唤醒率极低的重要原因,也是最初语音助手无法克服的障碍,齐悟李孟威表示,由于语音交互技术的最终目标就是为了解放双手,因此,语音交互技术比较适合用到诸如智能手表、智能手环、无屏音箱、家居助手等等无屏化设备或弱屏化的设备。

  不过,随着2018年国内外互联网巨头陆续推出带屏智能音箱后,上述语音交互技术的无屏化趋势遭到质疑,李孟威称,各巨头纷纷抢夺带屏智能音箱,主要为了抢占智能家居流量入口,但是,由于无屏智能音箱的功能太过于单一,目前无法支撑起智能家居丰富的应用场景,而且,目前语音交互技术有一定的局限性,还仅停留在对智能家居设备开关、场景预制、场景联动等简单的语音控制,无法真正满足用户的AI需求,而带屏智能音箱显然丰富了人机交互的方式,对语音控制可以起辅助作用,他强调,未来当语音交互技术发展十分成熟时,去屏化将是语音交互最终的归宿。

  此外,因为语音技术还没有处理情感化的自然语言机制,无法根据用户的状态对应地沟通,因此,目前和机器人对话的丰富情感往往会被浪费掉,这也是目前语音交互技术无法最大化满足用户需求的重要因素,不过,李孟威表示,这种情感化的语音交互技术,未来几年内无法完成。

  独辟AI定制化+泛娱乐

  众所周知,科大讯飞专注于做开放的语音平台,而人马互动科技选择走AI语音交互定制化之路。李孟威称,定制化和开放通用的市场需求空间相差无几,不过,通用的语音交互技术一般用于按量采购的机器人领域,但是,主要仅做到语音识别技术层面,而在语义理解领域具有很大的技术局限性,并且,通用的语音技术通常无法满足客户的业务场景的特定需求,一个领域有成熟应用的语音交互技术,到其他场景中就不以用了,而选择为企业深度定制专属自己的语音引擎,帮助其大幅降低人力成本,提升产品价值,用创新的黑科技结合企业的资源优势实现共赢。

  李孟威称,“齐悟”语义识别脑引擎的所有服务均基于云端服务器,对平台、操作系统、软件没有任何限制,为此,可根据客户的不同需要开发出各种产品形态,然后最终落地应用到智能客服、智能家居、虚拟偶像、智能医疗、交互广告等领域。以智能家居落地场景来讲,齐悟要做的不是简单的控制开关,而是提供更加人性化的智能家居体验,比如,开门后,当用户的脚踩在地板上,机器人可以自动感受到用户回来;躺在沙发上,说今天很累,智能沙发就可以根据用户的健康数据来挑选最适合的按摩方式,这也是真正的智能家居,而不是通过冷冰冰的指令或事先预设的联动场景来实现。

  此外,齐悟将自己定位为泛娱乐的垂直领域解决方案商,李孟威称,齐悟是自主研发智能游戏出身,2016年成立时就已做出全球首款智能语音控制游戏,因此在泛娱乐领域有丰富的技术和资源积累。另外,除了智能游戏和虚拟偶像,智慧生活也是齐悟关注的重要领域,齐悟计划于今年年底推出应用于智慧生活领域的类Siri的“智能生活助手”,可实现查机票、订酒店、点外卖等功能。

  在记者提到目前国内语音市场发展现状时,李孟威认为,目前语音市场还处于被教育的阶段,很多企业对人工智能的需求还不太明确,而且由于语音交互技术还没有做到产品通用化阶段,企业对未来产品语音功能和用户的体验反馈不确定,因此国内语音市场还需要继续哺育。他透露,齐悟成立一年多,目前融资完成3轮,并且已经和 100多家公司达成战略合作并拿下3000万单意向订单。最后,李孟威表示,齐悟未来要对外开放“齐悟大脑”平台,可以的预见是,一条基于“齐悟”技术的“机器人大脑产业链”正在不断延伸。齐悟的愿景是,希望把人工智能快速应用到更多的垂直领域,真正的解决人们的双手,为人们的生活带来诸多便利。


0
[责任编辑:黄文凤]

作者:黄文凤文章数:246
a&s传媒INTEGRATOR执行副主编,主要专注于消费电子、工业电子、医疗电子、电源/新能源和物联网 、人工智能、大数据、云计算等前沿技术资讯,及这些技术在智慧城市垂直行业的创新应用。

安全自动化 官方微信    as视界 服务号

不得转载声明: 凡文章来源标明“安防知识网”的文章著作权均为本站所有,禁止转载,除非取得了著作权人的书面同意且注明出处。违者本网保留追究相关法律责任的权利。

亚马逊云科技在天津设立智能制造数字化赋能中心

亚马逊云科技在天津设立智能制造数字化赋能中心

在2022年中国国际服务贸易交易会(以下简称"服贸会")期间,亚马逊云科技宣布将与天津经济技术开发区合作,在天津设立智能制造数字化赋能中心,致力于加速当地制造业的数字化转型与创新。天津智能制造数字化赋能中心是亚马逊云科技在中国设立的首家专注于制造业的数字化赋能中心,也是亚马逊云科技在中国北方设立的第一家数字化赋能中心。
专栏
我要投稿
文章排行榜
杂志
  • 安全&自动化2023年9-10月 第261期
    2023年11月第261期
    2022-2023年,全球经济前景的“不确定性”正在对安防与其他行业产生着重大的影响,通货膨胀、供应链挑战、地缘政治冲突、全球劳动力市场结构变化……不稳定的经济环境在很大程度上给全球安防行业的发展带来了极大的阻力。2022年国内安防市场保持着增长,但增速放缓,2023年国内宏观经济呈现复苏态势,市场需求有所回暖,但由于国内政府财政收支减少、部分项目进展缓慢、房地产市场下滑、企业端市场投资信心减弱等因素,给安防企业带来持续挑战。