3sNews讯 为期两天的2012地理信息开发者大会(简称:WGDC)在北京国家会议中心举行,本次大会以“新技术、新模式、新商业”为主题,是地理信息领域最具影响力的技术性盛会,其宗旨是不断引领和促进地理信息技术的创新与变革。在第二天的“Telematics与车载智能终端”分会场,科大讯飞平台及嵌入式事业部车载及智能电视业务总监刘俊峰发表了题为《自由交互 语音随行——擢升地理信息应用交互体验》的演讲。
以下为文字实录:
大家好!我们希望语音作为一个交互工具能够为地理信息带来新的交互方式。语音和地理信息都是比较火的行业方向。我们关注的是什么地方,在什么地方、人做了什么事情。从地理信息角度来讲,我们关注的是不是在合适的时间、合适的地点,办了合适的事情,我们关注的是什么时间、什么地点人办了什么事,说了什么话。所以今天基于车联网这个空间,人和人怎么有一个更好的交互体验?我们也希望通过我们的努力能够为地理信息整个平台带来一些新的交互应用。我们认为在这样的一个时代里,语音已经真的掉我们身边来了,各种各样的信息设备都具备能听会说的功能,比如手机、PAD、电视、车,语音合成能够达到90%以上的合成正确率,语音识别也能够达到真正的准确状态。在各种移动终端无线网络以及云计算平台逐渐成熟的条件下,为更好、更优秀的语音系统之上平台提供了支撑的条件。从讯飞角度来看更感觉到这样的时代到来,2012年我们发布了语音云,当时是为了能够像提供用电一样提供语音服务。第二次发布会就是今年在这里,我们发布了以生活为主的新一代语音产品。当场到场开发人员达到了2200人。从发布语音云到现在,目前已经积累了4800万语音用户,每天语音服务访问量达到290万次,现在第三方应用超过了4000个。
大家可以看到在地图导航这类,以及生活服务这一类,有非常多非常好的应用,地图导航目前主流的导航软件都在用讯飞的语音进行POI搜索,这样的客户积累已经超过了1200万。在这儿也是希望能把我们两个开放性的平台拿出来跟大家分享。其实它不能说完全开放,是在一定范围的开放。第一个平台就是我们的语音开发平台。第二个平台是应用,叫讯飞语点。讯飞在嵌入式、移动互联网和呼叫中心里都能够提供完整的合成、识别以及搜索的技术。我们移动互联网这块的能力以语音云为核心,呼叫中心这块业务是我们长期在IVR领域形成的系统,这样的系统可以支持本地POI转型和本地语音输入。今天我们重点拿移动互联网语音搜索来讲,首先看各项核心技术在语音合成方面不断的中英文的合成技术提高的同时,我们已经在多语种的语音里面进行了尝试性的进展
语音识别方面,首先在语音云规模应用基础上,我们核心效果是持续优化。针对抗噪、口音、个性化词汇这样的一些应用难题全部突破。这是我们在短信、微博、导航户外搜索、数值、数字方面的识别表现,基本上已经完全满足个性化的要求。在离线也就是我们所讲的嵌入式语音识别方面我们可以能够实现在嵌入式系统中,在安卓、iOS这样的状态下实现以往状态的语音识别。我们针对车载环境,在识别效果上进行了长时间的突破在准确性和抗噪性上有很大的突破。
我们是基于识别和合成的算法,根据语言学和语音学的结合,能够研发出一个自然的语音交互系统,这样的一套系统对接语音系统,它的引擎和原来是不一样的。我们可以就这样的一个分发体系把一句用户的话语分解成不同纬度的参数。比如用户问道了一个查询航班的信息,我们用一个输出可以输出一连串的语音网络和关健词,即使是短写错误,我们前面就可以把语义读完。
我们也可以提供其他的核心技术,这些核心技术有核心引擎和语音应用。
谈到第二个平台是讯飞雨点,我们去年11月份发布了汽车语点,今年3月份发布了电信语点。与此同时,我们把语言通信这样的一个用户身份的属性的承载物分成三个平台,在这个之上用户可以用一个语音号码进行穿行。
训4讯飞手机语点目前具备20个功能,大家可以在安卓平台上下载使用。这是我们的汽车语点,是与汽车系统深度结合的车载应用。我们的目标是让它在行车的环境之下,让人能够感觉到用便利的信息使人获得更高的娱乐性。
汽车雨点系统,无论是天气、路况、加油站、停车场,都可以一语到位,直接搜索。第二个是自然的语音交互界面,我们可以抛弃掉原来数字的交互式的方式,让我们和机器用自然的语音交互。
第三个就是云加端的架构,云加端指的是如果网络好的时候,用户可以用语音引擎,如果网络部好我们有本地引擎,仍然可以帮助用户用自然的方式跟系统对话。这就是ONE SHOT,用户在输入一句话的时候,这句话里可能隐藏着很多关键信息,可能包括导航、打电话,不用人和车载进行原始的命令词的递进式,它相盒子,我们打开一个盒子里面有一个小盒子,打开最后一个小盒子才发现这个东西,我们把所有的东西放到一个平台之上,用户只要说一句话就能把他想要的东西获取出来,我们叫ONE SHOT。这种方式也是我们从用户体验角度出发抛弃掉了原来所谓的GOI和VOI的深度结合。用户是在这个界面里产生内容,我们把所有的VOI和GOI切开,用户想说什么直接对它讲,然后调出相应的应用应答用户下一步的操作。
讯飞机五语点宣传效果界面目前这的系统已经可以在后端的车体厂商里使用了。车载方向我们正在跟地图厂商联手,目前已经有1200万的用户。去年7月份我们跟上汽联合发布,重新定义了车载语音应用很航标,今年我们会跟几个领军汽车企业合作,推出后端的车载产品。
第三个语点产品是电视语点。这个产品是针对电视的语言交互体验环境去量身打造的。是由一个语音交互系统和语音摇控器构成。这是长虹发布的一个带有语音交互系统平台的智能电视,这个系统中打造了虚拟化形象,核心功能上完全跟语点同步。这是海信,它采用了语音的核心技术,并且配备了一个非常枪弹的摇控器。第二个是创维、还有康佳。
目前在电视这个行业我们已经和国内所有主流的厂商建立了合作关系,最后说一下科大讯飞,我们是中文语音产业里唯一的国家863计划成果产业化基地,国家规划布局内重点软件企业和唯一的语音上市公司。我们也是国家科技技术奖和科技信息重大发明奖的单位。去年9月份由国家发改委颁发语音及信息处理工程实验室,另外也获得多次国内外奖项。对于我们来讲,我们更希望可以做到的核心技术和体验能够伴随大家在地理信息应用开发方面及车联网的应用开发方面能够打造更好的消费体验。谢谢大家!
(以上内容根据速记整理,未经本人审核)
{{item.content}}