您的位置 首页 > 数码极客

【vivo输入法突然变了】飞行输入机山红背后:语音输入应用场景限制

本报记者张根深圳报道

徐佳玮在锤子手机发布会现场看到老罗的语音输入演示后,立即下载了即时通讯软件输入机。“(语音)识别精度很高,现在成为了忠实的用户。”徐家伟对记者说,21世纪经济报道。

锤子科技CEO罗永浩的手机发布会出人意料地红色吹捧了KODAI的输入机——,除了现场热烈的掌声外,一夜之间还伴随着社交媒体的无数溢美之词和敬碳利。(威廉莎士比亚、斯图尔特、STARART)在AppStore迅速跃升至工具列表第三位,成为排名最高的第三方输入法(International Foundation)。根据百度搜索指数,最近关键词“信使输入法”搜索量大幅增加,7日搜索指数比凌飞增加了139%。

事实上,语音识别技术近年来发展迅速,新的“输入法红”新闻新闻在2010年初投放市场,目前主流输入法也支持语音输入,接近新闻纸的准确性,语音输入不是所谓的“黑科技”。

“第一次知道了讯飞输入法,感到羞愧,第一次知道现在语音输入已经发展到了97%的准确度”,作为产品经理,徐家伟感慨道:“好的产品可能埋在人群中不为人知。”

为什么“好的产品会被埋没”?易观智库终端入口分析师周大林向21世纪经济报道记者指出,目前百度、sungueu等各家的语音输入基本达到实用水平,用户中知名度低的主要受固有使用习惯、当前用户体验和应用场景的局限性影响。

“网红”输入法

北京时间2010年6月8日凌晨,iphone史上最重的产品之一iphone 4发布。那天晚上,HKUST和几个年轻人讨论了IPHON 4,认为IPHON基于触摸屏的全键盘输入屏幕太小,体验不好。集思广益后,他们决定将科大讯飞的语音技术融入输入。

2010年10月28日,科大发布了第一版语音输入法,这也是第一款支持语音输入的输入法。

科大信成立于1999年,由中国科技大学“人类语音通信研究所”发起,由27岁的刘庆峰和17名师生姐妹共同创办。

作为国内语音技术供应商,从汉语语音合成技术到多语音合成技术、语音识别、语音理解、智能问答等,科大讯飞已经是国内主要语音技术供应商。中国语音产业联盟数据显示,2015年,Koday在国内市场占据了44%的份额,其次是百度的28%和苹果的7%。

记者了解到,目前除了锤子手机外,还在使用即时通讯语音技术,华为、小米、魅族、VIVO、OPPO等手机的内置输入法也在使用即时通讯开放平台提供的语音技术。

此外,值得注意的是科大讯飞智能会议系统。21世纪经济报道记者在Intel IDF峰会、第四届中国电子信息博览会等多个场合看到,该系统将嘉宾演讲语音实时转变为“上墙”。据悉,目前该系统主要应用于大型发布会、课程教育、电视节目直播等语音转换文字的时效性和准确性较高的场景。除了提供ToB服务外,该系统还为个人提供付费转战服务,价格约为99元5小时。

随着移动互联网的发展,2011年HKUST成立了移动互联事业部,依托智能语音交互平台“信使语音云”,与家电、机器人、手机等多领域企业合作,推进语音应用和硬件的结合。

公司2016年半年报显示,截至2016年6月31日,讯飞开放平台的用户总数达到8.1亿人,月活跃用户达到2.36亿人(同比增长157%),开发者达到16万人(同比增长228%)。讯飞输入法用户达3.6亿人,活跃用户超过1亿人,输入法语音用户的日覆盖率达到12%(同比增长50%)。

根据Research and Markets公布的《全球及中国语音产业报告(2015-2020)》数据,世界上最大的语音识别技术公司Nuance仍占有30%的市长/市场份额,但出现了下降趋势。谷歌、微软、苹果和科大讯飞在世界上的市长/市场份额分别增长到20.7%、13.4%、12.9%和6.7%。

应用场景限制

语音智能是人工智能领域最成熟的技术之一,产业化正在加快。被称为“互联网女王”的玛丽米克在《2016年互联网趋势》中指出,人机交互方式正在被语音输入和汽车改变。她相信,由于速度快、操作简单、个性化、不需要手,计算界面正在从键盘演变成麦克风键盘,语音界面将成为快速增长的下一个市场。

但是随着技术的发展和成熟,用户教育是一个漫长的过程。但是,由于语音输入主流应用场景和杀手级应用程序的不足,目前很难培养用户使用习惯,用户对相关产品的了解很少。

根据赛诺的《2016年Q3语音输入法行业分析报告》数据,在语音输入机使用场景分布中,即时消息是语音输入最常用的应用程序,占94%。在具体场景中,“聊天对象太多,不能打字”的比例为65%,“输入很多”的比例为35%。“手不舒服”占19%。

周大林指出,必须以新的交互方式在允许语音输入的环境中进行,其次方言、地名的识别准确性问题给用户留下阴影,影响用户的体验。

HKUST新闻方面向21世纪经济报道记者解释说,在语音输入时极短的时间内,输入法语音识别系统经历了非常复杂的分析过程,很多时候语音识别容易出现问题。例如,发音人对“口音差异”的适应,需要通过大量的数据适应训练,使语音识别系统熟悉别人的发音。事实上,在环境噪音干扰、语音输入过程中,机器很难区分人类的声音和环境噪音,所有声音都很容易识别。也是网络因素。在线语音识别需要通过网络从服务器端和客户端传输数据,网络质量差或传输不稳定往往会导致语音识别变慢,效果差。这些都成了妨碍语音识别的泛化。

及的因素。而讯飞方面也指出这是讯飞的语音输入相对国内其他厂商更为深入的地方。

朱大林认为,目前来看,有三类场景可以拓展,首先是商务办公领域,除了发微信、短信,还可以用于邮件书写;其次是出行领域,比如车载控制和对话;再者服务体系中,重复服务或大或小可被简化或替代。

讯飞输入法产品总监翟吉博指出,在市场教育和用户习惯培养方面,可以从大家比较熟悉的,比如用微信发语音的场景,让大众明白通过语音输入文字和直接发语音的区别;另外,在产品和技术本身,在个性化方面有很大的发展空间,未来的语音输入可以为每个人量身打造,通过个人账号实现通讯录人名和定制词库的个性化识别。另外,他还表示,基于手机这种触屏为主的设备,语音不会是完全主流的,在下一个万物互联和VR设备流行的时代,语音技术的春天会真正到来。(编辑:包芳鸣)

关于作者: luda

无忧经验小编鲁达,内容侵删请Email至wohenlihai#qq.com(#改为@)

热门推荐