多模态技术,正是打破单一感官的藩篱,让AI虚拟形象越来越像人类的秘密武器。在现实世界中,数据天然以多模态的形式存在,人类通过综合运用视觉、听觉、触觉、嗅觉等多种感官,来接触和理解大千世界。
为了探索实现通用人工智能的路径,人工智能从单模态走向多模态已是大势所趋。
以前,Siri等语音助手只有声音没有脸,搜索只能依靠输入文字,机器看不懂照片的深层含义。如今,借助多模态技术,AI实现了图像、视频、音频、语义文本等多维度资源的融合互补,不仅决策更加精准,还在行为和智商上更接近人类。
品牌代言是偶像型虚拟人最重要的商业变现手段。虚拟偶像AYAYI面世至今仅半年,就已经与娇兰、安慕希、保时捷等知名品牌合作。据统计,此前四年,全球范围内与虚拟人物相关的合作案例,已覆盖到100家奢侈品、时尚、美妆零售商。
虚拟人将真正实现与人类生活交织在一起。不论是在哪里虚拟人都在驱动着更为人性化的体验流程。因而,虚拟人的优点在于理解人类以提高效率,诸如自然语言处理这样的算法进展,将培养人类与机器分享生活的习惯变得更加自然和流畅,使得人机沟通中产生越来越多的有效信息。