您的位置 首页 > 数码极客

手机狼人杀如何变声

在我长达一分钟演技之后,我自信的结束了我的发言,然后我的后置位告诉我,我的发言...只有画面没有声音…

这是一个视频狼人杀用户的真实体验。对一个狼人杀用户来说,最致命的莫过于,一段逻辑缜密、演技超群的陈述,居然因为卡,没人听到。线上狼人杀,确切的说是视频狼人杀有哪些不为玩家所接受的。

1. 视频质量差、高延时

视频相较音频,对网络带宽要求高得多。以360P,帧率15的视频流为例,码率是500kpbs左右。纯音频,码率则是10kpbs左右。所以,一些玩家玩语音狼人杀无压力,但是玩视频狼人杀就卡成翔,或者有很高的延时。

另外,某些狼人杀集成的视频功能,在编解码处理、网络传输方面,缺乏弱网支持、抗丢包的策略,即使网络没那么差,开视频玩,依然爆卡,延时超高。这种情况下,本应是加分项的视频,反而成了减分项,甚至在玩家心目中直接变成不及格。

2. 声画不同步

表现为玩家听到的声音和看到的视频,口型对不上。这是由于音频流和视频流是分开编码、传输的,二者在传输中延时不一致,到终端用户设备上解码后播放出来,就体现为声画不同步。

3. 害羞

与陌生人视频,害羞,影响演技,影响发挥。这是一些只想专注用语音玩狼人杀,体验烧脑的玩家心声。

视频质量差的问题,得靠技术解决。视频的狼人杀,本质上是一个多人视频通话。多人视频通话比较容易存在的以下问题:

1. 高时延:根据ITU-TG.114标准,单向通话延时大于150ms就可受到通话连续性影响,一般情况下最大可容忍时延为400ms。大于这个时延,基本不可用。

2. 视频画面卡顿,甚至黑屏、绿屏、花屏

3. 声音有回声:用户能听到自己说话

4. 声音卡顿,丢失关键信息

5. 音质太差,甚至有噪音,导致听不清

6. 画面太模糊,完全看不清参与通话方的脸

7. 接通率低。本文开头玩家的体验,说话对方听不到,其实就是接通率的表现。玩家没有成功加入频道。

8. 可用度低。狼人杀这种爆款游戏,在晚上高峰期,通话并发数会瞬间攀上峰值。若架构上没有承载海量并发的能力,那会导致玩家的游戏体验极差,出现无法通话、通话卡顿的现象。

以上几种问题,本质上都可以归结为以下三类问题

1. 编解码相关

  • 糊,不清晰

  • 运动跳跃

2. 网络相关

  • 延时

  • 卡顿

3. 编解码和网络问题交叉相关

这些质量问题是怎么来的?▼

1. 海量架构高并发问题

爆款狼人杀在节假日、晚上会遇上流量高峰,此时公共互联网因为部分路由器可能过载,导致网络变慢。因为路由器有最大的处理能力上限,一旦超过上限,就不能处理,会造成丢包、拥塞。若遇上某主播直播狼人杀,到开播时间观众瞬间涌入,后台的压力会非常大。玩家的体验就是,晚高峰开启语音或视频成功率低、说话有延时或卡顿、声画不同步现象加剧。

2. 传输网络的问题

绝大多数的视频通话,是基于公共互联网传输的。然后公共互联网不是为了实时通信设计的。中国南北跨运营商的网络传输,电信到网通,移动网络信号不稳定,用户和路由器在不同的房间,用户的100m宽带是共享带宽,用网高峰期卡爆,等等。这些都会加剧丢包和延时。用户此时不会怪自己的网不好,因为聊QQ看视频都好好的,只会怪这款狼人杀不好。

要在这样一个公共互联网上传输音视频数据,却没有做任何网络传输策略优化的工作,基本的可用度是难以保证的。

3. 视频的源不一样

使用手机上的摄像头作为视频输入源,高端手机和低端手机由于手机性能的差异,会导致画质的清晰度有明显差异。

4. 编解码器不一样

视频通话会涉及到三个参数:帧率、分辨率和码率。

在码率一定的情况下,分辨率与清晰度成反比关系:分辨率越高,图像越不清晰;分辨率越低,图像越清晰。

在分辨率一定的情况下,码率与清晰度成正比关系,码率越高,图像越清晰;码率越低,图像越不清晰。

面向网络通信设计的编解码器,应该能做到自适应网络状况来调整码率。网络好,码率自动升高,保证更好的清晰度。网络差,码率自动降低,保证更好的流畅度。

声网实时游戏音视频SDK,能够解决以上问题:

1. 海量架构

声网从最初架构设计上就是面向海量高并发的,通过全球部署分配服务器、边缘服务器来就近接入用户,骨干网络拥塞、甚至故障时,通过智能路由自动避开,以此保证服务的高可用和海量并发承载能力。目前苹果应用商店社交榜第6名的狼人杀,以及近期火热发布的天黑狼人杀,都在使用声网的服务。

下图是游戏语音同时通话人数,图中显示是格林威治,加8就是北京时间。可以看出,一天中有两个高峰,分别在中午12点和晚上10点。高峰期的并发数是低谷期的10倍以上。正是因为声网有高并发的承载预案,才可以对应这样的海量并发。

2. 编解码

声网自有专利的编解码器,是适应公共互联网专利的编码,对抗传输信道不稳定。码率根据带宽自适应调整。音质能够达到44.1kHz超宽频音质,普通电话只有8kHz。玩家的体验就是,能够听清别人的发言,在音质优先模式下,能体验到别人在耳边说话的感受。视频能够支持720P超清画质,并且基于人眼视觉体验进行了质量优化。

3. 网络传输

声网在全球部署的虚拟通信网SD-RTN,专为实时传输设计。SD-RTN基于UDP协议,并进一步在全局网络上进行优化,避免了TCP的延迟不可控缺点,保证交互的实时性。网络组织形式上,SD-RTN网络基于自定义路由,选择最优传输路径,直接将内容传输到对端。SD-RNT网络能够大大降低数据传输延迟,做到百毫秒的延迟。并且SD-RNT网络抗丢包能力强,针对用户不同的网络环境,采用不同的策略和模型,保证在30%丢包时,还能满足业务需求。

4.高可用

声网通过架构上、网络传输策略上以及7x24的QoE质量服务,能够保证服务可用度达99.99% ,连通率达到99.9%。

以上4点是保证质量和可用度,这是原则性问题,直接决定以后的游戏运营中,会不会导致实时语音和视频变成游戏的减分项。接下来要说的就是,功能方面的指标,这些是加分项,锦上添花的功能。

狼人杀视频,虽然本质上是多人视频会议,但它与多人视频会议最大的区别在于,狼人杀视频还应兼顾游戏。在游戏中集成实时语音和视频,要对游戏本身体验的影响最小化。应该让玩家觉得,实时语音和视频是游戏的一部分,而不是游戏的一个插件。做不到这一点,会让玩家在游戏体验中,产生疏离感。最明显的一个例子是,某游戏中,玩家一说话,游戏就会卡一下,然后游戏音效就明显变小,说完了,游戏音效就突然变大。这是由于开启、关闭语音瞬间,CPU占用过高导致的。声网在游戏解决方案中,有一些面向游戏行业和玩家的独特解决方案。

1.最大程度减小对游戏本身的影响

开启、关闭实时语音和视频的瞬间,或者在通话的过程中,不会影响游戏音效,或产生杂音。更不会导致游戏卡掉或闪退。

2. SDK包体积大幅度缩小

Unity 3D、cocos平台的定制SDK,最小能达到1.5m。对于一个手游来说,安装包大小对游戏装机率影响至关重要。

3. 回声消除、噪声抑制

回声主要是由于机型适配不完全导致的。声网适配了5000多款机型,还在通过第四代回声消除技术不断的自动+人工的方式覆盖全机型。噪声抑制方面,给玩家的体验就是,在使用手机自带麦克风说话时,自动提取人声,抑制周围的噪音,让对端听得清。

4. 语音扩展功能

1)变声

玩家在进行实时语音时,可以使用变声功能,男声变女声,女声变男生,或者加入更多的声音角色,就像是视频滤镜一样,能够大大的提升趣味性。

2)语音识别

通过语音识别技术,将玩家的语音转化为可阅读文字。

3)支持即时语音消息

5. 视频扩展功能

1)滤镜、美颜,让玩家露脸时,也美美的。

2)动态贴纸,游戏内玩家发言,别人可通过动态贴纸送鲜花或扔鸡蛋。这能成为游戏平台重要的变现手段。

3)变脸,玩家视频时,可以通过人脸识别技术添加面具,让害羞的玩家也能无压力视频。

6. 游戏直播

一个SDK,一套API既能实现视频通话,也能实现视频直播,大大减轻开发工作量和难度。并且,直播中,还支持毫秒级延时的多人视频连麦和语音连麦。

在选择一个狼人杀视频方案时,首先应该考虑的是可用性,高质量、高可用,就好比水对生命而言,平白无奇到你都意识不到你需要它,但没有水万万不能。可用性直接决定了玩家体验和游戏的生死。声网的服务经受住了众多客户的检验,比如陌陌、手游狼人杀、贪吃蛇大作战、携程。

其次,还应考虑是否有丰富的扩展功能。声网所提供的丰富的扩展功能,能够帮助游戏厂商开拓更多趣味功能,形成差异化。最重要的是,这些趣味扩展功能,能够帮助厂商快速变现。高质量投资潮来得快,去得快的时代,有什么比现金流更重要的呢?

责任编辑: 鲁达

1.内容基于多重复合算法人工智能语言模型创作,旨在以深度学习研究为目的传播信息知识,内容观点与本网站无关,反馈举报请
2.仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证;
3.本站属于非营利性站点无毒无广告,请读者放心使用!

“手机狼人杀如何变声”边界阅读