您的位置首页 > 数码极客

绿幕通通扔掉 ੧ᐛ੭ | 谷歌AI实时「抠」背景

鲁达发布于 2023-07-15

原作 Valentin Bazarevsky & Andrei Tkachenka
Root 编译自 Google Research Blog
量子位报道 | 公众号 QbitAI

大场面的科幻动作片，拍摄过程肯定离不开绿幕。

制作过程更加磨人。

抠绿+后期要做到完美（空间位置关系、光影关系），不仅要求细心，还得堆大量时间。

为了让影视制作简单点，谷歌研发出了可以在手机端就实时抠背景的工具（暂时没名儿）。

这个实时抠背景的工具目前只出到Beta版，只在YouTube移动端上有。

谷歌小哥哥戏精附体(´• ᵕ •`)*

这个技术，是用CNN（卷积神经网络）实现的。

这个神经网络框架，专为移动端设计。所以，在构建和训练的过程中，谷歌给自己定了一些原则：

移动端的解决方案一定要足够轻量，跑起来至少要比现有的最厉害的抠图模型快个十倍，要30倍就更理想了；
为了最好的实时呈现效果，这个模型出的片必须达到30FPS（帧/秒）。

这个抠背景的模型，帧数的处理得很讲究。

帧数不能太多，不然费算力，也无法及时出图；但也不能太少，否则看起来卡顿。

数据集

为了训练这个模型，谷歌标注了成千上万个图像。

前景标出头发、眉毛、皮肤、眼镜、鼻孔、嘴唇等。

神经网络的输入

谷歌的分离模型，是通过RGB通道计算出视频源每帧的前景。

关键抠出来的前景前后两帧之间要连贯。

现在的方法是用LSTM和GRU，对算力要求太高了，要用在移动端实时出片上不太现实。

LSTM，长短期记忆算法，是一种时间递归神经网络。GRU，门控循环单元。

LSTM搭GRU，可以通过门控机制使循环神经网络，做到记忆过去的信息，同时还能选择性地忘记一些不重要的信息而对长时间跨度的信息的前后关系进行建模。

谷歌想到的解决办法是，把上一帧已经算出来的蒙版（挡住背景用的）当作下一帧的第四个通道的信息。这样，就能节省算力，拿到的片子视觉上还满足连贯介个要求。

训练流程：原始帧（左）；被分离成三个通道加上一帧的蒙版通道（中）；根据这四个通道信息预测出这一帧的蒙

视频里抠背景，如果镜头里前景物体剧变，比方说突然多了个人，前后帧的去背景效果就不连续了。

为了避免这个问题，保持视频的流畅性，谷歌稍微改了一下标注的规则：

训练模型先空杯（不把上一帧的蒙版当成已知的信息），判断出新闯进来的物体；
然后定义新进入物体以外的背景蒙版，小改动的话就调整上帧蒙版，大改动的话就抛弃上帧蒙版；
对当前帧做羽化处理，优化抠图后的毛边，模仿镜头在快速移动或旋转时候的情境。

小姐姐在试实时的抠图效果

经过调整，谷歌训练的模型表现炒鸡好，在iPhone7上能实时出100多FPS的片，谷歌的Pixel2出40多FPS的高清片。

拿YouTube上stories频道上的片试了试，抠背景效果都很流畅。抠图效果也很棒棒，在验证数据集上实现了94.8%的IOU（交叠率，在这里就是抠背景效果贴不贴合）。

谷歌短期内想实现的目标是，用YouTube上stories频道上的片子来测试优化这个抠背景技术。最后能成熟地用于未来的AR服务上。

最后，附编译来源，

— 完 —

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

责任编辑: 鲁达

1.内容基于多重复合算法人工智能语言模型创作，旨在以深度学习研究为目的传播信息知识，内容观点与本网站无关，反馈举报请点击此处；
2.仅供读者参考，本网站未对该内容进行证实，对其原创性、真实性、完整性、及时性不作任何保证;
3.本站属于非营利性站点无毒无广告，请读者放心使用！

“扣绿如何更快”边界阅读

佳能100d如何延时曝光佳能100d曝光度怎么调!

佳能100d如何延时曝光,佳能100d曝光度怎么调,佳能100d有多重曝光吗相关介绍,佳能EOS单反相机拥有出色的画质、强大的性能，是很多摄影爱好者器材装备的第一选择。今天我们就给大家详细介绍一下，目前市场上销售的EOS单反相机，这些相机从满足摄影初哥的入门级产品，一直到发烧友钟爱的全

〈国际飞机票如何取〉儿童如何取飞机票!

国际飞机票如何取,儿童如何取飞机票,网上订飞机票如何取相关介绍,概述现在出行坐飞机越来越多，也越来越方便快捷。很多人都是在网上进行订票，然后到达机场之后才进行换取登机牌。为了节省用户时间和提高乘机体验，机场配有自助办理值机的机器，乘客可以自行进行取票以及选择座位

“故障灯check如何处理“沃尔沃check故障灯图解…

故障灯check如何处理,沃尔沃check故障灯图解,check故障灯亮处理案例相关介绍,保养真经黄少伟当“检查引擎”（Check Engine）的灯亮起时，多数人对车子到底出了什么问题可能没有头绪。汽车仪表盘上的“检查引擎”信号是让车主控制汽车问题，延长汽车寿命的一种方式，能对汽车出

〈风暴英雄如何举报队友〉风暴英雄掉线队友跟随

风暴英雄如何举报队友,风暴英雄掉线队友跟随,风暴英雄gemini队友相关介绍,MOBA类游戏在对抗中不免出现甩锅、骂人、喷队友的行为，不和谐的聊天氛围十分影响玩家的游戏体验。暴雪为改善《风暴英雄》的游戏环境，开展了名为“文明游戏，公平游戏”的活动，以及告知玩家通过那些方式处理这

电脑如何管理iphone的照片图库——电脑如何查看iphone全部照片!

电脑如何管理iphone的照片图库,电脑如何查看iphone全部照片,如何用电脑管理iphone照片相关介绍,需求在Windows 10 系统上同步查看手机的照片是常有的需求，电脑仍是主流的生产力工具。对于Android手机，因Android接口的开放性，使用Windows 10自带的your Phone

电脑如何管理iphone的照片图库电脑如何读取iphone照片

电脑如何管理iphone的照片图库,电脑如何读取iphone照片,如何用电脑管理iphone照片相关介绍,问题：如何识别真假iPhone和翻新机？答案：微信公众号：果粉之家回复10有详细教程很多朋友在拍完照片后，会将手机连电脑，在电脑上面慢慢欣赏美照，可是当你iPhone连上电脑打开文件夹的时候是不是

电脑如何管理iphone的照片图库iphone照片如何传到电脑…

电脑如何管理iphone的照片图库,iphone照片如何传到电脑,如何用电脑管理iphone照片相关介绍,IT之家讯 10月24日消息，苹果今天正式发布了最新版iCloud for Windows，新增对于iCloud照片图库和Apple ID两步验证机制的支持，在此之前，Windows用户只能通过网页端

〈电脑如何安装优麒麟〉国产麒麟电脑怎么安装QQ

电脑如何安装优麒麟,国产麒麟电脑怎么安装QQ,电脑如何安装麒麟系统相关介绍,如何在已安装有Win10的电脑上安装优麒麟系统呢？通过双系统并行，可以在需要时有选择性的使用Win10或优麒麟系统。下面就是具体的实现方法。 1、首先，我们先在电脑上安装Win10操作系统。之后则需要

《