研究人员发现,人工智能捕捉到了意外线索,学会了区分原始图像和反射像。
据美国“优睿科”网站7月2日消息称,美国康奈尔大学的研究人员在“2020年计算机视觉和模式识别会议”中公布了“手性视觉”(Visual Chirality)的相关研究成果。
他们开发的算法可以通过捕捉头发、视线方向和胡子等意想不到的细节区分原图与反射图。该发现对于训练机器学习模型和检测伪造图像具有巨大的启示意义。
论文作者、计算机科学副教授Noah Snavely介绍道:“宇宙中的万事万物是不对称的。如果你翻转一个图像,那么肯定会有不同之处。我对收集信息的新方法研究很感兴趣。”
Snavely表示,对于人工智能来说,区分原始图像和反射像是一项很简单的任务。一般来说,一套基本的深度学习算法就能快速学习如何识别图像是否被翻转,并进行分类,精确率高达60%至90%。对于AI捕捉到的许多线索来说,人类是很难能注意到的。
在这项研究中,该团队开发了一项技术来创建一幅热图,并指出图像中哪些部分是算法感兴趣的内容,以便了解算法是如何做出这类决定的。
不出所料,他们发现,AI最常用的线索是文本,在每一种书面语言中,文本倒置都是最明显的不同之处。
为了获取更多信息,他们将带有文本的图像从数据集中删除,由此发现模型集中关注的另一组特征包括手表、衬衫纽扣、脸和手机方向以及其他跟惯用右手习惯相关的因素。
Snavely认为,检查反射像与原始图像的区别可以揭示机器学习中可能存在的偏差,而这些偏差可能导致不准确的结果。
他说:“这给计算机视觉领域带来了一个开放性问题——什么时候适合用翻转来增强数据集,什么时候不合适?我希望这能让人们更多地思考这些问题,并着手开发相关工具来理解它与算法偏差的联系。”
了解反射现象会如何改变原图像,也有助于使用人工智能来识别伪造或篡改的图像。这是一个在互联网上日益受到关注的问题。
Snavely 说:“如果你想鉴别某个图像的真伪,这可能就是一个可用于图像取证的新工具。”
编译:朱明逸 审稿:西莫 责编:雷鑫宇
期刊来源:“2020年计算机视觉与模式识别大会”会议论文
原文链接:
中文内容仅供参考,一切内容以英文原版为准。转载请注明来源。