您的位置 首页 > 数码极客

【jpg是什么意思】你知道你的大脑有多爱“.JPG”和“.AVI”吗?

我看见他戴着黑色的布帽子,穿着黑色的布马褂,穿着深蓝色的棉衣,蹒跚地伸到铁路边上,慢慢地探着身子。没那么难。

可是他穿过铁道,要爬上那边月台,就不容易了。他用两手攀着上面,两脚再向上缩;他肥胖的身子向左微倾,显出努力的样子。

朱自清《背影》中的父亲很感人。闭上眼,我的脑海里都可以浮现出这个画面。

这说明:当我们的视觉看到一幅画面,大脑不仅会思考画面本身,还会试图理解背后的意义。

你知道你的大脑有多爱“.JPG”和“.AVI”吗

——专访北大可视化专家袁晓如

文|史中

我站在世界的中央,眼睛每时每刻都要接受无数种类的信息,其中可能包括:图像信息、文字信息、数据信息,等等。

其中,图像信息在我们认识世界的过程中起了超乎想象的作用。知乎作者陈达曾经举了个栗子:

我给你报出某个正妹的脸部及身体各部分各器官的精确参数——RGB颜色值啊三维坐标啊长宽高啊之类——让你左右互搏,你能边看这些数字边左右互搏吗?

答案是否定的,我需要一张图片,哪怕打着马赛克。

注意到这个事实之后,我有点不能正视自己了。我回想起自己看到“.JPG”和“.AVI”的时候,内心荷尔蒙不可抑制地喷涌而出的感觉。我很想知道,为什么我们对图像有这么强的感觉呢?

于是我找到了几个数据:

目前科学界公认的数据表明,观看物体时,人能清晰看清视场区域对应的分辨率为2169 X 1213。

再算上上下左右比较模糊的区域,人眼分辨率是6000 X 4000。

索尼7680×4320超高清晰分辨率的18分钟未经压缩的超高清视频大小为3.5TB,换算一下平均每分钟194GB。按照这个数据量算的话,每分钟经过人眼的数据量约为140.34GB。也就是说,平均打一个小时的XBOX360,将有8420.4GB的数据被传导到大脑。这些数据如果刻成蓝光光碟,需要337张!

这说明,我们的眼睛带宽已经超越了这个世界上最好的高清摄像头。如果把人眼想象成一个高清摄像头,这个摄像头的总线带宽为2.339GB/秒,换算为更形象的网卡速率,应该为19161M网卡。

在我的经验里,打 XBOX 从来没有让我的大脑死机。也就是说如此大量的视觉数据,我们的大脑处理起来没有任何困难;但是,8420G的数据量,哪怕用十进制数据的方式传给大脑,也是一个天文数字,接收几行估计就懵X了。

不幸的是,很多人,尤其是科学家、研究者或者企业BOSS、政府领导,每天面对的可能不是各种妹子图,而正是密密麻麻的数据。

那么问题来了,怎么把这些看了想狗带的数据,“翻译”成像 Teacher苍 一样喜闻乐见的图像呢?

其实,这是一门了不起的科学,名为:可视化。

作为一个“万能的史中”,我找到了北京大学可视化与可视分析专家,袁晓如老师。他也是中国可视化与可视分析大会 ChinaVis 的发起人。他告诉我,其实“自古以来”人们就在不断研究这种把数字变成图像的魔法。

【袁晓如】

可视化的先驱们

看看这两张图,是不是挺熟悉。

现在看起来熟悉,但当这两张图刚出现的时候,可是惊为天人。因为它们是世界上最早的饼图和柱状图。

发明出他们的人叫做 William Playfair。WIKI 百科上面说,他曾当过:造水车木匠、工程师、绘图员、会计、发明家、银匠、商人、投资经纪人、经济学家、统计学家、小册子作者、翻译家、出版人、投机者、罪犯、银行家、热心的保皇党人、编辑、敲诈者、记者。

目测他的简历可能比字典都厚。就是这个人,发明了统计制图法,这应该是历史上最早的可视化操作。

不久之后,世界上又出了一位可视化先驱:南丁格尔。

没错,就是那个著名的护士。

在克里米亚战争期间,南丁格尔通过搜集数据,发现很多死亡原因并非是“战死沙场”,而是因为在战场外感染了疾病,或是在战场上受伤,却没有得到适当的护理而致死。为了解释这个原因,并降低英国士兵的死亡率,她绘制了这个著名的图表。

【南丁格尔绘制的伤员死亡率图】

1858年,这张图表被汇报到了维多利亚女王手中。40岁的女王不需要特别学习,一眼就看懂了南丁格尔想说什么。一个切角是一个月,其中面积最大的蓝色块,代表着因为本可预防的疾病而死去的战士数量。

说到可视化,还有一张最著名的图表:

【拿破仑行军图】

它被称为《拿破仑行军图》。这张图表描绘了拿破仑的军队自离开波兰-俄罗斯边界后,军力损失的状况。在一张图中,通过两个维度,呈现了六种资料:拿破仑军队的人数、行军距离、温度、经纬度、移动方向、以及时间和地域的关系。

以上这些,是在“前计算机时代”流行的可视化图表。

而在计算机时代,可视化可以做到的事情就更多了。

北大毕业的袁晓如,在美国明尼苏达大学读取了博士,从2001年就开始研究可视化。它所代表的一批科学家,是中国可视化研究的创建者。

他把可视化分为三个主要方向:

科学可视化、信息可视化和可视分析

科学可视化

比如下面这张图:

【三维体数据】

这就是在上世纪末袁晓如带领团队所做的科学可视化项目。

显然,这个系统描绘了人的手部骨骼,他的数据来源是CT。简单来说,就是把扫描到的一片片数据堆叠成为一个体,也就是:三维体数据。

这样的工作听起来简单:把这些 CT 叠在一起不就行了吗?

袁晓如说,并不能这样理解——如果只是对应一套 CT 数据,那么就失去了科研的意义。他们创造的是一个“传递函数”系统,要保证任何一套 CT 数据都可以通过算法,实时生成一个三维图像,还要保证根据不同的骨骼密度和血管性质,用颜色明确地区分出来。这涉及到一个复杂的实时计算模型。

这些点在平面上被称为像素,到了三维空间中就被称为体素。仅仅从计算量来看,如果每个边长是256体素(这个分辨率已经很低了),那么总体就是256×256×256=16777216个体素。这对于90年代的计算机来说,是个“重体力活”。当然,随着计算机算力的增长,人们对于“三维体数据”的可视化要求也变高了,达到了单边1000体素甚至更高,这就是十亿的总量。

随着科学家们不断解锁新的姿势,科学可视化也可以展现更复杂的世界。

比如下面这个:

这张图展示了台风各个部位的气流特征,很多组参数被同时展示在了“平行坐标”中。通过这个可视化模型,科学家寻找到影响台风总体性质的关键节点,在图中标注出来。

讲真,气象一直是最消耗资源的一项研究。不同的科学家都提出过不同的数学模型来计算某个气旋的“走位”。但是根据不同模型计算出来的结果,到底差异在哪里,差异又有多大呢?面对一堆数字,科学家们也没有很好的办法进行比对。

没错,又该轮到可视化工具出场了。袁晓如和团队做了一套可视化系统,可以根据不同的模拟方法,绘制出某个气旋不同的走向,然后集合在同一张图中。

在这张图里,所有的计算模型计算出的结果一目了然。在下面的图表中,反映了不同计算方法随着时间的推移,拟合程度也在发生变化。

说了这么多,感觉可视化的技术似乎只有高级的科学家才能用到,作为幼儿园毕业之后就放弃科学家梦想的我来说,好像遭到了赤裸裸的鄙视。

袁晓如说,其实真相并不是这样。科学可视化其实只是可视化技术的一部分。在很多更加普及的领域,信息可视化会发挥很大的作用。

信息可视化

举个栗子,北上广深的童鞋们喜闻乐见的自然现象:堵车。

交通部门可以采集不同路段的交通数据,然后通过可视化的方法把这些信息呈现在地图上。

这样,随着时间的推移,拥堵点的变化就非常明确地展现在地图上。具体到最堵的地点,如果有足够的数据,可视化系统又可以展现出在细节上拥堵究竟是如何发生的。当拥堵再现于屏幕,我们就像俯瞰生灵的上帝。

比如这张图:

点H最早发生拥堵,然后迅速传导到I和J,随后点D拥堵,传导到了G和E,最终E点在双重压力下,堵车非常严重。

这是最典型的信息可视化,普通人也可以从有趣的图形中得出自己的结论。

然而,交通拥堵的问题之复杂,可视化系统也许无法解决。不过说到底,解决问题的第一步,还是应该知道问题出在哪里。

我们每天一睁眼就扎进忙忙的人海里,对于城市来说,无时无刻不沸腾着各种大数据。

信息可视化,正是让你“看见”大数据的一个方法。

比如这个:

针对伪基站活动范围的可视化系统。

一般来说,有一种人叫做背包客,他会背着一套高功率的短信发射系统,沿着大街小巷游荡。向无辜群众发送诈骗短信。

这些诈骗短信的数据来源于用户向360的举报。根据不同时间段用户的举报,结合用户在收到诈骗信息之前的位置,就可以定位出伪基站背包客的运行轨迹。

可视分析

当然,对于普通人来说,可视化还有更多有趣的玩法。例如你不满足于仅仅看到数据呈现在眼前,你想知道这个世界上正在发生什么。

例如,一个微博是怎样传播的。

【微博地图,显示微博主题之间的关联】

从这个图里,可以看到一个微博究竟是怎样从一个点开始爆发,究竟被哪些人转发,转发的深度和层级如何。

另外,袁晓如还带领团队开发了一种大家喜闻乐见的“玩法”:根据豆瓣电影上的关系链来搜寻你可能感兴趣的电影。

例如搜索《X战警》,就会出现相关的电影,你继续选择喜欢的电影,还会出现更多风格类似的电影。

【从《X战警》引发出的关联电影】

(如果你也想试试,可以留言索要网址)

总之,可视分析的意思是,从某种特定的数据结构里,根据你的需要,提取出你需要的数据维度。

“挑食”的大脑

袁晓如老师说,无论是科学可视化、信息可视化还是可视分析,从根本上来说,都是把数据映射成图像的工具,最终目的只有一个:借助我们的大脑,来归纳得出未知的规律。

数据—图像—大脑—规律

我们发明了计算机,甚至制造了人工智能,但机器更擅长在已有的规律下处理事物,而人擅长的是结合背景知识,在信息量很小的情况下发现规律。

有一件事让我觉得有趣又伤感:

面对无数堡垒后面隐藏的世界的真相,我们最可依赖的武器还只有大脑。

而这个大脑,却有点“挑食”。

从生物进化的角度来说,我们的大脑只是人类的生存机器。周遭环境发生了微小的变化,都会引起我们的警觉,而一旦加入稍微复杂的逻辑判断和数据运算,我们就要死机。

为了让我们的大脑有更舒服的姿势探索世界,科学大牛们只好把数据变成可视化图像。但是,由于对人脑的运作机制知之甚少,所以可视化大牛们只能靠“手感”来设计映射方式,然后再在实际应用中验证这些方法的优劣。

至于怎样才能精准地设计出让人类一看就双眼放光的可视化系统,袁晓如老师说,别急,也许只能等脑科学和认知科学进一步发展。。。

【可视化系统中,成都地铁人流量在中午时分的变化】

在现有的技术条件下,做出让普通人能够有感觉的可视化系统并不是没有可能,而是难度更高。

袁晓如本人虽然是一个学霸,但他却一直致力于构建一套广泛适用的“可视化系统生成理论”,让不同知识背景的人都能方便地从可视化系统里创造价值。

于是,他要解决一个巨大的问题——速度。

一个可视化系统在“数据-图像映射”方面做得越透彻,作为工具就越好用。但是相应地,耗时也会非常长。

他举了一个例子,在某些军事场合,或者抗震救灾、抢救危急病人的场景,需要立刻马上进行数据分析,刻不容缓。在这种情况下,如果靠科学家们手工打磨一套可视化系统,等送到前线的时候,可能黄花菜都凉了。

时间不等人,这种情况下,必须有简单灵活的方式快速构建一个可视化系统,也许不是那么精巧,但是却可以大大提高人决策的效率。

结语

“勾股定理”,也许是这个世界上最古老的谜语之一。

纯数学的方法,普通人终其一生也未必可以理解,但是只要在三边之外加上辅助线,用几何的方式来观察,很多人就会恍然大悟,得证涅槃。

让无数数学家成为折翼天使的“费马大定理”,同样是在“谷山-志村猜想”下,把其中的一段证明变换成与几何相关的椭圆曲线,才得以证明。此时距离费马大定理提出已经过去了300多年。

而就在最近几十年,借助可视化系统,人们已经在核能和军事方面取得了重大的突破。直到访谈结束,我才意识到这些绚烂的图形背后,牵动着物理世界的每一根神经。

面对世界,我们几乎一无所知。我们甚至对自己创造出的人工智能神经网络的具体工作流程都不清楚。

可视化技术同样可以探查我们亲手制造的人工智能。

袁晓如说:

纵然机器学习可以解决很多问题,但是大多都是输入数据,输出结果。中间的运作过程是黑盒子。其实,我们面对的所有未知,都可以说是一个黑盒子。而作为人,我们恰好天生就想知道所有黑盒子里的秘密。有一句话,叫做:open the black box。打开黑盒子。

说到这里他笑了。

我想,这或许就是可视化技术的动人之处。

注:本文部分图片来自北京大学可视化与可视分析研究组。另外,袁晓如会在2017年9月12日举行的ISC中国互联网安全大会上,分享他的最新研究。

关于作者: admin

无忧经验小编鲁达,内容侵删请Email至wohenlihai#qq.com(#改为@)

热门推荐