主持人(姜广智):同志们,我们现在开会。非常欢迎大家参加北京市信息化专家咨询委员会2017年高峰论坛。
首先,请允许我向大家介绍出席论坛的领导和嘉宾,他们是:
市信息化专家委专委会主任、中国工程院院士邬贺铨同志;
市信息化专家委委员、国家行政学院教授汪玉凯同志;
市信息化专家委委员、阿里巴巴集团技术副总裁、首席安全专家杜跃进同志;
中国人民银行数字货币研究所副所长狄刚同志;
市经济信息化委智慧城市建设处刘旭同志;
百度云首席数据科学家沈志勇同志;
北京摩拜科技有限公司副总裁崔书锋同志。
以上都是演讲嘉宾,此外,参加今天会议的还有:市信息化专家委委员、各区以及委办局分管信息化的领导和负责人。请允许我代表组委会向大家表示最热烈的欢迎!
下面,论坛正式开始。首先有请市信息化专家委主任、工信部原副部长杨学山同志,题目是围绕三加三目标,谱写信息化新篇。
杨学山:尊敬的各位领导、各位来宾:大家下午好。三加三是五个三,核心意思是我们在学习贯彻党的十九大精神的过程中,北京市的信息化既要重定位再出发。重定位再出发要考虑五方面的要素,这五方面我们都是用三来归纳,我们就变成了三加三。
刚才主持人说了,十九大精神对信息化的发展提出了新的任务,指出了新的方向,那么这都是我们下一阶段发展信息化必须遵循的内容,文件的精神我不想多说,因为大家都学得十分透彻了我们必须在学习贯彻十九大精神的基础上,北京市的信息化重定位,再出发,谱新篇。说这个话应该说,里面包含的含义是比较重的,什么意思?我们原来做的事情都要重新梳理,我们原来确定的目标方向任务都要重新梳理,要看看是不是和十九大提出的精神一致,是不是和十九大提出的方向目标一致,如果不一致的话,我们就要改,就要变,就要重新定。所以最后一个三实际上是讲讲北京市的信息化规划要重新制定。
先讲第一个三。第一个三在说一件事情,信息化不是为自己,信息化是为了北京市的确定的核心的任务,北京市确定的发展方向。也就是说,我们再不能为信息化而信息化,信息化所做的所有工作都要围绕北京市确定的这三个最主要的方向,最主要的目标,就是首善。第二是四个中心。第三个是四个服务。北京市是首善之区,这意味着信息化有两个要求,一个是为首善之区服务,第二个是北京市的信息化要成为全国的标杆。因为北京发展是首善之区,所以信息化一定是标杆,这个位置是明确无疑的。北京的四个中心十分确定了,四个服务也清晰了,为什么规划必须重新做?原因就在这个地方,我们必须围绕三个核心方向去做。
第二个三是十九大确定了三个发展阶段,北京市信息化发展阶段的划分就是以这三个阶段为标准。即是到本世纪中叶,时间并不长,只有三十多年时间,北京的信息化到现在已经超过三十年的历史了,所以我们看过去看未来发展很快,我们需要按照这样的三个阶段来确定北京市信息化发展的阶段和阶段的目标。
第三个三是围绕北京市的三件大事,这也是北京市委已经确定的。第一是北京市的总体规划,一张蓝图干到底。所以我在我的记忆里边,北京市的总体规划批准以后,我们的信息化规划还没有调整。这一张蓝图干到底,那北京市信息化规划必须围绕总体规划。第二件事是疏解北京的非首都功能,京津冀协同发展。在今天北京市讨论智慧城市,只讲北京市,肯定和北京市确定的目标,确定的重点任务相背了,你只讲北京市的智慧城市已经不符合北京市确定的三件事里面的第二件事情。首都为核心的世界级城市群,北京和周边要一体化同城化,大量的事情都在智慧城市里面体现出来。当然,第三件事情是冬奥会,2022年的冬奥会,冬残奥会,北京市的信息化阶段性目标也得围绕这第三件事情去落实。
第四个三是信息化发展有三个最主要的特征。第一个特征是从技术的角度看,是数字化、网络化、智能化。从经济社会发展的角度看是信息技术和工业技术深度融合,整个发展形态都将在两个技术融合的平台上形成和发展,最后是信息化和经济社会发展,政府治理,全面的一体化。说不要两张皮,其实两张皮的现象依然十分严重。所以真正体会技术的融合和各种经济社会发展生活和治理各个方面的一体化,而不是两个东西。我们要的就是一个东西,不是两个东西。这是十分十分重要的事情。北京市的大数据,北京市的人工智能,北京市的物联网如果说在创新中心里面,那么我们可以说它是创新的一个重要内容,但是到了它的应用范畴,就再不能是大数据、物联网、人工智能一张皮,应该社会发展生活和治理另一张皮。
最后一个三是信息化发展抓住三件大事。第一个是信息化规划,我们要画一张可以干到底的蓝图。这个要求是十分十分高的。北京市的总体规划是可以干到底的蓝图,北京市的信息化如何成为一张干到本世纪中叶这样的一张蓝图。第二个是基础建设,大数据。大数据的建设刻不容缓,因为今天需要的,明天需要的,后天需要的这些数据,现在正在北京市的各项业务中,大规模的流失。所以你再不抓就继续流失下去,到抓的那天为止,所以叫刻不容缓。最后一件事是效果导向。做信息化的任何事情都是效果导向,这三件事稍微展开一下。
第一件事是规划,要有一张干到底的蓝图,这个绝不简单,坦白说,今天在中国所有的城市省区还没有一个信息化的蓝图可以看到本世纪中叶的,没有,一张都没有。所以画出这张蓝图确实是十分不容易的。在这里列了七个方面,每个方面都是极其复杂的。前瞻性,我们要看到本世纪中叶技术和社会发展形态究竟发生什么样的变化,究竟如何引导这样的变化,才是合理的可持续的。这个问题十分十分的严峻。要说简单吧,其中目的性可能最简单一点,为什么?因为刚才我前面说的三个三已经把目的确定了,首善之区、四个中心、四个服务,北京市的总体规划,三件大事,都把目的已经确定了,但难度在哪儿?难度就是如果以这些目的为目的,而不是以信息技术信息产业和信息化为目的,难度在这个地方。既要用信息技术,信息产业和信息技术应用来支撑,又不要以技术产业和应用本身为目的,这是难度所在。后面我就不想展开了。
当然,规划我们在这样的分析之后,我们要把北京市信息化的四梁八柱真正能规划出来,然后我们能执行下去,而不是撸起袖子就着干,一干就干出了毛病,再回过头来。
高质量的大数据这是目前在信息化各个环节中最滞后和最没有得到重视的一个领域。大家都会质疑我的话,说大数据这个大家那么重视,信息是资产资源,我们如此重视,所有的文件里面都会写着这样的内容,为什么是整个信息化要素中最落后的环节呢?这个确实是如此。我们只要认真地想一想,北京市的各项事务如果真正要为了优化,为了提高质量,我们所需要的数据究竟有没有,究竟有没有留下来。这个问题的回答就比较清楚了,北京市从政府到各个区县,到委办局,到企业,社区街道,你的所有的工作事务是不是把知识经验信息都留了下来。而这些信息实际上是今后不管你是管理型的,还是经营型的,还是社会服务型的都是这些领域走到本世纪中叶我们进入一个社会主义现代化强国,进入我们理想的城市生活的状态,是必须要的基础,这些我们…我反正基本的判断是80% 以上都在流失,没有收集起来。但是,光有一个个事务的留还不够,还要综合起来,那么这个综合不是说把北京市各个委办局的信息,我们这个北京市的信息资源中心是负责汇集的集体工作的,等把这些东西汇集起来就有了北京市的大数据,那是没有的。当我们十年以后回过头来看,我们今天能够从委办厅局得到的数据是如此粗糙,如此质量低,如此不能解决问题。在今天说这样的话,可能大家都感受不到,但是三十年之后回头看,今天北京市信息资源中心汇集到的各个委办局的数据对于北京市的现代化治理是如此的不足,如此的质量差。所以,我们真正需要认真的规划。
第三件事一定要效果导向。也就是说我们所有的事项都是围绕着北京市的总体规划三件大事以及首善之区,四个中心,四个服务为它的目标做出扎实的贡献。每一件事,每一项工作都要如此。而且,这个效果一定是可测算的,而不是嘴巴上有作用,嘴巴上说没有就没有,一定是可测算可评价的。所以我们每一步都要有具体的数据来支撑它。那么要落实到所有的信息化的项目中,所有的信息化项目都要以效果为标杆。
好,今天的报告就到这里,感谢大家的耐心。
主持人:谢谢。下面请中国工程院院士、市信息化专委会主任邬贺铨来演讲,题目是:大数据看北京,新时代新使命。
邬贺铨:大家下午好。我们从数据来看一下,这是一个日本的财团给出的全世界的综合实力排名,是从六方面,我这里标出来的红线是北京,蓝线是上海,北京排到六、七,差不多十来位吧,比上海略微高一点,在去年上海还排在北京的前面,当然应该说,一路走来还是总体上在提升的,从2008年到2017年在提升,2012年当时最高。这是社科院今年10月份跟联合国共同发布的全球城市竞争力报告,绿色的是经济竞争力,黄线是可持续竞争力。全球排第一位的是纽约,经济竞争力的第二位是新加坡,深圳排到经济竞争力的第六。北京是第二十,广州第十五,上海第十四。北上广深里面北京是落后的。可持续竞争力北京是第十一名,都领先于上海、广州、深圳。
这个是世界级城市群的创新指数,全世界有六大城市群,最左边的是美国东北部的大西洋沿岸城市群,圈子里面的数据是指城市群里面全球排位的创新指出,纽约排第二,在东北部大西洋城市,波士顿第五,然后是华盛顿、费城。另外是北美五大群城市群,英国是伦敦,在全球第一。欧洲西北部的城市群是巴黎、阿姆斯特丹等。日本东京是全球第三,右边三个是中国的。上海是第三十二位,然后后面的长三角的一堆的城市群,像南京都排在二百二十三位了。珠三角的深圳第六十九,广州九十九。最右边的京津冀,北京第三十,中间没有,天津排第二百四十九位,京津冀的总体创新还是缺少更多的城市群的支撑的。
这是腾讯曾经给出的中国互联网+经济的城市排名。无论总排名还是基础排名、产业排名,双创排名北京第一。民生指数方面北京第三,落后于广州和深圳。
这是产业的细分领域。我们可以看到,这里有十大领域,红线是北京,北京基本上都排前面,但是在数字医疗方面北京落后于广州,在数字餐饮住宿方面,北京落后于上海。在数字生活服务方面,北京也落后于上海。
全国城市双创指数排行,北京基本上总分是领先的,绿色的。红线是能力,也是领先的。但是在活力方面北京市输给了深圳和上海。作为今年的创业先锋城市,腾讯今年11月份刚刚前不久发布的它从这么多维度,创业人才,创业思想,创业环境,创业资本来评价,北京也是领先的,第二位是上海,然后深圳、广州。有一项指标北京并不见得那么好,叫城市的年轻指数。实际上年轻人首选什么地方工作和创业?这里排的来看深圳第一,贵阳、郑州、苏州、武汉、长沙、南昌、海口都在北京前面,北京房价太贵了。所以年轻人首选创业城市不在北京。
这是互联网+经济指数。我们可以看到,在这里面,广东是遥遥领先,尤其是在产业方面,北京排第二位,其中北京智慧民生方面排位并不高,我们细分来看,民生刚才说了,北京第三,仅次于广州和深圳之后。这是数字产业的细分领域,刚才说过了十大领域里面的,这是今年三季度主要城市的平均可用的宽带下载速率上海第一18.41兆,北京第二18兆。这是宽带固网的,移动方面北京落后于好几个省,上海第一18.57兆,北京只有15.75兆,北京排在重庆、河南、山西、浙江、辽宁、福建、安徽的后面,北京的移动下载速率并不高。还有投资百强的角度,北京仍然是目前投资人选择的最主要的地方,然后是上海、深圳、广州。基本上是北上广深很多指标都排在一起的。
全国吸引投资的城市,这是吸引投资笔数,2014年到2016年北京第一,2017年北京仅次于上海。投资领域全行业和科研方面北京在前面,文化产业排前面,但是在金融业的投资上面北京是排第四。深圳、上海、天津在前面。房地产投资方面北京第二,上海第一。
这是中国城市2015年的城市政府的透明度,北京第二,仅次于上海。当然政府是公开,环保审批,依申请公开等,这是2015年。昨天发布的一个中国财政透明报告,北京的财政透明度达不到全国平均水平。北京的财政公开很多没有公开,刚才杨部长说我们还有很多数据,该公开的不公开,排在前面的是山东、甘肃等等。所以2015年好像政府信息公开,北京还处于比较好的位置,可是专门查财政的北京是达不到平均值的,比云南广西都要差。
这是拥堵情况,这是今年11月份发布的,北京在中国基本上排第四位。哈尔滨是比较堵,我出差哈尔滨问为什么堵,说长痛不如短痛,同时修路100多条。北京现在拥堵指数是1.92。这是北京二季度六环内的早高峰,中午,晚高峰。所以拥堵一直来讲还是没那么容易解决的。
这是从卫星观看的二氧化氮的数据,有2007年到2012年,京津冀地区基本上是全世界大气污染最严重的地区,人口密度是全世界平均10倍,煤耗的密度是全世界的30倍,汽车的密度超过了美国。单位面积排放是全国平均4倍。2014年北京达标天数不到一半,2015年勉强超过一半,2016年达到54%,也就是说我们几乎半年时间都是不达标的。去年尽管达标超过了不达标,但是我们平均的浓度,每天平均超过标准一倍以上。按照目前的规划,北京要到2030年可以做到达标,也就是还有十多年的努力了。今年全国空气质量最差的城市,北京屈居第三,前面石家庄、乌鲁木齐排在前面。
2015年的PM2.5的平均浓度,这是国际绿色和平环保组织,平均浓度比北京高的多,大家很不理解,北京虽然排第27位,但是浓度是80.4,而全国的平均浓度主要大城市的平均浓度才50,北京还是高很多了。还是属于不达标。如果按这个省份来排,第一位不达标的是河南省,第二位是北京,北京还排在河北、天津、山东的前面。北京去年的PM2.5的平均浓度,2015年是80.4,2016年是83.2,还高出来了。
那么全世界智慧城市的排名,哥本哈根第一,然后是新加坡、苏黎士、墨尔本等,中国没有城市上榜。
前面是基本的数据。北京还有一个的业务是怎么支撑京津冀的协调发展,中央对京津冀的定位是以首都为核心的世界级城市群,区域整体协同发展改革引领区,全国创新驱动新引擎,生态修复,环境改善示范区。北京定位四个中心。本来天津河北也希望有四个中心,后来中央说北京是四个中心,你们不能叫了。所以是一基地三区。我们北京副中心的定位是三个区,一流和谐宜居之都示范区,新兴城镇化示范区等。新时代首都的职责和使命是什么?蔡书记在市委十二届三次全会上有一个讲话,以首善标准加强四个中心建设,做好四个服务。其中三大任务,一个是实施北京城市总体规划,第二是疏解北京非首都功能,推动京津冀协同发展,第三系办好2022年冬奥会。这些副中心总书记考察讲到要有21世纪的眼光,高起点高标准高水平落实世界眼光国际标准,中国特色高点定位。这四句话是对副中心提的,后来也对雄安提一样的话,要求副中心不但要搞好总体规划,加强主要功能区块,主要景观,主要建筑物景色,体现城市特色,体现城市魅力,要重视绿色美化,增强吸引力,保护历史文化遗产。总书记在听取意见的会议上有一个讲话,着力提升首都核心功能,服务保障能力桐城市战略定位相适应,人口资源桐城市战略定位相协调,不断朝着建设国际一流的核心宜居之都前进。十九大《报告》重申了疏解非首都功能为牛鼻子。总书记还讲到北京要突出创新发展,不过可能没有正式发表吧。他说强调疏解北京非首都功能,不是北京不发展了,北京要发展,而且要发展更好,关键是牢牢抓住疏解非首都功能,为提升首都功能,提升发展水平提出难得机遇。北京的优势是在科技人才,要打造三城一区,构筑发展新高地。北京的发展要突出创新发展,要靠科技金融服务业,高技术产业来支撑。总书记在关于京津冀协同发展讲到的,这是实现京津冀协同发展是面向未来打造新的首都经济圈,推进区域发展,体制机制创新的需要。当然讲到探索城市群,探索生态文明的建设,要实现京津冀的优势互补。京津冀的情况差别很大,北京是后工业化阶段,天津是工业化后期,河北是工业化中期。人均GDP北京和天津差不多,河北还达不到全国的平均水平。天津的二产比较高,44%,三产54%。河北一产11%,二产比天津高,三产比天津低。城镇化率,北京和天津差不多,百分之八十几,而河北比全国平均水平低。人均收入很大的差距,北京5万多,天津3万多,河北只有2万多。这是GDP的增速,河北GDP还是高于北京的,北京比天津高一些。
北京的主要经济增长动力主要是消费,然后才是投资出口占一点点,天津的主要增长动力是靠投资,天津消费的比例不高,天津的进出口贡献是将近-20%,河北是靠投资拉动,进出口略为负的,所以看到京津冀本身发展是很不平衡的。产业虽然有差异化,但是有互补性,北京的产业配套是舍近求远的,科技成果55%到珠三角和长三角,只有5%到天津和河北。人才方面北京的人才上天津、河北辐射不足。大气污染倒是三家都差不多,都是污染情况不分上下。资源承载方面京津冀是严重缺少的。独角兽的企业北京有40个,天津和河北没有。国家级的孵化器北京30个。科技型企业北京39万个,天津8.2万个,河北2.9万个。技术市场的成交额在全国占比北京占35.1%,天津只占3.5%,河北只占0.4%。研发支出在全国占比北京将近10%,天津3.5%,河北3.4%。每增加一块的GDP北京要5块投资,天津要9块,河北要将近15块投资才能增加一块的GDP。河北的投资效率不高。
所以十九大《报告》中说发展不平衡不充分的问题尚未解决,生态环境保护任重道远。所以北京不是仅仅自己发展好就行了,咱们带动京津冀协同发展任务很重。北京在环境污染,交通拥堵治理方面任务艰巨,而智慧民生的服务永远在路上。北京在数字经济的实力方面在国内是领先的,但放在国际上看,它的排名跟中国国际地位不相称。支持雄安新区建设也是北京的重要任务,疏解北京非首都功能,践行新发展理念,建成以首都为核心的世界级城市群,打造我们国家经济发展新增长,促进京津冀协同发展,这也是北京的光荣使命。我们需要认真学习领会党的十九大《报告》的精神,以习近平新时代中国特色社会主义思想为引领,建设四个中心,做好四项服务。谢谢大家。
主持人:感谢邬院士的精彩演讲,以非常翔实的数据让我们看到了北京市发展的优势,增强了我们的信心,但是更让我们看到了差距,特别是我们离总书记提出的要求还有相当大的差距,特别是院士还梳理了党中央对我们北京新时代发展的一些工作的要求,这些都有助于我们进一步的落实好市委市政府的决策部署,做好四个服务,落实四个中心。下面请国家行政学院教授、市信息化专委会委员汪玉凯同志演讲,题目是:智慧社会与智慧政府。
汪玉凯:尊敬的杨部长、邬院士,各位领导:大家下午好。很高兴参加论坛,我想结合十九大提出一些观点。比如说十九大的智慧社会这些观点是在过去主要文件中没有的,就我对十九大本身对信息化的理解有五点值得我们关注。
第一点是到2035年跻身国家创新型国家行业行列,提出了数字中国,网络强国,智慧社会三大目标。在经济转型,结构优化转化动能方面,强调互联网,大数据,人工智能与实体经济的深度融合,这是我讲的第三点。第三点是推进现代化社会治理新格局方面提出社会治理的社会化,法制化,智能化,专业化的四大目标。第四是在互联网内容建设方面提出建立网络综合治理体系。第五是总体国家安全方面把网络安全上升到国家安全的高度。这是我通过十九大《报告》有关信息化概括的五点。
下面我围绕智慧社会结合北京谈几点看法。第一个是如何理解智慧社会。智慧社会是十九大第一次在全文件上提出的新概念。我认为智慧社会就是数字化、网络化、智能化深度重合的社会。这是我对智慧社会如果说给出一个定义的话,这是我的理解。我认为要把握这样一个智慧社会的概念,还有三个视角可以进一步来探究。第一,数字化、网络化、智能化融合的基本逻辑是数字化是前提,网络化是路径,智能化是手段,智慧化是目标。这是我们第一个思考智慧社会的一个概念。
第二智慧社会的基本特征,在数字化基础上实现万物感知,二是在网络化实现万物互联,三是在智能化基础上使社会更加智慧。所以我们说感知、融合、共享、协同、智能是智慧社会的角度。
第三是智慧社会的生态链。智能治理,各类组织的自身治理,政府对社会的协同治理,其中政府处在核心地位。大家看到北京的风口浪尖就两件事情,一个是红黄蓝幼儿园,一个是大兴区火灾引发的安全的反映。这个事说到底整个和治理是有关系的。第二是智慧产业。智能制造、人工智能,互联网都可以纳入这个范畴。第三个是智慧商务,以电子商务为代表的消费互联网领域都是智慧商务的范畴。第四是智慧化服务,基于市场的智慧化服务和基于政府的公共服务。第五是智慧生活,工作、生活、出行、社交等等,人工智能有可能渗透到日常生活的各个领域。我想都是搞信息化的,你看最近机器人都上市了,这个东西将来对人类产生很大的冲击,不要以为智慧离我们很远。智慧生态,优美的环境和可持续良好的生态,这是我理解的叫智慧社会的生态链,六治。
第三是智慧社会的形态。应该说智慧社会是人们向往的一个社会,第一它是社会组织智能化。各类组织通过三化融合,数字化、网络化、智能化,通过三化融合以后在功能和结构上普遍实现智能化。比如说智慧城市、智慧社区,智能医院,智能学校,智能政府,智能企业,智能家居等等这都属于组织社会组织本身的智能化,这是一个构成社会的细胞。第二是社会运行的智能化。在三化融合下,数字化、网络化、智能化的融合下,整个社会的智能化水平大幅度提升,如智慧交通,智慧汽车,无人驾驶,智慧医疗,智慧教育,智能制造,这些都是社会本身的智能化。第三是社会成员自身的智能化和被智能化。我们每个人都是社会生活的参与者,在这个智慧社会到来的过程中,首先智慧社会中的每一个人要提升自己的智能水平。比如说智能手机达到7.5亿用户,手机总用户达到13亿。再就是借助智能终端的快速普及,以及信息消费需求快速增长,本身就说明了社会的个人自身的智能化水平不断在提升。
与此同时我们看到一个社会参与者本身被动的也被智能化。比如说身份证,银行卡,家庭通讯地址,手机号,这些客观的数据不断在广泛使用。以后我们个人参与所有活动就是身份证号,所有企业参与活动就是一个代码,从生到死,广泛被使用。在中国的体制上,实名制越多,你的客观信息被使用越广泛,几乎无处不在,买火车票、上飞机,以后买汽车票也要实名制,被广泛的使用。再加上人脸识别技术,指纹技术,区块链技术,再加上摄像头、活动定位,行为轨迹,行为数据被广泛手机,无处不在的大数据分析,也分析每一个人。这样就把每一个人都被智能化了。
总之,智慧社会给人类社会带来的方便难以想象。五个高度大体可以概括智慧社会的基本出行。智慧社会是高度被感知的社会。智慧社会是高度互联互通的社会。智慧社会是高度数字化和被精准计算的社会。智慧社会是高度透明的社会。智慧社会是高度智能化的水平。我认为五个高度来概括智慧社会的基本形态。
先讲第一个,智慧社会是未来社会形态的新蓝图。第二是智慧社会到来对国家治理提出新挑战。我们在座的都是政府的搞信息化的领导人,那这个智慧社会到来之后对我们究竟提出什么,非常值得我们研究。我认为智慧社会除了给社会提供极大的方便,带来一系列福音之外,我们也应该看到潜在的风险和以及对社会的本身的冲击。第一个是智慧社会有可能对人类带来冲击。一是大量工作岗位将有可能被人工智能、机器人所替代,对就业形成冲击。比如说无人驾驶可能导致相当多的驾驶人员失业,最近科技部上了四个开放平台,第一个是百度为主的无人驾驶全球开放平台。第二个是阿里巴巴为代表的城市大脑全球开放平台。第三个是以腾讯为代表的医疗影像资料的开放平台。第四个是科大什么飞的语音智能全国统一平台。可以说这些大的全球的统一平台的构建将在一定意义上加速智能化的过程。再比如说智能制造,使大量一线工作人员,一线生产人员可能失业,智能商务使许多从事简单工作岗位的,比如说酒店管理员、服务员有可能下岗。无人商店,刷脸消费可能导致很多一些商场普通人员失业,后面搬货就行,不需要卖东西了。这是对社会就业有可能形成冲击。
第二是社会普通互联和高度被感知之后也可能带来风险。比如说人与人互联,物与物互联,人与物互联,一方面带来参与交往的极大的方便,也给社会治理带来极大的方便。另一方面它可能增加了社会交往和社会活动中的风险。比如说智能犯罪,网络暴力,虚拟空间的很多犯罪都可能应运而生。再一个社会高度被感知后,也极大的增加了社会公开性和透明度,为社会治理提供方便,但是个人隐私,商业秘密乃至国家社会安全风险也将进一步会上升。都是双刃剑。
三是智慧社会快速到来对国家治理本身也带来挑战。比如说从政府自身看,你如何重新确立你的治理理念,你的治理价值理念,组织结构如何适应社会的到来,你的治理的管理方式如何更人性化,适应社会的治理手段。我个人理解北京现在服务业超过81%,北京的城市化率超过80%,如果说中国率先以省划单位来衡量是不是智慧社会的话,我认为毫无疑问北京可能是第一家。北京是第一个有可能进入到在中国的国土上智慧社会的这样一个单元。换句话说,你说智慧社会它带来的方便和带来的憧憬都可能在北京的治理结构中最早得到体现。我再讲北京是资源非常多,但是我认为北京推进非常困难,正因为钱多,权威,又是国家的首都,体制机制动起来不容易,各个部门的边界,中间的壁垒,你要排除掉也不容易。你看其他好多地方可以搞一个城市统一的服务模式,但是北京以区为单位,很难搞成。既有它有利的一面,也有有问题的一面。
第四是从社会本身变革来看,智慧社会和社会转型这两种东西交融在一起,也会给我们治理带来很大的困难。一个是中国是生存型社会转入发展型社会,第二个是中等人类发展水平国家正在跨越走向高的人类发展水平国家,这两个指数北京是最高的。比如说生存型社会和发展型社会的产业构成,如果一个国家的第一产业占15%,第三产业低于40%,城镇化率低于40%,那它就是一个生存型社会。发展型社会的指标就是第一产业占比重不能超过15%,第三产业不能低于40%,城镇化率不能低于40%,你看看这三个数,北京市第一产业可能就一点多,基本可以忽略不计,第三超过80%,城镇化率超过80%。北京早已结束了生存型社会,整体跨入了发展型社会。第二个是人类发展水平,从全国来讲现在处在0.78,三项,医疗、教育、生活质量,如果你得分在0.5以下,联合国定义你是低人类发展水平以下,得分是0.5到0.8之间是中等人类水平,你的0.8以上联合国定义是在高人类发展水平的国家。我们早已超过0.8。中国是一个发展很不平衡的社会,这两个社会结构的变革,一个发展型社会的到来,高人类发展水平的到来也率先北京也是最早的。
第二个是十九大还提出一个新的问题,就是社会主要矛盾在转变。现在变成人民对美好生活的需求和发展不平衡不充分的矛盾,我在讲这个时候你看政治报告说老百姓不仅仅关注物质和文化了,还关注民主法制,公平正义,环境安全。又加了12个字。这些对民主法制,公平正义,环境安全的追求像北京这样一种社会发展水平比较高的城市它率先会表现出来。北京市民和偏远地区的那些老百姓整个文化素养,价值诉求的差距是非常大的,就得有不同的治理。实际上智慧社会的快速到来,像北京这样的大都市率先会到来,和传统的社会转型两者交织在一起,同样会对北京形成很大的挑战。
第三是智慧政府在治理中扮演着很关键的角色。十九大《报告》中两步走都讲到一个国家治理体系,国家治理能力现代化。我的理解是当年十八届三中全会这把两句话定义为全面改革的最终目标,但是十九大不是这样定义的,把国家治理体系,现代化定义为整个现代化的目标。刚才讲2035年初步实现现代化的时候,它就讲国家治理能力也要初步现代化。2050年我们建成社会主义强国的时候,就讲国家治理体系及能力要完全现代化。这样我们看到国家对国家治理体系和能力的现代化真正变化第五个现代化了。那么我也在讲,政府治理处在国家治理的第一线,处在国家治理的前台,政府治理能不能现代化,直接关系到国家治理能不能现代化。而在我看来政府治理现代化的当下来看,唯一路径就是构建智慧社会,智慧政府。智慧政府的第一个属性基本内涵就是数字化、网络化、智能化深度融合的政府,我和我对智慧社会的定义是一样的。它是数字化、网络化、智能化深度融合的政府,这政府要有六个公共。政府的所作所为都和公共联系,没有公共就是乱作为了,手伸长了。智慧政府必须确立以人民为中心的价值和理念。就像十九大提出的要构建一个人民满意的服务型政府。这种人民为中心是在智慧政府中就要体现中提升人的感受,方便感,安全感,获得感,公众感,幸福感。我觉得最高境界的是幸福感,北京市现在2000多万人,管理量是非常大的,因为户籍人口没有那么多,外来人口800多万,北京市规模的限制,但是价值层面上人是自由的,确实给我们带来两难的选择和处境,如何处理好这个关系是需要很高艺术的。强制命令,又要考虑到北京定位,所以你看低端人口四个字引发了极大的争议,这个问题现在巨大的反弹了。所以说从这个上来讲,智慧政府对北京来讲最主要体现出八个字:公平、正义、廉洁、有为。我曾经出过一本专著,就是说构建一个公平正义,廉洁有为的现代化政府。
第二个是智能化治理,智慧化服务是智能政府的基本特征。通过三化融合以后,我们政府传统的治理结构,治理模式正在信息化时代得到重塑。结构扁平化,协同能力大大增强,政府感知能力大幅度提升,数据资源,信息资源得到高度共享。各种系统应该得到深度融合,在这些方面北京市有非常大的工作可做,我们数据资源很多,就是如何整合,如何共享。
第三是创新治理方式,将为智能和智慧插上新翅膀。我说智慧政府意味着数字化治理在经济社会政治各个领域被广泛使用。而我们在当下应该更加关注互联网+政务服务应该深度应用和发展。这个就是智慧民生,医疗、教育、社保、就业服务、保障性住房,再就是对企业提供各种各样的服务,应该说在智慧政府中,智慧民生将是我们的重中之重,智慧民生这张牌能不能打好,能不能做好将是我们衡量智慧政府能不能做成的最核心的标志之一。
最后一个智慧政府将在弥补对公权力制约短板方面发挥重要的作用。我们最大的软肋就是对公权力还没有建立起有效的制度设计。我提出叫转型错位。我们1978年改革导向,成功的由计划经济转向市场经济非常成功,但是经济转型中没有建立起一个对公权力约束的制度笼子,这个转型是短板,这一种转型错位一下把公权力这个潘多拉盒子给打开了。过去是国有的,集体的,现在是民营的、个体的、私人的、外资的占大头了。如果不能有效建立一个对公权力制约的制度笼子,该导致大量的权钱交易,空间无处不在。否则你不能解释十八大以后的反腐有上百万人倒台。所以现在正在强调构建制度笼子,由运转反腐转向制度反腐。除了体制机制变革之外,很大程度就是要借助信息网络技术。比如说五张清单、一张网。权力清单、责任清单、负面清单、公共服务目录清单、财政专项资金使用清单,社会管理公共服务网一体化的,就是有可能把权力通过五张清单给规范出来。再比如说不动产登记,社会信用系统,指纹识别系统。这些现代信息技术包括区块链技术,人脸识别所有这些都可能给监控留下一些公权力的行使的轨迹,都可能发挥精准化的作用,精细化的作用。如果我们借助信息化的技术构建起一个有效的制度笼子,不仅对国家,对政府能够大大增加它的竞争力,提升老百姓对它的信任度,也可以大大减少把一些好人走向反面,这样我想我们这个制度,我们这个体制就会真正体现出它的竞争力。谢谢各位。
主持人:谢谢汪教授,对于我们编制全市的信息化发展新规划,也对于我们提升智慧政府的发展水平都有非常好的借鉴意义。下面请人民银行数字货币研究所副所长狄刚演讲,题目是:区块链技术的应用与发展。
狄刚:尊敬的杨部长、各位专家、各位朋友:大家下午好。非常荣幸有机会跟大家交流和汇报区块链的应用发展。我汇报的题目有四方面。首先我们先跟大家汇报一下区块链的内容和内涵。
区块链相信大家已经不是很陌生了,现在各个大会小会各个论坛对这一块交流比较多,讨论比较热烈。总之来说,这本来是一个技术,但是现在领导们讲的很多,业务人员比技术人员讲的多,学文科的比学理科讲的多,国外也是华尔街比硅谷讲的多,受到这么高的关注也说明有一个很高的期望值。
我也参加了很多会议发现大家从不同角度交流,发现角度不一样,理解不一样,因为每个人的专业背景不太相同,但是本身技术涉及到相关的加密、数学、计算机包括一些博弈论等等各种,还有一些金融的理念在里面,所以带来大家的理论经常会是鸡同鸭讲,不是一个维度。今天我不想带来特别专业和技术的内容,只是简单探讨一下区块链的应用场景和现在的进展情况和未来发展方向。
我们经常有不同知识背景的人想琢磨明白,但是我们从例子来研究和讨论。比如举个例子,像我们的微信组局,我们今天40个人讨论出去吃饭,这时候到底谁参加,谁先谁后有一个非常简单的方法就是大家在群里报名,张三1、第四2、王五……今天谁出席,这有点像区块链,但不是特别严谨。每个人的手机收到相应的信息,就相当于每个人是一个结点,是一个完整的复制。同时也不能篡改。谁先谁后大家都能收到。但是带来一个问题,你有可能在同一时间内张三和李四同时报名,这样大家群里发现,这个同时在第五个报名的时候有的是张三,有的是李四,比特币的处理方式谁在张三或者是李四方面,谁长,把前面的就废掉了。这在区块链里面出现分杈的处理方式是一样的。
这就是说我们过去中心化的系统有一个中心化的机构。回到以前古时候结婚的时候没有民政局,两个人摆酒席,拜天地形成共识,如果没有银行,过去存款,张三汇款给李四找银行,之后打一个凭证,证明我们银行作证,我们中间发生了一些金融的交易行为。但是如果没有银行怎么办,我就是转给他以后,我吆喝一嗓子大家都见证了,这种共识的方式也是基于区块链的原理。
从大家去探讨的内容里面经常看到区块链就是一个共享的账本技术。这个共享账本技术是一个什么形态?这个块就相当于账本的每一页,链就相当于账本的活业夹,大家看到每个人手有一模一样的东西,这就是区块链的数据结构。每个人手里都有,不怕丢失,甚至破坏的结点也不会带来一个损失。第二个因为多方共识记账,也不怕篡改。共识的行为在很多教科书写的复杂,我们再去举一个例子。我们是分布式记账,总要选出一个人,我们发生交易的时候要记到账本里,大家都要见证,互相吵吵,也不行,到底是谁先记账。比特币原理是谁优先,大家经常说的挖矿,谁挖到了谁有这个记账权。怎么挖?就是用计算机算一个给定算法的结果值,不可预测,只能在那儿碰,只能不停试、不停试,谁试得多了,给定的一个区间,你把这个结果摇出来了,大家很好检查,就发现这个人算出来了,他就抢过来记账权。这个摇色子的过程或者是抢的过程就叫挖矿。这么多人一起挖矿,不确定性很强,这一笔你摇出来以后,并不代表下一次你还能摇出来,这样的话每次记账的人不同,保证你不能连续记账,也就防止了篡改了。你摇出来,记了一个错误的账,这样不仅损失了挖矿的奖励,也不会连续别人算出来的超过你的,也自然也前功尽弃了,这种不确定性的记账方法在比特币里面叫工作证明。
而且区块链的结构前后是相关的。后面一页的内容其中有一块是前面的哈希值,每一个后面都有前面的要素。就像这个账本撕掉一页没用,连续不起来,这个区块链就不成立,大家就拒绝掉了。这样大家发现既通过莫克尔数进行,通过这些方式达到了共识。特征的话是去中心化的,没有一个规定的机构来维护系统,所以区块链当时为什么被发现?当时大家发现比特币运行八年了,这个大家关注点逐渐降低,但是发现它怎么八年没有机构来运维它,跑在什么系统这么稳定?大家发现底层的技术是一个区块链的技术,所以经济学人的杂志做了一个封面报道,定义为一个价值的信任机器,这样它的去中心化的特征比较明显,没有中心化的机构。
另外一个它是开放包容的。谁都可以加入,同时上面的脚本都是代码基本都是开元的,等等这一系列都体现了开放性以及它的开元性。
另外一个是信息不可篡改和不可伪造的,通过加密进行保存。每一个信息想写到区块链都要进行验证,同时它有高度的自证性。这是特征。
我们今天讨论的是社会治理,我们这个区块链也挺扣题的。对于我们区块链来说可以说是3.0。1.0的时代是修路修桥,上面跑车。信息化网络化时代,这时候互联网出现,这个时候叫信息互联网,因为有了互联网,有了信息高速公路,定义为2.0。那3.0的时候有了区块链,叫价值互联网。所以也说我们区块链是3.0版本,解决了安全问题,隐私问题,监管问题,管理问题。
我们再探讨第二个问题是区块链的应用场景。首先刚才我们也谈到了前面几位老师谈到的治理问题。区块链助力监管科技是一个非常适合的手段。不管是金融系统,还是企业,职能部门,民众,这里涉及到的比如说互联网金融,主体问题,资金监管问题,动向问题,结点是透明的,实现金融监管。第二个是供应链金融,对供应链的上下游,核心企业信息不对称,带来融资难融资贵的问题,以及上下游企业信任传递的问题。经常是一级企业可以拿到授信,二级、三级企业拿不到授信。有的厂商核心企业多年都没有发现是一个核心供应商,因为有好几层,通过供应链金融可以打通。以及食品安全回溯的问题,从责任人,流转的监管,认真监管,防伪监管,还有知识产权的保护,我的信息我做主,信息一但上了线之后,不可抵赖,是可以追溯的。过去在数字化时代版权很难保护,比如说你写了一篇文章发到网上马上有人剽窃,这个时候你说不清楚谁在前谁在后,你写了一个歌被下载了,但是在区块链时代你可以通过哈希要素记载上去,这样可以进行回溯,谁在前谁在后历历在目。
区块链在金融行业最先得到应用的,时间关系。我说一下我们社会和政府方面做到信息的存证方面,溯源方面,公示方面,对智能交互和智能管理方面能做的事情。
第一个是存证方面。把相关的摘要上到区块链里面,保证信息的这个存在性,完整性、安全性,这样你的信息至少是丢不了的,什么时候上链的非常清楚,大家可以授权范围内可以查询,永远保存,保证信息的安全和不可篡改。现在找一个公证所,公证所的公证谁来做是一个问题,公证员有时候是自己有没有证的问题,有了区块链之后可以解决这个顾虑。第二个是电子合同,合同本身有法律作用的,但是合同当时签订的时候,相关的签约方,甲乙双方的相关内容有不可篡改和抗抵赖和强制执行的要素,随时查看和追溯,法院判决取证起来也非常容易。
信息溯源从生产制造、批发、零售,让它上区块链,这样在整个商品的流通过程中对它的追踪、监测、预警,随时的防伪查询,还有在采购过程中都可以回溯到全生命周期。
信息共享方面,还有身份识别,相关的政府把身份证信息扫描以后上区块链不,通过密钥来管理信息,银行可以进行背书,防止别人拿着你的信息上链,别的机构用到你的信息的时候不需要二次证明,你授权之后比如说社保部门想要用,办出国旅游签证信息,可以调出来你的信息解决一次录入多次使用的问题,解决我的信息我做主的问题。还有难民问题大家也在联合国提出来解决方案,上链能确认信息,保证基本人权。
除此之外,征信和信用方面,不管是个人还是企业,在经济活动中的每一个活动都可以在授权范围内哈希上链,你只要有授权公共部门都可以查看,永远不能修改,防止了个人信息滥用。现在我们的信用信息要不是不透明,要不就是多次采集,还有一个最重要的问题就是被多次滥用,没有经过个人得授权别人是访问不到的,但是你授权之后你可以放给比如说你要贷款,授信部门就可以访问你的信息,可以做到访问。以及像腾讯提出来的电子发票,可以把相关的商户还有发票服务平台,税务局,自己所在企业的财务管理系统打通,在微信支付的同时提出开发票的申请,发票的全生命周期通过税务总局进行查询,同时企业要进行报销的话,访问相关的结点平台自动调取信息,防止了假发票的信息,同时生命周期大大缩短,实现了扁平化管理,效率大为提高。
还有我们政府部门的摇号系统。大家在说是不是公平,概率是多少,我们可以固定好,制定某一个哈希值是作为参与者的摇号标准,把参与者的信息进行上链,可以保证公平,可以自动查询验证,保证政府的透明性,所以公示性是非常有效的。另外一个是智能交互,投票也一样,我们进行选举投票,采用区块链的方式可以解决匿名信的问题,可以自动计票,相关的内容也不可更改,100年后也可以进行追溯检查。投票系统现在有很多政府部门也在开始进行相关的这个实践。另外一个是医疗,大家如果有印象的话,到每一个医院首先要花五毛买一个本,这个本在这个医院,相关的病历写进去,有的医院信息化好,录入到系统里了,但是医院和医院是不联网的,每一个人完整的把一辈子在不同的医院看病的情况,给的诊断书以及病史能系统的调出来吗?其实很难。所以通过区块链来解决这个病历信息相关的联合会诊等等一系列的民生领域,是大有作为的。
另外一个是智能管理的公益慈善。大家都知道红十字出现相关的危机之后,大家对捐款平台的不信任,导致每年逐步在下降。像蚂蚁金服做了相关的公示平台,通过区块链,可以全程追踪每一笔钱到了谁手里。公益方面的话像腾讯做了一个404寻人,也是非常有效果的,大家有兴趣可以上网看看。以及政府之间的协作,比如说廉租房和公租房,公积金部门要发证明,税务部门要出证明,以及社保部门,从申请到拿到确认要很长周期,通过区块链能实现信息共享,扁平化的快速管理。
区块链和物联网结合也有广泛的前景。现在是一个智能社会,刚才老师讲了,但是智能社会带来的另外一个问题是安全和隐患的问题。大家看过大片说是机器可以控制汽车,想让他开到哪儿就到哪儿,想让它掉入悬崖就掉入悬崖,家里的微波炉都可以制造一个火灾。这个设备不被你所控是一个很大的问题,互联网的危害还可控的话,那么物联网的损失就是生命的安全了。所以物联网时代可信是很重要的问题,物联网和区块链结合可以解决物与物的信任问题,通过它解决端到端的管理问题,这方面大有可为,IBM这方面还是做了很多的。
区块链的发展非常快,也在快速的演进过程中,我梳理了最近一两个月之内的,每天都在变化,现在有10所世界级的高校开设了相关的课程,11月10日相关官员提出了将区块链用于一带一路战略包括贸易融资系统,加拿大政府提出来通过区块链的数字身份2018年要上线,以及新加坡提出来的区块链的货币数据的项目,还有加拿大银行的一个项目,也是进入第三阶段。还有香港和新加坡,香港的数字货币项目跟新加坡一起合作在跨境贸易方面做了一个连通性的网络GTCN,我们在密切交流。美国能源部在11月2日着手研究能源的点对点的交换。南京市政府也提出了关于区块链加政务加普惠金融的信息共享平台。11月23日思科也提出了一个无线网的管理平台,还有美国的食品巨头也在做一个溯源平台。
简单快速的过完应用场景和最新的动态以外,我再说一下我的看法。区块链还是属于一个早期,如果最成熟的应用的是比特币,到目前还没有杀手级的应用,虽然炒的比较多,但是真正的价值发挥还是在若干年以后,现在还属于这种个人感觉还在比较有一些泡沫存在的。最关键的像比如说是性能和隐私的问题,以及系统整合的问题。因为区块链不单独存在,要跟传统技术相结合,系统整合也是一个难点,以及价值认可。因为区块链本身还是有技术背景比较强的,带来大家对它的认同点,什么是区块链的问题还是一个共性的问题。以及它还是一个成本比较高的,因为大家看到每个节点都要复制,存储资源和网络资源占用比较多,相关的监管政策本身因为是匿名性的,你如果利用区块链的话,现在比如说比特币利用区块链,上面的洗钱问题等一系列的问题,是值得大家研究和慎重考虑的。但是这个区块链发展也是非常迅猛,这个我稍微再说一些技术方面的最新的动态。
现在大家重点研究区块链的两大痛点,一个是隐私保护,一个是性能。因为比特币每秒完成7笔交易。我们双11阿里的最高记录是每秒25万、26万笔交易,这个性能是最大的痛点。现在性能带来的还是共识算法的问题,要达到共识,你这个交易的确认不是一个人说了算,是需要共识来实现确认的。所以的话现在在供应链上是基于共识来优化,比如说POS,DPOS权益证明,还有私有链对拜占廷算法,一些改良,以及非全局性的等等一系列的问题。另外除了性能的解决的话,分层和分片也是目前比较好的一个思路。分层的话就是解决延时问题,就相当于我们大小额里面我们在一级总账里面圈存一笔钱进行二级交易,这是分层。比特币是闪电网络,以太网叫雷电网络。分片是分成几个子的区块链,因为今天研究不太多,我快速讲一下。另外公有链的交易,跨链的一些方式。另外一个隐私是一个最大的问题,因为大家都知道,每一笔交易都广播给大家了,在金融领域的话,大家是很忌讳这个的,我跟你的交易行为怎么能让大家知道呢?所以隐私保护是一个重点,解决这些的方法有多方可行计算等,清华大学的老师在前一段时间的会议上也讲过这些方面的快速的发展。还有一些领域也被激活了,比如说区块链领域的智能和约,大家知道以太坊出了很大的问题就是丢了很多的币,只要是人写的程序就有漏洞,智能和约是很难升级和更改的,有隐患不太好修复。还有智能和约的跨语言问题,将来可以用JAVA来编写。还有治理技术的问题,比如说监管结点,还有相关的数据的安全保护策略等等一系列的话,都是属于治理方面的问题。而且很多社会博弈论的问题,都引进来探讨。
对于区块链大家经常会说去中心化的,不要政府了,这是误区了。甚至一些无政府主义在强调这个,你说的去中心化是指技术上的去中心化,并不是去管理化。而且区块链本身是一种技术,是提升管理效率的,所以的话有管理的分布式架构才是有充分的责任兜底和风向保障。如果比特币丢了找谁,一个系统没人管理和兜底,是无法做到消费者的保护的。所以我们去看待区块链更多的是对原有的中心化架构的有益补充和优化,提供了更好的升级手段,所以的话这个区块链并不是极端的要颠覆,它是一个颠覆技术,而是对现有的技术的更好的补充。同时区块链解决不了真正的所有的问题,只是一个单纯的技术,如果想用好,要跟传统技术相结合,实现混合架构。
大家知道比特币是一个完整的生命周期,但是我刚才说的原始的数据还是在链下,你登记到链上才叫存证。以金融市场为例,前台可以用交易撮合性能要求比较高,后台登记确权可以用区块链技术,这样混合技术,单纯为了一种技术而用一种技术没办法包治百病。而且区块链本身性能比较低,更多的大家把一些关键的技术哈希上链,只是存在一些摘要信息,更多的完整的信息是在链下,实现了互联也保护了信息。
另外是两个松绑。对于比特币这些价值非常不稳定,大家都希望它放在手里,不去流通了,流通就失去了。这个时候就变成一个收藏品了,怎么支持经济发展。从这个道理理解的话,不是货币,充当不了货币职能,所以法定货币才能知道经济的发展。第二个是区别对待数字货币和区块链技术。区块链技术只是一个技术,既不要神话它也不要泛化它,是一个单纯的技术用好就得了。不要为了赶时髦拿着锤子找钉子,为了区块链而区块链,这个就没有意义了,对法定技术的话,是一个可选的技术不是技术的本身,现在有很大的不成熟性,我们还有待于观察它。对于技术本身来说,到底怎么发展,对前景还是应该看好它,为什么?好的技术不一定得到好的技术。N年前IBM有一个OS2,最后IBM自己放弃了,一个很好的东西不见得能发展下去,但是现在有很多的人关注它,世上本来没有路,走的人多了就成了路了。这一块市场和产业界都在加大力度培育它,所以这方面的话,我们国家也需要弯道超车走在前面。前段时间我们数字货币研究所跟工信部的信通院一起在联合国提交了可行标准,也得到了响应。
我们研究所是去年编办批复的正局级单位,专注于金融科技的创新发展,希望社会各界跟我们广泛交流和合作,形成法定数字货币的研发合力,推动金融科技的发展。谢谢大家。
主持人:谢谢狄刚所长,我们也在考虑怎么把一些大数据的应用核项目结合起来,希望以后这方面的业内人士能加深探讨。下面请市经信委智慧城市建设处(大数据应用处)副处长刘旭同志演讲,题目是:加强政务信息资源整合共享,推进城市大数据生态建设的几点思考。这也是当前市政府正在推进的一项重点工作,下面请刘旭同志。
刘旭:各位领导、各位专家、各位同仁,大家下午好!首先声明一下,今天作这个不敢说是演讲,可能是我们的一些思考,甚至也是一些问题,更重要的是通过这些问题引发大家的思考,将来共同解决这些问题。事先领导布置功课的时候,我们和专家委和相关同志沟通过,到底从哪个角度来切入论坛主题。我想我们考虑了三方面。第一个是从题目上来看,是我们的必答题,是规定动作,是必须要完成的工作。因为国家有一系列的文件部署,相信在座的很多同志和也都或多或少对这个有感触,所以这是必须要做的工作。因此会有探讨的空间。第二就是这件事情是大家共同要做的事情,无论是政府的各部门各区还是合作伙伴上下游的企业,这些合作伙伴,这件事情是我们共同要推进的,更不要少后面还有一个很大的大数据的生态体系建设。既然是大家要共同做的事情,大家会有一些共鸣,会有各种不同的思考,不同的想法来碰撞。第三方面是最重要的,无论是现在的政务资源信息的整合共享,还是推进城市大数据生态建设的题目,都是手段和过程,最终的指向是我们的目的,也就是我们今天的主题,落实十九大精神,引领新时代的发展。这两个事情怎么支撑到这样一个主题,支撑到大数据时代我们的方方面面的工作,从这个角度引发了我们的一些思考。在这儿我首先声明一点,今天不是一个政府的工作部署会,因为是一个论坛,所以大家可以畅所欲言,充分探讨,我们的很多观点不一定是正确的,更多的是想抛砖引玉,激发大家思考,后续一起通过生态体系建设把我们的工作做的更好,完成十九大所说的推进互联网大数据人工智能和实体经济的深度融合,这是未来五年的核心战略任务。
我的汇报从三方面展开。首先是刚才我说的必须做的或者是做的是哪些工作。可以简单回顾一下,在座的很多同志都是参与者,我们做了很多之后,我做了很多的从我个人层面的总结或者是反思。我在想做了这么多年的工作,我们北京30年的历程了,智慧北京发展5年多了,这些问题反思不成,无论是十九大还是谱新篇,我们面临的是什么问题,过去的一些失误或者是闪失到底在哪里,找到这些症结才有可持续的发展。我甚至想说我后面会说出一些问题,我会说出我们的考虑,抛砖引玉引发大家的思考,我相信很多同仁或者是同事们在后续的工作中会有一些切身的共同激发相应的思考。
说到大数据稍微说一下大数据的背景。我觉得太理论方面的东西不是我的专长,我从两个正要任务的观点说明大数据的重要性,我本人是学系统科学的,我学系统哲学的时候,根深蒂固引入一个观点世界是由物质、能量构成的。这张图是第一次科技革命是物质的问题,第二张图是第二次科技革命的能源的问题。物质我们有国土资源部,能源有国家能源局,信息更多的还是在推进应用,但是还没有作为一个资产或者是战略级资源有形的存在于体系中,但是这一天会越来越快的到来。
过去30年的北京的信息化历程干的是IT时代的工作,我们一年产品的信息量是人类过去5千年的综合,而且还会呈几何式的增长。马云说人类从IT步入DT时代。我们国家处于一个多头并行中,无形中大家了工作难度。DT时代最核心的是汇集数据,用各种各样的工具给智慧提供延展来处理信息,把这些变成知识、经验,服务于社会所关心的方方面面,这才是大数据的生产链条上很关键的脉络,也是一个DT时代最需要的范畴。国家认识到这个时代的重要性也做了一系列的部署,我相信电子政务的同志对这些文件一点都不陌生,这条线索目前最高的指示是上个月十九大结束提出的推进互联网、人工智能、大数据的和实体经济的深度融合。今年以来,我们经信委收到的国家级的国家部委的,或者是国家级领导小组发的文件基本上一个月一个,我相信在座的政府部门也能够感受到这种压力,那么为什么会是这样?为什么要推进这个事情。我们目前的解读是整个大数据研究的第一步,也是最关键的一步。
说说北京本身的条件,北京电子政务有20年,我们积累了非常丰富的政务资源的体系。这里列举了一些数据,我不说了,我们的体系基本构成,网站,各种的数据库有很多,在全国处于领先地位。北京的社会层面就更加的独占鳌头。我们是一个很悠久的城市,人口众多的城市,相关业界的企业刚才院士列举了很多的参数,全是全国领先的。换言之对于今天的课题来讲,北京在社会层面也积累了丰富的资源。我们北京经信委11年前建立了共享交换平台,据我所知是第一个,今天依然运转良好,完成了IT时代的使命。北京也是全国最早开启政务信息资源网,或者是DATA网站的开放的信息。根据第三方不完全统计,北京纯做资源的企业60%,这一系列的最终落在去年北京市发布的北京市大数据和云计算发展行动计划,这个里面提到了很多很宏伟的目标,未来五年的目标。说了这么多,我们做了这么多工作,国家规定的,社会需要的,但是事实上我们的效果如何。刚才汪教授所说的一切以效果为导向,效果就是我们的领导不满意,各部门不满意,老百姓依然不满意,我相信在座的很多同志同样不满意。为什么?我做了一些思考和总结或者是反思,我觉得有四方面的因素。信息化或者是电子政务最症结的问题是信息孤岛。这是一个现象,现象背后的本质是哪里,从四个维度展开。
首先是应用,现在典型的理论是西医理论,头痛医头,脚痛医脚,治标不治本。如果是一个信息孤岛,你在上面搭多少连接只是一种表面工作,我们做多很多的工作,政府做很多的工作,表现出来的是联动的,效果如何?有的不错,还有很多肯定不用我不言自明吧。我认为根基是有时候应用从根上只解决了表面的问题,没有从深层次想问题,如果孤岛天生就是,上面怎么大也解决不了根本,导致效率不高,导致你的解决问题的处方不对。从数据层面说,市长、市领导或者是权威人士需要数据的时候,我们用一个城市级的画像,事实上北京有多少人口,或者是瞬间有多少人口,或者是经济发展等等不同的权威部门得出不同的结论,更不要说微观的参数对不上,这种现象普遍存在。为什么?我们这么多年的这些IT时代所产生的大量信息,大量数据没有有效的关联起来,从天生来说数据也是孤岛,也是划片的,没有总的需求和指向,就是盲人摸象的状态。如果每个人都要给领导汇报城市是什么样子的,肯定汇报的是局部。下一步我们就是要有效的把数据链成片,形成整体的城市级画像。
再一个从组织层面来,我学系统科学,一百年前有一个基本的原则是结构大于功能,1+1大于2。别的组织不敢说,但是政府的体制设置,孤岛就新对突出了。因为组织架构的割裂一定意义上会导致你整体的功能延伸不出来,所以我们注意到CIO的提法早在信息办时代就倡导至少十几年了。国外包括最近兄弟省市推行类似这方面的机制,我觉得这个结构层面的变革也随着北京市政府的下一步的通州搬迁有一些变革,这是第三个维度。
最后维度就是生态体系建设。这里两部分,一部分是政府自身,每个部门都在忙着自己部门的事,从来没有想过外面是谁,不是为这个部门服务,根基是为人民服务,因为为部门服务,导致全局联动不起来,目标指向不同。第二方面是政府和社会之间更没有什么生态可言了,我基本上可以说,我们和社会产业的联系发生在招投标的行为那一瞬间,招完标,有效期合作,完了之后拜拜,下次有项目再见。基本上是这样的,未来的大数据的状态决定了难以适用,必须由生态来解决生态的问题。政务大数据,或者城市大数据是一个生态的问题,必须由生态体系来支撑和解决。
怎么解决?我觉得简单梳理了这么几个方面供大家来探讨,也不一定对。第一是我们到底总需求是什么。我们作为一个政府本身我们需要的是一个整合的政府,不是各个部门割裂的政府。那么对于老百姓来讲,我本身也是老百姓,我需要的是一个整体的政府,行政审批我搞不清楚,我要的是一个统一的政府。对于社会来讲,特别强调到了开放透明,这是一个方面,延伸到IT方面,开放是把政府的系统和数据库打开,让生态的有识之士进来,让专业的人做专业的事情,这是更深层次技术的开放。只有这样书记市长所强调的城市治理,社会管理的法治、精治、共治才能依托大数据,数据治理得到辅助性的支撑和实现。
按这个策略,我们肯定北京市下一步要发展城市级的大数据或者是政务的大数据这样一个体系的近来,包括IT常说的平台数据应用等等范畴。但是这里我想说的首先要有一个的执行方略是什么。我们总结了一下是一个五线并进,三期并进的一个概念模型。这里所说的任何一个平台数据应用都是城市级的,不再是一个孤立的系统。比如说这个平台,我们希望勾勒一个,有可能是一个物理实在,也可能是一个逻辑连接。如果通过区块链的技术把政府各部门甚至政府和企业的系统勾连在一起的话,逻辑上就构成一个城市级的平台,既有功能的支撑也有生态的支撑,可能就成为一个小的虚拟社会了,大家在这个平台上共同来来做大数据的方方面面的工作。按李克强总理去年在贵阳的大数据大会上说的,咱们国家80%数据掌握在政府手中,通过我们的整合,剩下的通过和社会数据的反哺形成一个相对的融合的数据。最后是这种应用,不再是简单的应用,是生态体系作为一个环境,然后各方人士,包括政府自身包括有能力做这件事情的各方人士,共同开发各式各样的应用,优胜劣汰,形成一种优胜劣汰的环境和体系,这才是城市级的大数据的生态体系。
相关的我们有一系列的标准,首先要解决不同行业和部门怎么解决数据的呼应,首先得有一个标准。还有是政府主动的作为和社会如何形成一套能够顺应这个规律的生态体系。从我们具体的电子政务的规律来讲,是三级。包括政府各部门的打通也包括政府和各部门的打通,汇集过来之后,在这个池子里进行一系列的融合和打通,包括对政府各部门也包括对社会,可能会有一定的权限设置,但是并不影响整个打通和融合开放的总的脉络和逻辑。最后无论是政府内还是政府外都要营造适应体系运转的组织架构。从系统科学角度来讲,结构决定功能。
说到这个,回到大数据本身我们设想了这样一种场景,我称之为一个广义的大数据生命周期。如果有一个未来存在的大数据的平台,一个是政府的数据,另外一个是社会的数据。政府和社会数据。政府端正在通过共享来打通,社会端通过购买或者是置换或者是引入相关服务来获取,融入到大数据池中。输出是三种,第一种是政府自己使用,关于如何使用,我们正在制定政务资源管理使用的相关办法。另外一个是完全通过网站向社会开放,由社会自发的使用。很可能还有一种中间状态,就是某种形式有一个载体,把社会力量引进来在政府规定的范畴内开发数据应用,这里叫社会机构的进驻使用。那么横向的打通融合开放,纵向的融通应用,共同构成大数据的广义的生命周期。
这个平台本身从经信委定了这样一个目标,叫做数据落得下,管得住、用得好,带得起。我们可以设想,大家都是业内人士,当五花八门的行业的领域,数据的清洗加工构成怎样的一个融合化学变化是一个极其复杂的系统工程。更重要的是我们要把这些数据从这边的一个原始的一个物理拼凑到最终的城市仪表盘的形式呈现给领导,到最后感知这个城市。我们最终希望业界所说的现在整个信息系统都面临四个整合的问题。就是物理整合、系统整合、数据整合、服务整合。目前北京市做了政务云,马上搬通州全市一个机房,可能可以实现了。在我们的设想里面,可能通过大数据平台的建设,不仅是一个大数据的事,可能会带动整个信息化或者是电子政务体系的变革,格局会发生改变。因为数据没有边界,像水一样流动,当水生命周期形成的时候,流动起来的时候,就形成一个新的体制机制的变革,我们称之为数据治理。
围绕这样的题材,我们需要两个生态,一个是大生态,无论是政府、企业、高效、研究院所,要打造一个城市数据实验室,有效的把社会力量有机融合在一起,共同完成这样一个平台,数据和应用的工作。同时政府内部可能也有一个小生态,因为政府内部的构成极其复杂,层级非常多。我们想北京市政府马上的通州搬迁,可能会探索一些基础设施同管同用的一些相当于CIO制度的雏形,这个工作有关部门在研究之中了。
最后是城市实验室的一种场景,如果将来的政府的电子服务系统整合成逻辑上的大系统的话,市级大数据平台是后台的一个非常强有力的支撑,由它支撑的构成了一个政府的生产线,我们希望一个城市实验室和大数据形成天然的逻辑上的联系。实验室基于大数据的数据来源源不断利用各自的优势经验算法来开发各种应用和产品,在快速的反哺到我们的平台中,我们希望这个平台是自组织、自发展的迭代演进的不再是工程化的推进,已经变成我们的微信、支付宝一样迭代演进,自身成长。这个数据实验室是我们经信委包括资源中心正在和其他方面探讨的一方面,我们特别希望在落地上得到大家的一些支持和意见建议。
最后是一个小小的总结,实现三个转变。第一个是数据产权的转变。这个话题有点大,实际上就是我们要把过去数据分布在各个部门的割据的状态从根本上变成整体的行为,也可能是政府所有,也可能将来是全民所有,第一个这是所有权的改变,否则你的共享,甚至社会的交易根本就不成立。
第二是DT的驱动由逐步的应用驱动转向数据驱动。这不是数据挖掘的偏技术的微观层面,而是整个数据放在这里之后,让有识之士进来挖掘各种应用。
第三个是政府的过去的运行模式要发生改变,购买服务是一直在倡导的,那么我们希望它在量上质上有一个根本的改变,将来可能政府真的不再需要直接上手的IT系统,现在市领导反复强调的是凡是社会能做的给社会,凡是市场能做的市场。这里需要一个新的机制和环境的建设。
最后总结一下今天的报告,充分引入社会力量参与到IT建设,构建一个可持续发展的大数据体系,助力城市发展效率和质量的提升。谢谢大家。
主持人:下面请阿里巴巴集团高级研究员、技术副总裁、首席安全专家,市信息化专委会杜跃进同志演讲,题目是:大数据时代的数据安全-风险与机遇。有请。
杜跃进:谢谢主持人。我做安全接近20年的时间了,之前的十六七年做互联网的安全,尤其是应急响应,从基础设施建设,关键技术研发,到应急体系建设,我到阿里快三年了,我从体制内出来之后,看到了一些不一样的内容,这些内容也对我过去十六七年在安全领域里面的一些想法带来一些改变。其中一个最重要的变化之一就是数据安全。我到阿里之后就把数据安全作为自己最重要的工作之一,按阿里的CEO的讲法数据安全是我们的立身之本。因为大家知道马云先生在讲人类进入DT时代。你们的数据放在阿里会放心吗?会不会有人觉得有人对你的行为会看着你,阿里云是平台,丁丁是平台,你的数据在这里,不知道阿里的人会怎么样了,我们要用科学的方法来回答这些问题。
后来正好咱们国家《网络安全法》出来了,我们看到全世界对这个事情开始关注,我们把自己在数据安全领域里面的很多做法提炼出来,供政府参考。网信办曾经对几家大企业做过为期八个月的专家审查,成立了三个专家组。最后的报告阿里做的是最好的,但是我们并不满足于阿里自己做的好,我们觉得这是社会需求,甚至是政府需要的东西,我们变成国家标准,也变成国际标准。这是很少见的,我们以前是国际标准拿回来抄一抄改一改变成我们的标准,现在我们的标准不但成为国家的标准,而且同步在国际电联,在国际标准化组织立项成为国际标准。今天有机会来跟大家分享,我并不是来卖东西,只是谈想法。
大数据安全是一片混乱的,我是北京市信息化专委会的委员,我当年建议同步做安全的规划。总书记的“4.19”讲话里面有非常精准的定位,其中讲到安全和生产的关系,这是完全分不开的。大数据非常热的过程中大数据的安全也是非常热的,只不过今天的会议上有几位讲到了,但是讲的还是不够多,我还有机会讲一讲。但是中国和全世界有一个现象,什么概念?一旦很热了就会很乱,大数据安全也是这样子,各种各样的说法非常多。
用一句话来讲,我们一定程度上陷入到一定恐慌,有一些数据安全威胁大家低估了,就是比大家想象的严重。但是还有另外一些安全是大家凭空意向出来的,并且把大家吓坏了,我叫做数据恐慌。时间关系不展了,举个例子,人们把数据叫新的黄金和石油,每年产值非常大,但是徐玉事件给大家敲响了数据安全的重视程度,并且在国家的执法上面有了非常大的进步。1000亿是中国大陆地区一年网络黑灰产值至少1000亿,这个数据不同的口径的说法不一样,我还是觉得有一些口径不一定准确。这是它的产值不是它造成的危害。按照2016年我在CN做的调研的话,那时候的比例黑灰产每自己挣一块,给外面造成的损失是20块。与此同时,欧洲在出台这个GDPR,明年5月份正式实施,中国的一家企业做生意,里面有欧盟的公民导致了他的个人信息安全没有符合他的标准,就可以罚你,罚多少?2000万欧元或者是这家企业上一年全球总营收的4%,哪个高取哪个,不管这个公司在哪里。它对整个数字经济会是什么样的,对世界格局什么影响都是值得讨论。隐私保护,数据主权里面有非常多的数据关系。我在印证这张图,真的是各种各样的声音,这是法律层面的。
我们再看看学术方面,我专门从贵阳飞回来做这个报告,今天还飞回去。这个是做的一些政策、产业、学术的一些对比。学术上包含的东西非常多,不仅仅是加解密,也不仅仅是隐私保护,当然隐私保护是重要的一块。还有包括检验性的,比如说连加密的技术都没有了,数据安全怎么做。立法我们看到很多国家在20年前就有数据安全的法律,但是那时候的数据安全跟今天完全是不一样的,今天说的数据安全差不多是从2015年开始真正热起来的。2012年全国人大出过关于加强网络信息保护的决定,里面有非常好的条款,但是没有细则跟进,所以没有什么改变。刑法在不断修订过程中,确实把别人偷取个人信息的行为放在严厉的范围之内,是很好的保护。但是真正的法律上面都是从2015年、2016年开始的。我们国家的《网络安全法》2016年发布的,2017年的很多细则和实施规则都在进行中。我们跟踪和全球60多个国家的法律法规的情况,很多国家在修订20多年前的条款,为了今天的新情况出现,所以立法是热点。
产业也是热点。数据安全的产值在千亿规模,这里包括从传统的防泄露到云上的CASB,到数据库安全,到加解密,还有第三方加解密。像阿里这样知道的内生需求之外,还有外部的合规压力的需求,比如说网安法等。
标准的热点。我们国家的全国信息安全标准化技术委员会,我们看到有11项标准制定的项目,4项在研项目,4项组内研究项目跟数据安全有关系的。这些标准是什么关系,本身的梳理是挺大的难题。所以很热很热,但是我们很多人到现在可能把问题都搞错了。为什么这样讲?我们在讲的时候到底是什么,在做大数据安全标准的时候,大家在讨论四种东西跟大数据安全有关系。但是实际上大数据安全我不讲四种是什么了,结论是大数据安全不是指传统的数据安全,不是足够大了才跟大数据安全有关系,不是云计算本身的安全,不是用大数据做安全。我前段时间在成立一个大数据安全的实验室,我说这是全国第一个,他们说不对,刚刚成立一个大数据协同安全实验室,这个也是在大数据做安全。我说的是大数据本身的安全。也不是和大企业相关,那么多的泄露的例子,那么多的黑灰产,我们看大数据安全的时候,把它跟放落攻防对等起来,这是外部人员对你的攻防,现在很多是内部人员导出去的。不仅仅是防护外部窃取,也不仅仅是保护,企业也有自己的商业秘密,技术秘密需要保护,今天面临特别大的威胁。
国家的角度还有一类是重要数据,涉及到重要战略价值的数据也是要保护的。不能套用过去的标准或者是经验,现在国际上的权威部门在说,过去的标准全部都是过时的,没有地方可以抄。而我们其实必须要创新,我们走在最前面,没有人引路。真正讲的是大数据时代下的数据安全,不要被大数据欺骗了,不是说没有五个V就不是大数据安全,也不要找云计算,云计算是大数据的承载基础。真正的大数据时代,和最左边的纯粹的文本时代,搞一个保密柜和中间IT时代你的数据要国产的加密机等等都不一样,不是在磁盘里面,不是在数据库里面。今天的数据是在右边的图里面,它是各个领域流动的,你在网上随便定一个东西,举阿里,你的订单被骗子拿到了,这个数据首先商家有,然后背后的金融机构有,物流有,背后的软件供应商有,阿里的平台有,每一环节都有可能漏掉。我们有一支段对专门做生态安全,我们发现问题“止血”,人家不一定理我们。犯罪分子直接到那儿应聘工作,或者是直接在里面成批导入,我们有那么多的生态企业,能力有吗,意识够吗,他们出问题要负责吗。但是这个是拦不住的,大数据时代下数据一定是在非常复杂的业态下流动的,你不让它流动大数据是灾难,你让它流动就要解决问题。
我刚刚讲到不仅是外部的窃取,还有内部的窃取,还有对数据滥用。你总得有权限,你出了问题给阿里打电话说看看什么情况,这个员工要看你的数据,这个员工可不可以滥用权利,没事看张三李四买什么东西。可以负责地讲,我们的业务人员如果没有业务场景的滥用行为,我们会自动发现,直接开除永不录用。我们现在已经被曝光的各种各样的网络犯罪的案例,有一个黑客被抓了之后说,那是从政府部门买数据的,不知道为什么他们发现不了,这个人一天看几十条数据,但是现在持续卖上万条数据为什么发现不了。大数据也要加工的,加工过程中全生命周期会不会泄露个人隐私,因为有很多学术研究就在研究这个事情,可不可以做到让你以为是针对你的,但是这里是上万个人。可不可以在过程中不适用原始数据,使用脱敏数据。可不可以做到没有任何一个人可以直接看到数据。可以,但是需要不断完善。
大数据时代下的数据安全,比过去有非常多的挑战。我说不是IT时代的一个保护数据库,保护磁盘就OK了。大数据时代下这个磁盘在哪,分得很碎片。今天的产品更新非常频繁,不再是过去微软一年升级两次了,现在是一星期升级好多次,产品非常复杂,业务形态也非常复杂,数据深度融入业务的各个环节,而业务非常依赖一个复杂的供应链或者是生态。生态本身相互关联,猪队友的事情经常发生,比如说那边全被拖走了,老百姓有二三十个账户,你让每个账户不一样,密码不一样,怎么可能。但是这边一被拖,你让我怎么防,这叫猪队友。黑产无孔不入,左边的英文是从另外一个维度讲的不展开了。
非常关键的是平衡是根本。这里包括法律法规上面的平衡,包括技术,包括产业等等,法律法规上面,这里面其实我是刚才说我们研究了60多个国家的法律法规,还在持续研究。这里有不同的情况,有完全不管的,有需要最严格的是本地存储的,还有采集授权,看到不同的国家不一样。非常有意思的是美国很松,欧盟非常紧。中国呢?中国的制定要符合中国的条件,中国的发展阶段和我们的目标。我们的目标是要真正的实现中国梦里面的民族复兴,我们今天有非常好的机会。在这种情况下,我们的政策做不好的话,可能会把这样的机会扼杀。美国我理解它的所有的政策的制定,目标非常清楚,确定它在全球科学技术产业方面的优势,所以它的很多政策都是为了促进这个的。中国正处在这个过程中,我也不展开讲了。
其他还有很多平衡的问题,我不展开讲,跳过去,稍微到偏结论的地方。这个新的情况下,有很多新的思路引进来,总结三条。第一是技术方面是要变成以数据为中心的安全。我们过去习惯以系统为中心,看到一个个系统,一台台机器,今天是要以系统为中心。看到系统进来,一直到生命周期里面的销毁,不管在哪个产品,哪个业务环节,不管哪个人碰到它,都是在一起的。如果换成这样的思路,我们发现很多的做法会有不同的做法。
从制度设计上有很多话要讲。第一是避免一刀切,现在一下限制信息使用,就全部都限制住了,这个其实不对,这个本身并没有错,没有数据什么都没有了,数据本身并没有错,错在数据是不是被保护好了或是不是用好了或者是不是安全的。所以重心应该放在我能不能确保数据被合理安全的使用,而不是这个不能采集,这个不能采集。
第二个思路是以能力为基础,以组织为单位区别对待。我刚才讲到以数据为中心的安全不再看系统。我最后的承担法律责任的也不是系统,而是这个系统的法人,就是这个组织。可以是大企业、小企业,也可以是一个政府部门。一个大企业,一个小企业,一个政府部门手里有很多的系统,有很多的员工,有很多的业务,把它汇到一起,最后是给这个组织为单位的,这个组织的数据怎么样,用能力来衡量。不是说你是什么,而是说你到底能力怎么样,能者多劳,你的数据安全能力足够好就可以做更多的事情,更好的事情,你的数据安全能力不够好就不要碰更多的数据。用这样的方法来鼓励大家提升自己的数据安全水平。为什么?我能力好之后可以碰医疗数据,不像现在谁都在碰。老百姓选择一个服务商的时候,可不可以看到这个服务商数据安全能力非常好,成熟度水平很高,我更信任它,我更信任它的话就给它一个信息,可以放心让它做更多的事情,你不信任它,给老百姓一个警觉,这个地方很不安全,你小心一点。这就是让数据安全能力水平成为竞争力,而不是过去你要合规,它要合规。我们国家有几千万的中小企业,每一个企业都有数据,算上其他部门还有更多的,原来的方法不可行,一定要让他非常积极主动的来证明自己的能力和水平。
法律和标准我跳过去。
还有其他的问题。政府自身的公信力。你只要有价值就有小偷过来,人家还有1000招,黑灰产用大数据比我们好。政府要有公信力,数据在你的手里,你也要证明你能保护好,当政府部门找产业必须把数据给我的时候,我在想,放在你那里出事算谁的,可能会影响到消费者的信心,会影响企业的效益,这是现实问题。还有制度矛盾,比如说简单化的实名制,导致大量个人信息留在各种各样的小企业,小系统,小平台里面全部被别人偷走,我一些人的估计不知道对不对,90%以上的中国公民的信息早就在黑灰产手里了。你的身份证换了,甚至手机号都不容易换了,因为是你信用的保障。90%都流露出去了。有一些东西是跟我们的制度有关系,一个包裹要求你的收件人,发件人全写在上面。我个人鼓励后台实名,前台用EID都可以做到,可以做一些隐私面单,但是一些合作伙伴不高兴了,因为没有数据。
全球化与中国责任。我刚才讲的这个,我们阿里牵头做的叫一个数据安全能力成熟度模型。有一些人了解,有一些人不了解,成熟度是在很多领域都可以被广泛使用的理念。任何事情都可以做成熟度,把这个成熟度的的理念引进来,按数据在组织内部,数据的生命周期作为另外一个维度,按几十年安全的积累,安全跟你的组织架构的设计,有没有CIA,安全的组织和其他的组织能不能吻合,流程和制度,技术平台,人员能力这四个维度,这些东西在一起构成一个综合的模型,用它来衡量成熟度,用这个成熟度进行行业管理,让更安全的人有更多的机会,变成政府的抓手。
总结就是不同的维度有不同的看法,老百姓关注什么,政府关注什么,企业关注什么。政府的角度是你的抓手是什么,为什么马云说我们不共享数据,我们只在我们的生态里面做,原因就是没有办法保证安全,我们希望有一天数据更好的流动,前提是不要出事。政府的抓手是能力成熟度。另外两个要点,以数据为中心,以组织为单位。我们一说数据是重要资产,就开始说保护,但是我想打个比方,比如说钱,你是省钱变成富翁还是挣钱变成富翁。美国在数据领域中,日本有一个人写的数字霸权,美国的超强领域不是服务自己,美国的超强实力来自于全球化,拿到的是全球化的数据。我们中国的数据一点都不允许出去,能成为强国吗。过去的强国是自力更生是强国,未来的强国是别人依赖我。所以黄金很重要,石油很重要,但是你要想更强,你要营造一个环境让更多的数据流进来,而不是说我的数据不要出去。这里有政策和战略的事情可以重新考虑。
另外现在的世界不是说数据抓住几个大企业就行了,二八定律在这里不管用,所有的数据都需要提升数据安全水平。除了企业之外,政府部门也要高度重视这个事情,不要动不动说哪个部门张贴了一个信息公开的什么事情,类似奖学金什么就被人吐槽,一点脱敏的意识都没有,个人信息泄露了。或者是哪天信息出来说黑客透露信息。最后一个是机不可失。今天中国企业走到国际上受到非常多的制约,虽然一个CC标准把我们治的非常惨,我们没有什么办法,一种办法是学人家的规则,还有一个是创建新领域,制造新规范,让别人跟着我们。这个领域里面大数据应用和安全就是最好的机会,因为大数据的应用里面我们的创新是在最前面的,因此我们遇到的安全问题也一定是全世界最复杂的。只要我们敢于承担起来,并且有这样的战略意识,我们把这种东西变成一个新领域,因为这个领域所有人也会进来,其他国家也会进来,我们率先在这个领域走出新路,制定新规则,比过去还会更好一点,这也是我们的标准要跑到国际长推,也是有这个含义在里面。谢谢大家。
主持人:下面一位演讲嘉宾是来自百度云首席数据科学家沈志勇先生。他演讲的题目是:从互联网到传统行业的数据智能问题。有请。
沈志勇:各位领导、各位专家,大家下午好!我接下来分享一下数据应用的成果。我简单介绍一下我自己,我在百度五年时间,只干了半年的数据的时候,另外四年是大数据的技术,第二个是大数据的资源怎么样应用到其他的传统行业里面去。所以我的标题是怎么样把数据这一块,包括人工智能怎么进行迁移。
首先我会介绍一下大数据在互联网公司是怎么用的。然后是行业的应用案例,因为我在四年多的时间里面,尝试跟可能现在将近十个行业看,到底我们的数据资源和数据技术到底怎么能用,积累了很多的案例,今天主要是从案例出发,希望给大家在数据怎么用方面有一些启发。最后的话我讲一下在整个过程中的一些经验总结和挑战的一些总结。
我们大家都在讲互联网+或者是别的词,其实是想用互联网的优势,我个人觉得羊毛出在猪身上,狗去买单,不是互联网的优势。我个人总结的是虚拟世界的互联互通,这样的话我们做的事情不会受物理空间的限制,有无限的可扩展性和爆发力,所以很多人喜欢互联网行业创业,一下子爆发特别大。还有一个是互联网公司互联互通之后自然带来的结果是可以打大通量的撮合。百度就是在做这样的撮合。还有是互联网产品或者是设计在迭代的时候也是数据驱动的,基于用户的反馈,我们会指导我们的产品设置。前面提到的是互联网的本质的东西,后面的是所谓的大数据和数据的算法。
第一个是怎么大通量的撮合和优选。我怎么解决信息爆炸的问题,更重要的是解决一个资源优化配置的问题。你撮合好了以后,你选择好了以后,你的资源是优化配置。这个时候大家每天都在用移动互联网或者是PC互联网的话都会接触到这些工具,一个搜索引擎,第二个是互联网广告,还有推荐系统。这三个大体上原理逻辑大同小异,但是有一些小的区别。像搜索引擎是用户主动表达想要什么我给你,互联网广告和推荐系统都是被动的,你没有表达广告就过来了。但是这两个有优化的目标。互联网广告优化的是收益,可能是所有参与者某一方的参与,推荐系统是优化用户的体验,希望用户舒服,有一种你懂我这样一种体验。背后列的是一些技术,这个场合不展开讲了。但是有一点就是里面离不开大数据技术,让千人千面看到的东西不一样,有一种好的体验,典型的是用户画像。
这是互联网最典型的大数据的工具,它会把人打一些标签,是对人进行一个全维度的描述。里面包含了我们叫人口学的标签,性别、年龄、职业,还有兴趣标签,喜欢什么,吃什么,喜欢看什么,这里面有商业价值。还有一些地域性的,也属于人口性的,你打完标签之后,你会让你的产品设计更贴近人的使用习惯,更加得心应手,主要是这样的目的。营销环节也有这样的应用,就是我给你推送喜欢的东西,你接受程度会高一些。这是互联网公司怎么样做优选和撮合的重要的工具。
另外一个是用数据驱动产品的那个迭代,去驱动产品的设计。这里面有两个环,一个是直接利用用户的反馈,第二个是利用产品在使用过程中用户的数据,做一些挖掘得到结论,我们一般叫知识,再来优化产品的设计,设计产品的新功能或者是哪些功能要去掉。我后面大的不讲了,小的讲一下,就是最简单的迭代方式就是AB测试。互联网在虚拟空间,用户之间是独立的,我通过这个方式做产品的优选,这里有两个方案,不知道哪个好,很简单两种方案同时用,用一个礼拜之后,我看哪个网页下面的KPI高,将来就用这个,这就是AB测试,非常简单,非常直接。
大家有疑问为什么是一周?因为互联网的东西往往是一周,里面有周期性,有天的周期性,有周的周期性,有年的周期性。一般用周适中,天不够表现,年太久。互联网经常是以周为单位的,两周或者是一个月出一个新版本。现实世界最典型的是车,一个车是一年一款,这就是产品迭代的速度就不一样了。互联网产品能更快的适应用户的需求,这是另外一个优势,用数据旭东的方式迭代产品。
这个迭代会带来一些好处,你会反复听到用户这个词,是以用户为核心的,做产品的时候一般是服务用户,而不是管理用户的心态。而且你会发现这种产品出来的话,它不需要一个培训,大家用以前传统的软件的时候,你会感觉这个东西要培训才能用,ERP这种东西,像互联网产品没有一个产品要培训才能用,如果有不能流行。还有一个是时效性,最后一个是精准营销,因为很懂用户。
刚才讲的是部分的互联网的优势,这个优势怎么到行业呢?这里我大概分了一下,我自己拍脑子想的,首先是模式的迁移,互联网+很多在提模式的迁移,像O2O也好,你发现都是线下的东西往线上拖,但是撮合的过程在线上,但是别的还在线下。还有是能力的迁移,怎么迁移到企业里面去,这个云计算,就是我所我在的百度云所在的部门就有一个典型。还有一种直接自己变成一个互联网就行了,那就是万物互联。这一块是物联网在起作用,这个东西周期更长一些。目前主导的还是模式和云计算,尤其我们发现云计算越来越火了。
现在大数据在提,人工智能也在提,但是这两方面还是相辅相成的。现在还是深度学习这一套,背后需要非常多的数据训练模型,因为是非常复杂的模型。有人提出目前的人工智能算法还是举四反一的思维,还不是像人举一反三的思维。还有一个是人工智能也带来大数据的发展。我们在互联网里面一般用的是日至数据,机器一条条打下来的数据,就然后工业界或者是现实环境里面用一些传感器的数据,这个比如说ICU病房,病人的很多指标以时间序列存下来。但是还有一类数据以前不直接拿来用,有了人工智能以后,语音识别和图象识别让原来多媒体的数据也能被电脑读取使用了,增加了数据使用的维度、广度和深度。这是大概的这样一个意思。
我大概讲了一下在互联网公司怎么用也讲的怎么迁移的。因为我个人做的比较多的案例,这四年来重点的就是一会儿会看到金融医疗等等都做过一些,所以一个个讲一下。主要利用的还是百度的数据和百度的技术。
首先我讲金融行业。它是所有行业里面我个人觉得信息化程度除了互联网公司它是最高的了,它里面什么东西都是电子化和无纸化了。比如说理财产品的精准营销,还有非常重要的是我觉得大数据在金融应用的多的是风险控制,反欺诈,征信。还有数据参考,金融里面有量化数据,怎么把舆情数据或者是别的数据加工完之后给基金经理做参考,或者我们直接用数据发一些指数类基金的产品,都是可以的。因为里面很多内容不可能一一列举,时髦的方式是另类数据。它的意思就是说我能不能通过一个别的,大家听到美国有一个对冲基金,用一些摇杆数据拍一些船的状况,拍工厂的冒烟的状况,拍种植的情况去买卖期货。我们互联网也可以做这个。这是我2013年的时候当时看百度里面的搜索数据和上证指数的关系,这是某几个词,一个是空盘,你会发现蓝线是三日均线,你会发现有强大的关联性。其实当时我们利用这个东西可以做。还有一个是搜索数据发现当一个股票名字搜索量上升的时候,下跌的概率非常大,就是有这样一些微妙的东西。
还有一个是二级市场的做法,这是我同事当时做的方式,我们去监控一个企业的用工量或者是商业性企业的客流量,就可以知道运行的某些指标,你的招工的数量反映了你的某些指标,你的客流量反映了你的业务量。这个里面可以做一些对企业的债务的风控等等的事情。
另外做的比较深的零售。大家都知道电商在国内发展的如火如荼,但是真正零售占比百分之十几,百分之八十多还是线下进行的。而且商场形成了很重要的一部分。我2014年、2015年做这些事情,怎么帮百货大楼做顾客的理解,提高个性化的精准营销或者服务。这个事情做的时候有很大的困难,因为商场一般对货非常了解,但是对它的顾客这一侧没有了解。我们想用互联网补充去做一些精准营销的东西。所用的方法是一般在线上有什么样的行为的人,搜索行为也好,浏览行为也好,在线下会产生什么样的购买行为,会产生一个关联。大家都知道乐友这个母婴类宾派,我们对销售数据和搜索数据关联以后发现,乐友这个品牌跟大概三个搜索的类别有关系,我们会把用户的搜索兴趣聚类。第一个你会发现都是孕产期的搜索,包括哺乳期、新生儿,第二是跟亲子类有关系的,就是家里孩子上幼儿园,或者是小学一二年级的。第三个是稍微有点看不懂了,又有旅游的,又有汽车的,又有北京附近泡温泉的。这代表了乐友的人群购买能力或者是财务水平,针对这些人群去推营销的话,问题不大。
我们当时跟一个商场合作,原来短信是本店五周年庆,全场商品两折起。但是我们后来变成本店五周年庆,某某产品两折起。这时候你发现转化率变多了,整体的流量大概提升20%,就起到这样一个作用。
第三块是因为在座的都是北京市的各级领导,我们提到了对人可以聚类,其实百度里面也有百度地图里面也有非常多的数据,你会发现我们左边的图还是搜索兴趣路别,里面有一些车的兴趣类,还有旅游的兴趣类,还有高档车、低档车,短途游等。另外一个是每个黑点表示了用户家庭的住址GDP的分布。我们对这些点进行了空间的聚类,我们分成了几个聚集区域,可能是一个城中村,或者是几个小区。我们从右往左划箭头,你知道一个规定区域的人他们关心什么,每天脑子里琢磨什么,另外是是什么东西的人住在哪儿。我们在密云这个县的地图上大概跑了一下我刚才提到的这种方式,首先我们把密云人口的居住情况进行了区域的划分,密云大家可能有领导在,我说出来如果错的话请指正。右上角是比较老的城区,中间是主力人群,左下角是城中村。首先我们看左下角的人比较多的是搜基础的电子产品,这个还没感觉。他们还有很多人在这个区域,你会发现那个柱子表示这个地区跟别的地区的强度,不是别的地区没有这个搜索,是这个地区相对多点。这点是求职的类别。再往下看,他们的娱乐手段是看一些网络小说,而且小说看上去比较LOW,再往上看,这可能是一个答案了,这部分人还在找北京附近的一些省份或者城市的火车票信息。就是我们根据前面的一个规划处一个轮廓,他们是北京周边的身份,进不了主城区,在密云落脚,购买基本的生活产品,他们每天的娱乐不是很丰富,看看手机的小说,他们还在找工作。
我们在看主城区的人,他们的车像奥迪、丰田、宝马,城中村的人也在搜车,档次低一些,在搜二手车等等。主城区的人娱乐手段是什么?他们主要是在整天想着去哪儿旅游,这个旅游类别在主城区的需求更多一些。然后再看教育。主要是老城区也没有,城中村也没有,中心城区的人有。
右上角的你发现搜索的是跟健康有关的东西,跟疾病医疗相关的信息。我们通过这个手段可以把一个区域这些人,我列举了一些兴趣类别,其实可以分更多的类别出来,大家都知道自己搜什么,会体现出来什么,大概知道整个区的人在干什么,想什么。
我们还跟医疗行业做过合作,我们是跟疾控中心合作。大家知道,我们通过搜索里面判断一个病是不是流行,程度怎么样,将来怎么发展做一个预测。这个流感是比较常见的,这是一个例子,我们在当时毕节地区有一个手足口病的突然爆发,当时我们跟CDC联系,他们说还没有人报告,但是他们相信我派人下去发现爆发了。个体人我们也做一些比如说跟糖尿病的研究人员合作,我们发现互联网体现出来的对人的生活习惯刻划可以帮助他们描述病的成因。我们发现糖尿病人在百度上面表示出来对隐私的偏好,对饮食的偏好,对运动的偏好,糖尿病是一个富贵病,糖尿病的基因的原因很好找,但是问卷的方式医院不好找,在网络上相对更可靠。
这个是在旅游上的,这是2013年做的事情,大家只看两条线,一条是红色线,当时是北京旅游委给我们的八大处的旅游人数,你会发现有一个爆发式人流高峰,政府旅游管理部门挺忌讳的,因为人数太多带来管理的不方便。我们只能永远是数据很难预测出来,因为突发事件,是举行一个法会了,这时候我们发现百度搜索能帮上忙,里面有一条蓝线,里面也有一个峰,这个出现在红线之前。他们要在八大处之前去网上调研,怎么去,门票多少钱,哪儿能停车。这样可以拿来做预警。
另外跟旅游有关系的,大家都知道上海外滩的踩踏事件,这里面我们分别对比了国庆节、中秋节和元旦出事地点的一个方向的峰值图。大家知道外滩是南北走向的,主要以这个为主的话基本正常,前面两个基本上是国庆节和中秋节的人流走向,基本上是南北走向。但是元旦可以看到,人流就比较乱了,从比例来看。下面那个是我们对这种局部的或者高时效的也能预警吗?下面体现的是搜索量和实时的对比。上海人们去外滩的话,也会去百度地图搜索,怎么去,这种搜索会提前到他去的一个半小时,这也可以起到一定的预警价值。
还有体育,当时玩票做了一下,比如说这是足球的数据,他们传球的网络数据,北京有国安,我们比较关心,当时我们把足球的传球数据弄下来,找下面的固定的战术配合,用机器学习的方式来找。这是防守的配合,谁跟谁配合阵容,一般的放手发生在哪个位置用热力图画出来,哪些球员参与,防守成功率也可以数出来。这是当时做了一个体育大数据的事情。
还有教育。这是学生做错题的举证。每一行代表一个学生,每一列代表一个题目,这行这一列是一黑块的话,表示学生做错了。本来这个举证是乱七八糟的,因为每个学生做错题还是有一定的随机性的,我们对他进行一定的数据挖掘的方式,对行和列都进行了一定的排序,之后你会发现一个雪花瓶变成了这样的样子,里面有大黑块,这是有意义的。比如说中间这一块大家觉得是什么意思,表示的是这部分学生容易做错这些题,因为这他一块都错了,你仔细看会发现,这些学生都来自于同一个班,这些题都来自同两堂课,也就是教学出问题了,导致所有的学生没做好。竖的这一列是什么意思?这些题比较难,很多学生都容易错。最下面的横的是这些学生成绩一般,什么题都容易错。你要把原始数据放出来就是一个雪花瓶,但是挖掘出来之后就能看出问题,因材施教。
另外是舆情监测。我们不单有新闻数据,还知道老百姓关心什么,这一块我们可以对新闻的被关心程度有一个评估。
另外是智能制造。这个我大概也是在2015年做的比较多一些,我这里面举了一个例子,就是智能制造的核心环节就是故障预警,能不能预警的过程中采集一些预警的信息,一些指标性的数据回来,能不能根据这些信息判断将来会不会坏掉,或者是不远的将来会不会坏掉,这是一个风电企业给我们的风机的数据。说你提前一天告诉我后天会坏,因为我得派人出去修上,否则停在那边也不好,第二个是一旦坏了会产生物理性的损伤,所以希望提前修理。这个问题很简单,是能不能用历史上的数据去判断后天的时间区间里面会不会发生某种事件,这是机器分类的问题。我们做了之后发现这样一个结果,有常见的故障,越是常见的故障通过机器判断越准。一般常见的故障提高90%的准确是没有问题的。
刚才有一些案例,还有一些别的跟政府的关系不是特别大,最后我讲一下总结。做的所有过程中,我跟采金子的过程进行了简单的类比,这个也不是我挖掘的。首先解决一个问题,就是希望数据驱动解决问题,首先要定位数据源在哪里。相当于所有的山里都有金子,只不过要找到富矿,节省我的时间和精力。第二个是原始数据不能直接用,并不是用模型做的,这个数据要把它变成模型可以用的数据,你需要一些数据预数据,这个跟采矿很像,冶炼是技术含量最高的,就跟现在的建模一样的。最后是忽略的一点,最后出来的结果是要给普通人看的,要让有一个友好的可理解的界面去做。不能说一个金块拿来直接到店里,但是大部分还是打造成首饰让大家用。所以会存在数据科学家的环节来统筹。
我们发现在做的过程中人才是非常大的瓶颈,因为现在有很多的公司在创业,你会发现他们最大的痛苦是招人太难,这一块怎么样有一个好的人才的培养或者是引进的机制,这是非常大的挑战。第二个是大数据隐私,刚才前面老师提到的安全或者是隐私的问题,如果这时候没有一个好的机制的话,很容易就一抓就死,一放就乱,怎么样让大家在一定的法规的情况下,充分的发挥大数据的价值,这一块也需要咱们政府来主导。还有是大数据与信息化的关系。其实产业的发展过程首先是信息化,然后再是数据驱动,最后是智能化。大数据是以信息化为基础的,现在很多地方要用大数据,首先得看你是不是用电脑做事情,第二个是电脑连起来了吗。第三个是你的电脑和别人连起来了吗,很多时候你得先问这几个问题才能发现这些事情能不能做。再一个是大数据和人工智能。这个我首先个人长期以来一直在做大数据,前一两年摇身一变说我自己做人工智能,而且人工智能也是我们公司的方向。我要提人工智能非常火,但是不能忘了大数据。第一个是数据是基础,第二个是数据驱动还没做好,这个阶段还没完成,不能一下子直接进下一个阶段。这是我大概的想法,谢谢大家。
主持人:下面请今天最后一位演讲嘉宾北京摩拜科技有限公司副总裁,中国社科院博士后崔书锋同志演讲,题目是:共享出行大数据,在城市治理中的应用探索。下面请崔书锋同志。
崔书锋:非常感谢大家,现在时间不早了,我提高效率使大家尽早的休息放松一下。今天下午过来也是一个学习的机会,本身摩拜总部在北京,给大家一些参考。主要是三点,第一个是看一下城市的出行方。首先我们个人以前是两部分,私人出行和公共出行。虽然共享经济的出现,出现了网约车、共享单车也可以分成私人出行、公共出行和共享出行。到公共我们公交、地铁、出租车,当时轻轨也可以到地铁里面。第三部分是共享出行。这里面我着重想说共享单车。
我们看一个数据,北京公交和地铁出行每天的量应该是千万级的量,出租车大概是200万次的量,我们自己的统计北京市的摩拜单车的出行量大概是400万人次左右。也就是说它已经在北京市来讲的话,已经超过了出租车,差不多是在一个跟公交地铁是一个第三位的出行的方式,这是在北京。那我们看上海,看广州,看深圳,看其他城市,大概看下来的话,那么共享单车,摩拜本身它也是仅次于公交和地铁的第三大的出行方式。并且这种单车的出行跟公交地铁什么关系,是一个互补关系。我们以上海为例,上海单车50%的使用是发生在地铁和公交的站附近的。它是把地铁和公交做了一个更细化的衔接,把最后一公里的问题解决了。单车投放以后,其实城市的居民用地铁出行的上座率提升了,私家车的出行下降了。也就是说促进了更多的人不开车去坐地铁,坐公交。今天下午在工信部开会,说好多领导以前开车,现在说我去锻炼和健身,短途不开车了,骑单车5分钟,8分钟到了,开车还堵还绕,改变了出行的方式。
骑行对城市的量的一个例子。最右边是东直门,左边是西直门。这跟公交地铁出行的焦点是重合的,这个重合说明什么?说明是有一定规律可寻的。如果用这样一个大数据看成是规划的话,就可以在这样的地区规划更多的一个慢行系统。这个慢行系统打通了城市的毛细血管,为什么堵车?我们的三环、四环都很宽,但还会堵车。就是毛细血管,我在三环下来之后没出去,如果有更多的慢行系统,让公交地铁出来之后有单车,把这个打通,这可能是很重要的一个贡献的方面。依据这个我们的公交地铁可以做一个调度,在这些点什么时间段有多大量的人流出现,我们相应的公交会有一个增量,也会缓解堵车。实际上大家说走建国门、西直门白天晚上都堵,晚上12点从西直门走还在堵,这就是你的规划系统可能是需要做进一步的优化。
这是一个什么?这应该是我们在上海投放的第一辆车,无故障的运行了一年,这个是一个动态的图,这里播放不了。简单说,这个车看了它一年在整个上海市从东北、西南向市区汇集,再回到东北西南,被1975个人骑了,骑了2000多次,跑了4850公里。这实际上给城市交通提供了什么?提供了更多的一个机会,更少的汽车的使用,为每个人提供便利。这是一辆单车。如果全国有700万的单车的话,你想700万辆车一年下来会有多少里程,我们算了一下,相当于人类往返月球33次的距离。这个摩拜单车一年的骑行相当于往返月球33次,节省的资源和能源的价值也是很大的。
这个图是什么意思?我们用后台的数据来看,即使是同一个地铁站,不同的出口,用车量和人流也是不一样的,可能这个地方A口和B口相对人多,你看C和D,D1和D2人少,我们会根据这些情况,把车放在A口和B口,而不是在D,可能D人很少。这是个事例,很多的公交站,居民区的周围也有这个问题,可能很多人愿意走南门,不愿意走西门,那你在南门多布一些,西门少放一些。
这个我们看到老百姓把车停在路边,需要我们把车进行角度,收集放在一个冀中的地方供大家找。找车的路线,从大数据看你可以规划一个道路,就是沿着这个红线去走,你会用最少的运力把最多的车汇集起来以后放在集中的需求点,而不是一个人这儿找,那儿找,大数据会告诉你,你按这个找,会最快的把它汇集起来。
这个是一个什么?是我们跟生态有关的,摩拜的车是一个智能锁,24小时不间断供电,怎么解决供电?一种方式是车框里的太阳能板,只要是见光或者是弱光就可以供电,不需要外接电源。第二是只要被骑,这个锁就会被充电,我们想象以后可以接个USB给手机充电,甚至以后我们的锁里面加一个芯片可以看到这个车所在的地方的气象,阴晴,温度,风速,如果再加一个感应的终端,可以看到骑车人的血压、心跳、脉搏,一辆单车是一个物联网的终端,给老百姓提供的是各种各样的服务,也给政府管理社会,你要知道这个地方的实时的天气,周围环境,其实单车都可以解决,只要加一个模块组,我们跟气象局沟通过,可以开发一个系统,你就可以看到北京市单车的地方此时此刻的天气的情况,对我们城市的管理也是有帮助的。
这是刚才我说的全国骑行总距离56亿公里,实际上我刚才保守了往返月球3300次,这是根据骑行的距离和轨迹做了一个简单的分析,单车投放之后私家车的出行次数减少了55%,这不是全国性的数据,这是根据用户的调查之后的一个结果。这个可以表示说,我单车投放之后很多的私家车车主更倾向于少开车,多乘坐公交地铁和单车的模式。通过56亿公里的骑行,去年一年相当于减少了126万吨的碳排放。其实城市的碳排放,城市的压力就被减轻了。也相当于35万辆汽车的出行的碳排放量。
我们有一个后台是基于大数据和人工智能网的平台,叫AI。可以让你智能投放车辆,智能调动车辆,精准掌握一个供需的配合,哪个地方有更大的需求就更多的投放,这也是我们估计侧的结构改革,这是基于大数据的分析和技术给出的一个。另外可以看到哪辆车在全球的分布和电量不足了,这个时候后台会显示标红,这个时候我们的整个的运维系统可以根据大数据提示到那个位置把车找到,说需要充电和是需要维修,还是需要怎么处理,是可以随时解决问题的概念。
第三是引导我们智能停放。我们有两个个围栏,一个是禁停围栏,你政府只要画出这个区域,用户骑到这个区域我们会提醒用户这是禁停的,可能面临罚款。如果还不行,你骑进去的话,放在那个地方,你的车落不了锁,意味着你一直要缴费,这个是可以技术上解决禁停的问题。另外是鼓励停放,我们希望停在一个指定的位置,这个区域是绿色的,你停进去可以拿到购物分,优惠,甚至鼓励红包,包括我们自己做和我们和第三方的企业以社会公益的形式来做,这个其实互联网在这个领域的玩法是很多的。
我们还联合了清华、同济、交通部的公路科学院和北京市的规划设计院搞了一个共享出行城市出行的研究院,我们做了一系列的研究,也是说城市治理的,形成了几个报告。一个是共享单车城市发展的百皮书,还有是摩拜的可持续发展指数,还有一个是信用指数,每个用户都有一个信用分,根据你的骑行数据,规范数据,这个人一贯是停放规范,骑行的速度也可以看得到,骑行在公交道还是自行车道还是人行道,这样做是给大家一个鼓励。这个做的是盲区的一个覆盖,这是在上海,这是浦东,那个是浦西的。什么叫盲区?我出了地铁下了公交车500米之内找不到其他的地铁站或者是公交站,我们界定为公共交通的盲区。我们根据这个数据看到后台的盲区,我们重点投放了我们的车,投放了之后第三张图是500米内可以找到一个单车去到下一个地铁站或者是公交车。浦西基本消除盲区了,浦东还有一些。包括深圳、广州,都可以把它消除掉。
这是一个骑行的可达圈。什么意思?我们以前在传统地铁周边800米,我们认为是一个地铁的周边,我走过去可能接受,但是有了单车之后,3000米骑过去,相当于800米走过去的时间,就把你城市的TOD的拓宽了,我周围3000米都可以布局商业和消费,布局娱乐都可以,这是我们跟市行做的一个研究,把TOD的距离从800米延伸到3000米,这对城市的规划,规划你的基础设施和商业也好,大大把距离向外推了。
这张图是跟我们的高德地图追踪了一个CBD高峰的指数。我们投了4000辆车,我们再看这个区域,用户的指数下降了16%,它的车速上升从21公里到24.36公里,说明有更多的人不开车了,所以说用户降低了,车速奖励了,这是一个实证的数据。
我们再看广州的黑车,因为广州的地铁公交,外地人都知道有黑摩的,有黑车,黑车一个是不安全,再一个是还会有一些抢劫的因素发生。广州市也在打击,派警力去抓,一抓人就跑了。我们的单车投放之后就好办了,开始是黑车司机收入的下降,挣不到钱了,转行干别的去了。意味着这种城市的顽疾可能是打不尽的,有需求,而你通过手段把这些需求解决了,现在在广州基本上黑车的这种运行已经很少了,因为黑车造成的事故也在下降,包括五类车的收入也下降70%,整体上交通事故也降了22%,这是我们的一个数据的展示。
最后给大家提示一下,数据交通可以做什么。第一个是测量多种交通流量,辅助交通路口的管制优化。可以看到哪个时间人流密集,你可以把那个路口的东西的灯延长,南北的灯可以缩短,这是对交通管制的一个应用。第二个是根据停车特征和需求来优化停车设置。这就可以规划停车场,包括单车的和汽车的,可以更多的优化一些,让大家有车可停就减少拥堵。第三个是辅助自行车道及自行车停车点的布局。好多地方有骑行需求,没有车道,就挤占人行道和机动车道,机动车道有风险,比如说人行道有老人、小孩也可能发生危险,你可以根据这个规划自行车道。第二排的第一张图是监测重点地区的人流量,避免安全事故的发生。比如说某一时间段向西单、王府井聚集,甚至天安门聚集,你要考虑采取一个措施。包括两会期间上访的有一个东北的,在一个酒店晚上骑单车走了,有关部门说得帮我找到,我说我不能把隐私泄露给第三方,我们按法律规定可以提供这些数据,我可以找到这个人把车停到什么地方,后来确实找到了,这是我们依法提供,而不是擅自的泄露用户隐私。第五张图是引导城市设计,引导公共空间的合理布局。可以看到周围的温度,噪音、风速,这些测定之后,你可以把这个区域的空间布局,应该怎么时间可以更加优化,这是一个城市建设的问题,城市规划的问题。最后一个是评估政策对人流和交通的改善的有效性。我们做了那么多的信号灯、慢行道、停车场,我们可以回过头看看这个地方的拥堵,这个地方的人流,这个地方的秩序是不是改善了,可以作为一个城市规划的一个方案的检测来看这个东西。
我简单介绍这么多,其实总体来看,我个人感觉整个智慧城市是一个生态系统,这个生态系统要把城市的公共交通和共享交通打通,这个基础上把数据整合做深度挖掘,既支持我们的交通,又不仅仅服务于交通,它这个终端物联网,这个车上可以加载更多的模块,可以服务于社会管理,更多的服务于公共管理,服务于个性化的需求,对个人对企业对政府我们希望能实现一个多赢的结果。谢谢大家。
主持人:感谢今天演讲的各位专家,也特别感谢到现在还在认真听讲的咱们各位信息化战线上的朋友们,今天我们用一下午的时间围绕着贯彻党的十九大精神,引领新时代智慧发展的主题,共同探讨了新时代信息化面临的一些新课题,新技术,还有一些新应用。当前正好到了年底的时候了,各个部门各个单位可能都在规划明年的工作,那么刚才我们经信委刘旭处长已经跟大家简要地透露一个消息,市委市政府决定明年信息化工作的最重要的主题,最核心的任务就是大数据的汇聚和应用,所以我也希望大家从今天我们专家研讨会上我们学习到的一些新思想,新精神,新技术,能够应用到我们工作当中去,推动我们明年全市的智慧城市建设能的取得新的进步。今天的研讨会到此结束,谢谢大家。