您的位置 首页 > 数码极客

【ai解锁】用深度学习为自动驾驶汽车构建大脑,Drive.ai解锁雨夜穿行新技能

今年2月,长期隐身的自动驾驶汽车技术开发公司Drive.ai悠然上线,发布了约4分钟长的视频。

视频中,一辆测试汽车在雨夜中穿行过美国加利福尼亚州山景城(Mountain View)的街道,全程驾驶员的双手都没有碰过方向盘上,没有任何干预动作。

我们找到Drive.ai的联合创始人王弢,和他聊了聊Drive.ai背后的设计理念和核心技术。

Drive.ai想为商业车队提供包括传感器组合、控制系统和车内外交互界面在内的后装套件,实现特定路线(如外卖、出租车等)的L4级别自动驾驶(即在任何情况下都不需要人工干预)。

感知方面,Drive.ai后装套件中的传感器包括多个摄像头、雷达和激光雷达,这样的组合可以在某一传感器出现错误或故障的情况下提供一定冗余度,譬如摄像头和雷达可以在雨雪雾等极端天气中精度严重下降的激光雷达提供环境感知。值得一提的是,大部分自动驾驶技术提供商采用高精度地图来弥补传感器缺陷、为自动驾驶提供数据支持路线规划,而Drive.ai则想避免使用维护和运营成本很高、且临时变量不可控的高精度地图,目前使用的是自己收集数据生成的、不包含3D空间内物体信息的2D地图,未来会和第三方地图供应商合作。

决策方面,不同于一些起步较早、技术路线基于传统机器人学的自动驾驶技术提供商,Drive.ai使用的是基于非规则学习的深度学习网络模型,这有三项优势。其一,场景泛化。规则学习虽然可以快速建立起应对八九成场景的决策系统,面对新的和罕见的情况却很难可靠应对;非规则学习的泛化能力让它可以更好地即时理解数据并解决此类长尾问题。其二,复杂决策。大量算例支持下的非规则学习有复杂决策方面的优势,这已经在AlphaGo等深度学习程序中体现出来。未来会有很长一段时间,路面上会有自动驾驶车辆和人工驾驶车辆共存,而自动驾驶所需的复杂决策(是否超车、变道等等)与围棋相似——基于对方的动作,进行自己的下一步动作,合理地获得路权。其三,硬件需求。自动驾驶过程中,传感器每小时会采集几十GB的数据流,存储和计算都是很大的挑战。利用非规则学习而非现成的知识库进行决策,对计算芯片的效能要求相对较低,在计算能力相当于个人电脑的车载设备上即可完成核心数据处理。

非规则学习的核心、也是进展难点,是海量标注的数据,以及海量的实验试错。Drive.ai的数据源包括采集车收集的真实数据,和模拟器生成的各种场景(包含极端情况)的模拟数据。对这些场景中出现的物体(如车辆、行人、自行车等)进行标注,是个技术瓶颈——每小时车程收集的数据需要800个小时的人工标注,而王弢告诉36氪,Drive.ai利用自己的标注系统来进行半自动的识别和标注,比其他公司快20倍,能够在短时间内提取到更多有用的数据。在实验方面,Drive.ai的团队同样有较多积累。譬如在使用大规模显卡(CPU+GPU)集群进行大规模神经网络训练方面,Drive.ai就拥有市面上最快的大规模并行计算软硬件基础架构。此前谷歌曾使用千余台机器完成了当时世界最大的深度学习神经网络,Drive.ai彼时在斯坦福的团队用16台机器、十分之一的成本实现了重建。

非规则学习的问题在于算法不可解释:“端到端”的训练中,策略规划有不透明的区域,原理和机制并不明确(“黑盒”)。针对这个问题,Drive.ai采用的是当下学界主流的生成式对抗网络(GANs),将完整的端到端系统拆分开来,在涵盖绝大多数场景的标准化测试机上,对决策机制的不同部分进行验证和测试。

在实现自动驾驶功能之外,Drive.ai认为自动驾驶车辆与其他通勤者的沟通同样重要,因此设计了包括LED显示屏和声音系统来向行人和自行车示意自己的行为。这些人车交互(HRI, human-robot interaction)部分的设计还在持续开发中。

Drive.ai在车顶安装了一块LED显示屏,用于向行人和其他驾驶者传递文字信息和emoji表情。

已经获得美国加州无人驾驶路测执照的Drive.ai,现处于路测阶段。虽然demo中表现很好,但从样车测试到产品落地还有一段路要走。落地中常见的成本过高和场景拓展性低等问题,Drive.ai应该能较好应对——Drive.ai的套件在成本上控制严格,传感器以低价摄像头和雷达为主,高价的激光雷达使用较少,并规避了运维成本高的高精地图;此外,非规则学习算法也提升了L4技术可运用场景的可拓展性。

公司还未正式进入商业化运营,但今年会进行和一些第三方运输服务提供商的试运营(约数十至百辆车),在固定路线上进行L4级别的自动驾驶,期间会进行人为监督。这些预设行驶路线上的乘客和货物的运输,将初步证明其技术的可靠性。同时,Drive.ai也向一些车厂提供L2-L3级别的技术,实现初步的商业化。目前暂时不方便透露关于合作对象的更多信息。

Drive.ai的创始团队。

麦肯锡和彭博新能源经济资讯联合发布报告称,2030年高级别自动驾驶汽车(L3和L4)将达到整体销量的50%,其中L4级别的市场规模达到5500万辆至6000万量。鉴于自动驾驶的发展方向将是toB主导——运营商统一管理自动驾驶汽车,提供去人力化的端到端运输解决方案——这五千多万辆车,就是面向商用车队的Drive.ai的下游市场。

这个市场上选手云集。想要向商用车和乘用车提供L4级别自动驾驶技术Drive.ai的竞争对手,既有拥有造车经验的传统整车厂,又有财力人力和技术皆储备雄厚的科技巨头,还有其他初创公司。这5500至6000万辆车中,去掉谷歌、特斯拉、百度、沃尔沃、宝马等自主研发的车,剩下的有多少会搭载Drive.ai的解决方案,取决于Drive.ai能否比通用收购的Cruise Automation、福特收购的Argo AI、专注出租车的nuTonomy、专注物流商用车的Otto和图森等等自动驾驶技术提供商,更早推出低成本且安全可靠的整体解决方案。

公司共有大约50位员工,其中以技术人员为主。Drive.ai的核心团队来自斯坦福大学人工智能实验室,对自然语言处理、计算机视觉和自动驾驶等领域的深度学习有丰富经验。其中,公司CEO Sameep Tandon来自斯坦福大学的人工智能实验室,负责自动驾驶车辆深度学习方向的研究;COO Fred Rosenzweig曾在硅谷多家初创公司担任CEO;总裁Carol Reiley在机器人领域有超过15年的经验,并拥有六项技术专利。值得一提的是她另一个身份——人工智能和机器学习领域国际上最权威的学者之一、今日宣布离职的百度首席科学家吴恩达的妻子。“开启自己在人工智能领域的新篇章”的具体指向,很有可能就是他一直热爱并专长、在百度却始终无缘掌舵的自动驾驶,而Drive.ai似乎是个非常好的选择。

Drive.ai近期计划开始新一轮融资,暂不方便透露融资额,预计在数亿级人民币,主要用于技术开发和车队拓展。去年五月,公司获得了来自Northern Light Venture Capital,Oriza Ventures和InnoSpring Seed Fund的1200万美元投资。

责任编辑: 鲁达

1.内容基于多重复合算法人工智能语言模型创作,旨在以深度学习研究为目的传播信息知识,内容观点与本网站无关,反馈举报请
2.仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证;
3.本站属于非营利性站点无毒无广告,请读者放心使用!

推荐阅读