首页 > 汽车早报 > 汽车早报 > 理想汽车启动端到端+视觉语言模型早鸟计划:车辆具备思考能力

理想汽车启动端到端+视觉语言模型早鸟计划:车辆具备思考能力

发布时间:2024-07-06 21:19:20来源: 15210273549

7 月 5 日消息,在今晚的理想智能驾驶夏季发布会期间,理想汽车宣布,端到端 + 视觉语言模型早鸟计划正式启动,号称可让车更智能、更像人。

IT之家汇总主要信息如下:

理想汽车称端到端模型的优势在于“高效传递”和“高效计算”两方面:端到端是一体化的模型,信息都在模型内部传递,具有更高上限,用户所能感受到的整套系统的动作、决策都“更加拟人”;一体化模型可在 GPU 里一次完成推理,且端到端延迟更低,用户可感知到“眼”“手”协调一致,车辆动作响应及时。

一体化模型可实现端到端的可训,完全数据驱动。官方表示,对于用户来说最大的感受就是 OTA 的速度越来越快

视觉语言模型方面,其整体算法架构由统一的 Transformer 模型组成,将 Prompt(提示词)文本进行 Tokenizer(分词器)编码,然后将前视 120 度和 30 度相机的图像以及导航地图信息进行视觉信息编码,通过图文对齐模块进行模态对齐,统一交给 VLM 模型进行自回归推理;VLM 输出的信息包括对环境的理解、驾驶决策和驾驶轨迹,并传递给系统 1 控制车辆。

官方表示,该系统整体设计存在三个亮点:设计了流式视频编码器,能缓存更长时序视觉信息;增加了记忆模块,缓存了多帧历史信息,可解决超长上下文推理时延问题;设计了智能驾驶 Prompt 问题库,系统 2 可以“思考”当前驾驶环境并给系统 1 合理驾驶建议,系统 1 也可在不同场景下调用不同 Prompt 问题,主动向系统 2 进行“求助”。

汽车早报更多>>

吉利汽车发布2024年ESG报告 荣获多项榜单第一 iCAR汽车发布全场景改装生态 让个性“合法生长” 荣威全面焕新 AI赋能重塑国民汽车品牌 逍遥超级融合架构之上,别克“全华班”力推至境,能否后来居上? 奇瑞星途火力全开,多款新车亮相上海车展,今年销量要“翻番”了 风行星海上海车展展望:年内冲击9万辆,欧洲市场成海外拓展重点 奇瑞集团旗下品牌携53款车型亮相上海车展 展示海陆空代表性技术展品 五年 把新能源车“变量”化为催化剂订单“增量” 亿纬锂能上海车展秀实力,大圆柱电池技术如何引领新能源未来? 2025年皖南医学院第二附属医院高层次人才招聘公告 2025年吉安市市直三家公立医院编外工作人员招聘公告 2025年九江市瑞昌市招聘“多员合一”社区工作者公告 2025年赣州市市直医疗卫生单位及赣州市立医院招聘专业技术人员公告 2024年车企立的flag 完成了几个? 至臻交付,自豪之选 问界M9第15万辆用户交付仪式成功举办 有颜也有料 四款纯电中型车推荐 2025年1月-3月,要上市的十款新车 卷疯了,奥迪A4L直降15万,17万就能入手? 乘龙M3极限自卸车荣获值得用户信赖奖项 宝骏电动车主集体遭遇刹车惊魂,软件BUG越来越可怕 纯电续航500km起 新能源C级轿车选启源A07还是星海S7? 大量官图被提前泄漏!领克大型SUV今晚发布,真不是国产“揽胜”? 拔得头筹!问界M9、问界M7分获净推荐值冠季军 敢超越 方显凌云之志 浅析星途凌云征服37°1雪如意超级陡坡 财务体系重组,削减4S店数量,不打价格战的林肯也扛不住了? 比亚迪汉L的信息与猜想:预计和腾势Z9同平台,有望搭载三电机? 抄底正当时,最低不到12万元,这些合资SUV太卷了 感谢米粉支持!小米汽车1年交付量超13万辆 年轻人心中的理想旅行车 从这台沃尔沃V60身上你会找到答案 星纪元ET增程四驱广州上市,试驾体验与豪华科技能否征服市场?