首页 > 企税活动 > 企税活动 > 理想汽车启动端到端+视觉语言模型早鸟计划:车辆具备思考能力

理想汽车启动端到端+视觉语言模型早鸟计划:车辆具备思考能力

发布时间:2024-07-06 21:19:20来源: 15210273549

7 月 5 日消息,在今晚的理想智能驾驶夏季发布会期间,理想汽车宣布,端到端 + 视觉语言模型早鸟计划正式启动,号称可让车更智能、更像人。

IT之家汇总主要信息如下:

理想汽车称端到端模型的优势在于“高效传递”和“高效计算”两方面:端到端是一体化的模型,信息都在模型内部传递,具有更高上限,用户所能感受到的整套系统的动作、决策都“更加拟人”;一体化模型可在 GPU 里一次完成推理,且端到端延迟更低,用户可感知到“眼”“手”协调一致,车辆动作响应及时。

一体化模型可实现端到端的可训,完全数据驱动。官方表示,对于用户来说最大的感受就是 OTA 的速度越来越快

视觉语言模型方面,其整体算法架构由统一的 Transformer 模型组成,将 Prompt(提示词)文本进行 Tokenizer(分词器)编码,然后将前视 120 度和 30 度相机的图像以及导航地图信息进行视觉信息编码,通过图文对齐模块进行模态对齐,统一交给 VLM 模型进行自回归推理;VLM 输出的信息包括对环境的理解、驾驶决策和驾驶轨迹,并传递给系统 1 控制车辆。

官方表示,该系统整体设计存在三个亮点:设计了流式视频编码器,能缓存更长时序视觉信息;增加了记忆模块,缓存了多帧历史信息,可解决超长上下文推理时延问题;设计了智能驾驶 Prompt 问题库,系统 2 可以“思考”当前驾驶环境并给系统 1 合理驾驶建议,系统 1 也可在不同场景下调用不同 Prompt 问题,主动向系统 2 进行“求助”。

企税活动更多>>

幼儿园免费?别做梦了,但我可以教你如何省下一大笔钱! 元PLUS就像一位忠实的伙伴,默默陪伴着我 领克最快2026年底登陆澳大利亚市场 或悬挂极氪品牌标识销售 3000元出头,选i5-1340P笔记本,还是Ultra5 125H笔记本? 如何利用DEEPSEEK与新能源行业结合:解锁未来能源的无限可能? 一汽-大众陈彬:1月1日-2月2日三大品牌销量140400辆 蔚来创始人李斌近日透露了蔚来的产品规划,对2025年的战略部署。 特斯拉Model 3 Performance版评测:性能与操控的完美结合 晒59㎡二手房改造,老婆非要隔出一个衣帽间,邻居看后照搬回家! 重庆全面取消限售!房价会涨吗?核心数据深度解析 中国房产行业未来可能呈现以下发展趋势! 2799元512G大存储!红米K80深度体验:这三个优点让我放弃小米13 从4999跌至2549元,2K屏+骁龙8Gen3+无线充电+IP68,魅族清仓了 网友集体呼吁:希望小米15 Ultra能参加国补优惠 推荐五款性价比最高的iqoo手机 比亚迪即将发布智能化战略:该如何落地?自研路线能否持续领先? 比亚迪全球第四、全球第二!引领中国汽车放眼全球、全力出海 丰田生产系统的软实力——Yokoten、Nemawashi等 由外到内全面进化,新一代丰田RAV4/威兰达蓄势待发 论技术,先看吉利,它已经是NEXT LEVEL了 宝马Carplay还要半天才连上? 跟着视频来,保姆级教学 2025 款宝马 M5 评测:静谧的奢华 三星 Galaxy S26 系列可能重新启用自家 Exynos 处理器 “全栈AI”赋能冰雪盛会 联想以智能、绿色、人文护航哈尔滨亚冬会 买新能源汽车纯电、插混、增程到底怎么选,业内人早已一语道破! 广汽“新掌门人”,有怎样的使命? 骁龙7s Gen2和骁龙7+ Gen2:日常使用的“理想型”选择 够强!华为Pura 80系列曝光!原生鸿蒙系统加持,性能飙升30% 曝REDMI将发布旗舰芯小屏平板:LCD屏幕+7500mAh 三星 Galaxy Z Fold 7 新消息:重大升级与潜在争议并存