明智的驾驶比赛的新旋转,进入实际时刻

如果不是因为最近可能会再次宣布Huxiu Auto Group丨LiGeng的图片。原因没什么特别的。 This is because the leading group of wise driving forces in China has almost all selected to implement their latest driving capabilities in the near future: the perfect auto will launch with I8 and push the "VLA's" driver model "; Momento and Zhiji work together to complete the R6 flywheel model on board; Yuanrong released his VLA model yesterday (August 26); Xiaopeng released his new VLA model at the new P7 launch conference today (August 27);华为宣布将在9月推出,这是一个整洁的速度。命名每个公司的不同模型背后隐藏的技术差异?新一代智能驱动程序的“明智”在哪里?在本期的“智能雷达”第5卷中,总体而言,我们是“智能驾驶圈中竞赛的即将到来的扭曲,并首先尝试为您解释上下文。在新的驾驶比赛中,第一个问题是:为什么行业中的行动如此出色? Huxiu汽车总结了四个主要驱动力:加强公共行政和意见正在推迟一些公司的既定节奏;智能技术的最低水平和每个公司的产品是下面的AI变化的崩溃,起点时间是相同的。将AI接地技术应用于智能驾驶需要大量培训和调整投资,所需的时间有些固定;所有公司都看到了智能改善Drivi的情报的潜力NG功能,并关注其他提供技术和产品发行优先级的公司,因此他们选择了首先提出“基本版本”然后对其进行优化的想法。最重要的一个必须是第4点。注意:E2E 1.0模型可以看到,中间模型部分存在“阻塞”,与E2E 2.0相对应的VLA模型是集成的,周期为Zhou guang还解释了通过PPT通过PPT进行这种趋势的根本原因:与第一代“端到端”的“端到端”相比,VLA大型模型实际上是由“左派”左右(左派)的“左派”(Navig of navig of navig of navig)。大型模型中的tion,预测,计划和其他链接,而不再是单个链接中的CNN模型,最后在“大型模型”中采用了许多模型。取而代之的是,从传感器到控制端只有一个完整的模型。其次,该模型本身正在从CNN(早期AI GO,面部识别和其他应用程序的基础技术)中升级,在变压器的基础核心(增加了大型语言模型(例如GPT)的基本基础技术)中,这极大地提高了驾驶人大脑智能驱动器的模仿和学习能力。与在智能人道行业大型模型的最后周期中被围绕的VL相比,VLA大型模型在建筑和能力方面更接近智能驾驶的需求。深入的坐姿技术变革使VLA具有精神能力(COT)。该模型本身不再是从检测到的输入(视觉)来控制输出的“黑匣子”(behaVior)。取而代之的是,通过将语言作为媒介引入,模仿了人类驾驶员的思考方式,将复杂的驱动决策分解为一系列连贯和逻辑的步骤。 Both end-to-end models, VLA also achieved significant improvements in its capabilities: enhanced logic and reliability of decision-making: faced complex or rare (long tail) road conditions, VLA models capable of cottage can be evaluated in step: "Identify school buses and slow speeds" "Comprehensive judgment. This consecutive reasoning is more reliable and safe than a single, intuitive end-to-end output; it improves the interpretability and transparency of the system: Cot shows该模型以人们可以理解的语言的决定有助于研发人员调试和优化模型,还为事故和责任生的调试和优化的可追溯性提供了明确的基础自主驾驶系统的典型和法规;它提高了该模型的整体模型的技能,并且管理华为和Nio的能力目前正在促进另一条路线:世界模型的新一代模型“学会了害怕”吗?先验警报潜在风险。决定以高速行驶,其驾驶决策将立即从“速度控制”升级到“降低速度降低”,从而留下充足的反应空间。由于车速非常快,以防止车辆被迫进入其他车道。在旧城区的复杂交叉点中,它可以包括天气,非法道路停车,动态行人等,较小的潜力风险,并以几乎“恐慌”的态度缓慢地通过并确保安全。简而言之,在单个功能中,新模型的改进体验不可见,而是全面的跳跃 - 平稳的汽车控制,更具体的响应和整个过程中的“安全感”。而人们仍然需要在极端情况下(总共两次,一个是在盲点以低速变化的时候,而另一个是在交叉路口停车的时候,导致迟到了),这种信心是在驾驶时“驾驶”很难让任何系统都无法给予它的信心。值得一提的是,由于文本说明之间的相关性,该智能驱动程序的系统可以执行基本的语音操作。例如,系统可以收到诸如“请开放更快,开放慢”之类的说明,并以决策形式进行操作端。 VLA还可以将文本说明直接读取到流量并根据说明优化驱动程序(例如,某些交叉点可以向左转并变成等候区的红灯)。如何启动下一场智能比赛?周光本身说:VLA并没有完全意识到思维链(COT),而当前的路线仅为6(从10分),并且仍然有很多Opti要做其他事情的方法是看到Nang的技术趋势显然,VLA的训练后不断提高,并且大型模型的性能继续优化。周光还传达了对该行业未来发展的一些看法,其中三个最重要的一点是:VLA成本差异主要在芯片中,具体的成本差异不确定,但是目前,可以调整超过150,000元的模型,并且模型也可以通过优化在模型中使用100,000元;早期的智能驾驶芯片主要针对CNN设计优化。在应用VLA模型之后,芯片肯定会提高对变压器的支持,尤其是通过优化计算精度(例如FP4和FP6)的强度;如果汽车公司或供应商想开发自我开发的助理驾驶系统,则很难从规则算法,端到端1.0中跳过Process,在VLA模型中以及每个开发过程HA它自己的知识。通常,某些阶段可以被压缩,但不可能完全错过。如何使真实的“理解”和“尊重”现实世界,从“知道如何开车”到“学习如何思考”,智慧驾驶技术和产品正在悄悄地进入新的实用时刻。本文源自Huxiu,原始链接:https://www.huxiu.com/article/4742364.html?f = wyxwapp
特别声明:上面的内容(包括照片或视频(如果有))已由“ NetEase”自助媒体平台的用户上传和发布。该平台仅提供信息存储服务。
注意:上面的内容(包括照片和视频(如果有))已上传,并具有NetASE HAO用户,该用户是社交媒体平台,仅提供信息存储服务。