油车时代的三大件是长津湖,智驾时代的芯片就是上甘岭
![]()
世上无难事,油车只要肯登攀,时代时代很多人喜欢登山,大的芯永川市某某过滤器制造有限责任公司追求的长津湖是登顶和翻越高山之后的成就感。
自芯片荒以来,智驾本土车企这几年时间也爱上了登山,片上他们登的甘岭那座山叫芯片。
在东邪西毒里,油车借着欧阳锋的时代时代口,王家卫说,大的芯年轻的长津湖时候看着大山,就想知道山后面是智驾什么,年纪大了,片上就不想知道了。甘岭
芯片是油车中国的老大难,也是一座很难翻越的关山,在这座大山的永川市某某过滤器制造有限责任公司背后,是一个又一个异构计算单元。
![]()
我们以黑芝麻(参数丨图片)A1000的异构计算架构图为例,展开介绍一下以智能驾驶和智能座舱为主要应用场景的汽车大算力芯片内部的各类异构计算单元。
这类大算力芯片一般会包含CPU、GPU、NPU、DSP、ISP、安全MCU、视频输入输出、计算机视觉引擎、各类通信接口。
![]()
CPU可以针对不同应用的实时性和安全要求选择运行不同的操作系统,管理内存、存储、文件系统、系统外设等各类资源,进行逻辑计算,提供安全支持。
GPU主打图像处理,负责管理多个高分辨率显示器的图形渲染和纹理处理,支持优先处理仪表屏之类的实时应用。
DSP进行滤波、降噪等数字信号处理,既可以提供定点计算能力,也可以进行复杂的浮点计算;ISP既可以用于图像的感知,也可以用于图像的合成。
NPU是大家目前最看重的神经网络处理器,有时也被称为BPU或AI引擎,主要用于神经网络的推理工作。
当然了,鉴于AI已经发展了六七十年,CPU和GPU也具备一定的AI能力,CPU可以进行轻量级单次推理的低延迟AI任务,GPU的并行特性和大吞吐量使其可用于处理媒体、3D和渲染中的AI任务。
![]()
芯片设计的主要工作是对各种各样的计算单元进行灵活的组合,选择合理且有效的算力类型和算力规格,满足应用场景的多样性需求,并达到算力、功耗、成本的最佳平衡。
不过,在目前这个时代,大算力芯片设计最主要的任务是聚焦最新的神经网络架构,使其NPU或AI引擎的设计可以做到与现代神经网络协同优化。
早起的鸟儿有虫吃,早起的虫子被鸟吃。
有的领域存在先发优势,有的行业存在后发优势。对于算法不断变化的智驾来说,自动驾驶芯片做得越晚,就越是能够适应技术路线的不断演变。
在2021年的GTC大会上,英伟达推出了Orin X的下一代芯片Atlan,到了2022年的GTC大会上,豪横的黄教主砍掉了已经花了好几亿美金的Atlan,直接推出了新的芯片-雷神Thor。
这次改变的核心原因并不在于Atlan的芯片算力有点低,要知道,虽然Atlan的芯片算力为1000T,Thor的芯片算力曾经一度提高到2000T。
但是,到了2024年的GTC大会上,出于一些不可言说、难以琢磨的原因,这颗芯片的算力又被阉割成了1000T。
![]()
事实上,跟Atlan相比,Thor最核心的转变在于加入了Transformer引擎。
之所以几亿美金说打水漂就打水漂了,黄教主连眼睛都不眨一下,是因为在2021年的AI Day上,特斯拉推出基于Transformer的BEV,一下子打开了整个自动驾驶行业的视野:CNN的时代结束了,Transformer的时代到来了。
![]()
华为曾经在2022年推算过,到2027年,自动驾驶系统中的CNN和Transformer的计算比例将从2022的七三开进化成届时的三七开。
为了支持占据更大比例的Transformer计算,芯片层面必须引入原生的Transformer引擎,做好底层支持,才能保证上层自动驾驶算法的精度、时延。
![]()
这个几亿美金的教训揭示了一个深刻的道理,要做出一颗成功的自动驾驶芯片,必须非常了解自动驾驶算法。
在NOA市场屈居英伟达之下、在一体机市场独占鳌头的地平线将自己标榜为披着芯片厂商外衣的算法厂商的核心原因就在这里。
![]()
自动驾驶系统内部有成千上万个小模型,这些模型会用到哪些具体的算法,需要芯片在硬件层面提供什么样的支持,特别考验自动驾驶芯片厂商在算法上的实力。
男女搭配,干活不累,软硬协同,才能得到力大砖飞的系统。
对智能系统而言,芯片只是基础,如何与软件深度协同并将协同效应最大化才是制胜的关键。
厂商若不提供可以释放硬件性能的底层软件,对开发者而言,芯片就是一块板砖。
![]()
接下来,先摆事实再讲道理,谈一谈为何芯片厂商需要实现软硬协同。
摆事实,自2016年起,特斯拉采用英伟达的Drive PX 2开启了自动驾驶的自研之路,版本号为HW 2.0,物理算力是24TOPS,后来升级为HW 2.5,物理算力提高到80TOPS。
2019年,特斯拉推出第一颗自研的自动驾驶芯片,算力为72TOPS。
![]()
算力下降了,但在以FPS为度量指标的真实性能上,HW3.0相较于HW2.5提升了足足21倍!
这个比较不只说明了特斯拉的超级强悍,还告诉了我们一个铁一般的事实:只有深谙自家芯片的硬件特性和技术秘密,才有可能设计合适的算法压榨硬件算力,将软件性能发挥到极致。
![]()
再讲道理,系统的性能=计算算力x计算带宽x计算算法。
这里的计算算力是硬件处理器可以释放的峰值计算效能,大家津津乐道的芯片算力多少个TOPS指的就是这个指标。计算带宽指的是对峰值计算能力的有效利用率,取决于芯片架构、编译器的优化程度。
![]()
计算算法指的是算法效率,可以理解为软件在硬件上的驻留时间或者资源占用情况,停留时间越长,对硬件潜力或者说性能的挖掘就越大,这个指标取决于芯片厂商提供的算子的效率和上层算法开发商的算法实力。
看到了吧,芯片从来不只是芯片,而是芯片+底软的整体解决方案,如果做芯片只是拿着各种IP核搭积木那么简单,国家何至于每年要进口四五千亿美金的芯片?
做芯片到底有多难,三天三夜也讲不完,隔壁的手机厂商最了解这一点。
君不见,已经过去了10年的时间,小米至今还没有拿出第1颗真正自研的手机芯片?
责任编辑:张新颖_NAB7458(责任编辑:探索)
-
陕西女老师事件持续发酵,知情人揭露:抽烟穿吊带,还有多位男友
想让义务教育朝着素质教育发展,并且实现完美过渡的前提是什么?很多学校努力的方向都错了,其实不是取消成绩排名,更不是禁止学生补课,而是让老师拥有素质教育的能力。一个老师只会教授课本上的知识是无法让学生享
...[详细]
-
云南一考生601分被云南大学录取,专业被吐槽,考生乐观、看得开
高考是可以改变命运的考试,对于部分有实力的考生而言,没有考上理想的大学会很不甘心,即便已经有学校录取了自己,可能也会再考一次。2024年高考,有不少考生就是复读生。这些考生中,有的人成绩依然不太如意,
...[详细]
-
[环球时报特约记者 谢昭]持续了两年多的俄乌冲突早已经进入残酷的消耗战,交战双方很难展开大规模的机动突击行动,而不得不通过扼杀对手的关键后勤补给以削弱其持续作战能力。在最近的顿涅茨克、库尔斯克和克
...[详细]
-
波黑武装部队一架直升机28日上午在波黑南部亚布拉尼察湖地区坠毁,4名机组成员全部获救。 波黑国防部当天发布消息说,直升机上共有4名机组成员,他们获救后被送往附近科尼茨市急救中心接受检查,目前身体
...[详细]
-
版权声明:本文版权为网易汽车所有,转载请注明出处。网易汽车12月19日报道本周,长城汽车董事长魏建军在欧拉5发布会上公开质疑一体化压铸技术的实用性,提出"成本高、维修难、保费贵"三大争议点,并强调"全
...[详细]
-
Here We Go!罗马诺:乌加特将加盟曼联,转会费总价6000万欧
直播吧08月27日讯 罗马诺以标志性的Here we go宣布,曼联将签下巴黎后腰乌加特。乌加特,现年23岁,乌拉圭后腰,去年夏窗以6000万欧转会费从葡萄牙体育加盟巴黎,上赛季乌加特代表巴黎出战37
...[详细]
-
△8月25日,黎以临时边界 尽管以色列总理内塔尼亚胡和黎巴嫩真主党领导人纳斯鲁拉均在25日冲突后向外释放强硬信号,但据路透社援引两名匿名外交官的信源报道称,黎以双方已通过中间人进行了接触,确认双方都
...[详细]
-
请小作者添加小编好友,以便制作荣誉证书。投稿方式:关注微信公众号“温州新教育”微信号:wzrbxjy),点击下方自定义菜单栏“作文投稿”即可进行投稿投稿时,请注意必填与选填)。外婆的灶台温州市第二十一
...[详细]
-
△阿努廷左)和西哈萨右) 当地时间12月24日晚,泰国执政党自豪泰党通过其社交媒体宣布,该党决议提名阿努廷和西哈萨为总理候选人。看守总理阿努廷为第一候选人,现任外长西哈萨为第二候选人,两人均已接受提
...[详细]
-
北京市气象台26日6时发布天气预报: 今天早晨至白天阴有中雨,局地大雨转多云,北风三级转一二级,最高气温26℃;夜间多云转晴,北风二级左右,最低气温21℃。 暴雨蓝色预警中,今天早晨至下午仍有
...[详细]

谷歌凌晨炸场,Pro级智商只卖“白菜价”,OpenAI还怎么玩?
中新真探:锻炼补水,喝运动饮料比喝白开水更好?
王治郅入选2026国际篮联名人堂