人生箴言
成熟意味着停止展示自己并隐藏自己
随机文章
- 2K直屏+骁龙8 Elite 2!真我GT8 Pro十月登场 !
- 彻底告别网线电源 4G低功耗摄像头销量暴涨168% !
- 高学历海归卷疯港姐!2025香港小姐公布14强亮相:这届审美如何 !
- 库克正式超越乔布斯!成为苹果史上任期最长CEO:执掌5091天 !
- 雷军:小米汽车APP已上线小米YU7车主指南 !
- 超苹果华为 小米手机Q2中国激活量第一!雷军激动转发:祝贺小米手机团队 !
- 90%碳纤维!广汽高域飞行汽车GOVY AirCab交付:支持航线自动驾驶 !
- 上海市民崩溃:今年的蝉为啥这么多!专家称是蝉“大年” !
- 罗马仕中层也加入维权:五位主要负责人至今未露面 !
- 按孩子数发钱、减免个税、购房补贴等!梁建章:国家育儿补贴是全面生育福利的起步 !
8月10日消息,据国内媒体报道,华为将于8月12日在2025金融AI推理应用落地与发展论坛上,发布AI推理领域的突破性技术成果。
据透露,这项成果或能降低中国AI推理对HBM(高带宽内存)技术的依赖,提升国内AI大模型推理性能,完善中国AI推理生态的关键部分。
HBM(High Bandwidth Memory,高带宽内存)是一种基于3D堆叠技术的先进DRAM解决方案,多层DRAM芯片垂直集成,显著提升数据传输效率。具有超高带宽与低延迟、高容量密度、高能效比等优势。
AI推理需频繁调用海量模型参数(如千亿级权重)和实时输入数据。HBM的高带宽和大容量允许GPU直接访问完整模型,可避免传统DDR内存因带宽不足导致的算力闲置。对于千亿参数以上的大模型,HBM可显著提升响应速度。
当下,HBM已成为高端AI芯片的标配,训练侧渗透率接近100%,推理侧随模型复杂化加速普及。
然而,其产能紧张和美国出口限制倒逼国内厂商探索Chiplet封装、低参数模型优化等替代方案。