您的当前位置:首页 > 知识 > 黄仁勋、苏姿丰点赞:英伟达、AMD 力挺 InferenceMAX 开源新基准 正文
时间:2025-10-16 23:44:30 来源:网络整理 编辑:知识
IT之家 10 月 11 日消息,科技媒体 Tom's Hardware 昨日10 月 10 日)发布博文,报道称分析机构 SemiAnalysis 近日发布了一款名为 InferenceMax 的开
IT之家 10 月 11 日消息,黄仁科技媒体 Tom's Hardware 昨日(10 月 10 日)发布博文,勋苏新基报道称分析机构 SemiAnalysis 近日发布了一款名为 InferenceMax 的姿丰准昆明市某某交通设施专卖店开源 AI 基准测试套件,专注于衡量在真实 AI 推理(模型实际运行)场景下,点赞达由驱动、英伟内核、力挺框架等组成的开源整个软件堆栈的综合效率。
IT之家援引博文介绍,黄仁人工智能领域的勋苏新基焦点几乎完全集中在芯片交易和 GPU 等硬件发展上,现有的姿丰准基准测试也大多只关注硬件性能,因此 InferenceMax 希望提供一个开源且厂商中立的点赞达 AI 基准测试套件。该项目以滚动发布的英伟方式,每晚更新测试结果,力挺从而能够动态追踪软件更新对性能的开源持续影响。
InferenceMax 引入了两个相互制约的黄仁昆明市某某交通设施专卖店关键性能指标。其一是“吞吐量”,指在单位时间内处理更多并发请求的能力,这有利于最大化 GPU 利用率;其二是“交互性”,指为单个用户提供更快响应速度的能力,例如在聊天机器人场景中。
在两者之间取得理想平衡(即帕累托前沿曲线上的最佳点)至关重要。最终,对于服务提供商而言,衡量投资回报的终极标准是“总拥有成本”(TCO),即处理每百万 token 所需花费的美元。InferenceMax 致力于估算不同硬件采购或租赁方案下的 TCO,为用户提供最具经济效益的选择依据。
InferenceMax 的初步测试提供了一些颠覆性的见解。例如,尽管英伟达的 B200 在原始速度上遥遥领先,但在综合考量 TCO 后,AMD 的 MI335X 在特定场景下展现出了极强的竞争力,这表明,最快的芯片不一定是最经济高效的选择。
同时,测试也暴露了 AMD 在 FP4(4 位浮点格式)内核方面尚有改进空间,目前依赖该数学格式的场景仍由英伟达芯片主导。这些发现凸显了单纯比较硬件参数的局限性,软件优化与成本效益正成为评估 AI 性能的关键。
InferenceMax 的开发过程得到了英伟达、AMD 及多家云服务商的深度协作。这种合作不仅帮助项目获取了真实的硬件与软件配置方案,还意外地发现了两大巨头软件堆栈中的多个错误。
例如,项目组协助 AMD 修复了其 ROCm 软件中的问题,并建议 AMD 提供更优的默认配置以简化性能调优。对于英伟达,测试则暴露了其新款 Blackwell 驱动在快速启停实例时存在初始化相关的障碍。
英伟达首席执行官黄仁勋表示:
在长上下文推理的推动下,推理需求呈指数级增长。NVIDIA Grace Blackwell NVL72 正是为这个充满思考力的 AI 新时代而生。NVIDIA 通过持续的硬件和软件创新来满足这一需求,从而赋能 AI 的未来发展。 通过频繁的基准测试,InferenceMax 让业界能够清晰地了解 LLM 推理在实际工作负载下的性能。结果显而易见:搭载 TRT-LLM 和 Dynamo 的 Grace Blackwell NVL72 可提供无与伦比的单位成本和单位兆瓦性能,为全球生产力最高、成本效益最高的 AI 工厂提供支持。
AMD 首席执行官苏姿丰表示:
开放式协作正在推动人工智能创新的新时代。开源 InferenceMax 基准测试为社区提供透明的每日结果,从而激发信任并加速进步。 它凸显了我们的 AMD Instinct MI300、MI325X 和 MI355X GPU 在不同工作负载下具有竞争力的 TCO 性能,彰显了我们平台的强大实力以及我们致力于让开发人员实时了解软件进度的承诺。
IT之家附上参考地址
中方对美反制,今起施行!2025-10-16 23:29
三大数论猜想:简单到初中生都懂,却难倒数学家2025-10-16 23:27
山东辟谣因吃牛羊肉一两百人被隔离2025-10-16 23:08
摩天轮旁!加菲猫家族空降上海锦江乐园,开启一场夏日清凉狂欢!2025-10-16 22:58
71岁的王健林被限高,巨大的连锁反应开始了2025-10-16 22:39
摩天轮旁!加菲猫家族空降上海锦江乐园,开启一场夏日清凉狂欢!2025-10-16 22:24
离职员工遭“职场霸凌”?华熙生物:恶意炒作2025-10-16 22:15
国防部评“汉光演习”:演来演去都是做戏2025-10-16 22:11
被立案调查,高通回应2025-10-16 21:57
危地马拉首都发生一起枪击事件 2人死亡2025-10-16 21:47
读万卷书,大模型「看」懂视觉世界?Meta揭秘LLM视觉先验的起源2025-10-16 23:30
加大改革力度 确保人民群众从改革中获益2025-10-16 23:26
澳洲航空一航班因刹车系统问题紧急降落2025-10-16 23:21
印度拉杰科特机场航站楼顶棚因暴雨损毁2025-10-16 22:56
南宁市江南区教育局通报“一小学教师脚踢学生”:涉事教师进入解聘程序2025-10-16 22:54
水下养鱼、水上发电!全球首座风渔融合浮式平台投产2025-10-16 22:32
印度拉杰科特机场航站楼顶棚因暴雨损毁2025-10-16 22:32
正能量微短剧《寻AI高考》2025-10-16 22:08
男子采摘蘑菇发现受伤豹猫 神农架国家公园管理局:正在救治2025-10-16 21:44
日本富士山顶附近,已发现4人死亡2025-10-16 21:13