联手刷新AI推理纪录)
智通财经APP获悉,微软宣布,其Azure ND GB300v6虚拟机在Meta的Llama270B模型上实现了每秒推理速度达110万token的行业新纪录。据悉,Azure ND GB300虚拟机采用英伟达(NVDA.US)的Blackwell Ultra GPU,具体为NVIDIA GB300NVL72系统,配置72个NVIDIA Blackwell Ultra GPU和36个NVIDIA Grace CPU,采用单机架构设计。这款虚拟机专为推理工作负载优化,具有50%的GPU内存提升和16%的热设计功率(TDP)提高。
微软首席执行官萨提亚?纳德拉在社交媒体上表示:“这一成就是我们与英伟达长期合作和在生产规模运行人工智能方面专业知识的结晶。”
资料显示,为了验证性能提升,微软在一个NVIDIA GB300NVL72域下的18台ND GB300v6虚拟机上运行了Llama270B模型,使用NVIDIA TensorRT-LLM作为推理引擎。微软表示:“一个NVL72机架的Azure ND GB300v6实现了总计110万个token/秒的推理速度。” 这一新记录超越了微软之前在NVIDIA GB200NVL72机架上实现的86.5万个token/秒的成绩。
对此,Signal65的实验室副总裁拉斯?费洛斯指出:“这一里程碑不仅突破了每秒百万token的障碍,还在一个能够满足现代企业动态使用和数据治理需求的平台上实现。” 他补充称,Azure ND GB300相较于上一代NVIDIA GB200在推理性能上提升了27%,而仅增加了17%的功率规格。
声明:本网转发此文,旨在为读者提供更多资讯信息,所渉内容不构成投资、建议消费。文章内容如有疑问,请与有关方核实,文章观点非本网站观点,仅供读者参考。
奉节脐橙香飘古都 产业振兴谱写新篇——2025奉
初冬的西安,渭水凝霜,古城含翠。一场以“橙”为媒的农业盛事,在丝...
广交会搭台、生产线接棒,中顺洁柔以“一张好纸”诠
在全球贸易格局持续演进的背景下,第138届中国进出口商品交易会(...
智邦粉面浇头供应链:携手抢占千亿赛道,诚招全国区
2025年粉面市场规模已突破1500亿元,年增速高达15%,千亿...
同安区人武部:以“武装工作日”为抓手 奏响国防建
近日,同安区人武部创新采用“多点联动、全域赋能”模式开展9月份“...
中微公司发布首款晶圆边缘刻蚀设备Primo Ha
在SEMICONChina2025展会期间,中微半导体设备(上海...
抢抓机遇捷报频,金哚哚平台又一区域代理落定江苏省
近日,金哚哚平台宣布,其江苏省区域代理合作项目成功落地。平台成都...