60亿参数AI模型测试：Intel 2.4倍领先！唯一可替代NVIDIA_业界资讯

时间：2023-09-12

阅读：

9月12日消息，MLCommons官方公布针对60亿参数大语言模型及计算机视觉与自然语言处理模型GPT-J的 MLPerf推理v3.1的性能基准测试结果，Intel CPU处理器、AI加速器表现亮眼，在AI推理方面相当有竞争力。

此前6月份披露的MLCommons AI训练结果、Hugging Face性能基准测试成绩表明，Intel Gaudi2 AI加速器在先进的视觉语言模型上，表现完全可以超越NVIDIA H100 股加速器，堪称可唯一替代NVIDIA H100/A100的可行方案，最新结果再次验证了这一点。

GPT-J模型上，Intel Gaudi2加速器的GPT-J-99、GPT-J-99.9服务器查询和离线样本的推理性能分别为78.58次/秒、84.08 次/秒。

对比竞品，H100相较于Gaudi2只有1.09 倍（服务器）、1.28 倍（离线）的性能领先优势，Gaudi2对比A100的优势则可达2.4倍（服务器）、2倍（离线）的性能。

值得一提的是，Gaudi2提交的结果采用FP8数据类型，准确率达到99.9％。

Gaudi2软件每6-8周就会更新一次，将继续提升MLPerf基准测试性能，并扩大模型覆盖范围。

同时，Intel提交了基于Sapphire Rapids第四代至强可扩展处理器的7个推理基准测试，其中就包括GPT-J模型。

结果显示，包括视觉、语言处理、语音和音频翻译模型，以及更大的DLRM v2深度学习推荐模型、ChatGPT-J模型在内，四代至强在处理通用AI负载时性能非常出色。

截至目前，Intel仍是唯一一家使用行业标准的深度学习生态系统软件提交公开CPU结果的厂商。

根据最新结果，使用GPT-J对大约1000-1500字新闻稿进行100字总结的任务，四代至强在离线模式下每秒完成两段，实时服务器模式下则可完成每秒一段。

此外，Intel首次提交了至强CPU Max处理器的MLPerf测试结果，其集成最多64GB HBM3高带宽内存，对于GPT-J而言是唯一能够达到99.9％准确度的CPU，非常适合精度要求极高的应用。

苹果Mac产品行销副总裁Tom Boger和平台架构副总裁Tim Millet在接受采访时，分享了其自研芯片Apple Silicon成功的秘诀。Millet指出，竞争对手的芯片制造商“无法直接采用第

2024-11-18 10:05:47

据报道，英伟达新款Blackwell AI芯片已经面临延迟，并且伴随着配套服务器出现的过热难题，这一连串的挑战引发了用户对于新数据中心能否如期启动并顺利运行的深切忧虑。据内部消息

2024-11-18 10:05:25

Mark Gurman爆料，苹果将在明年推出AirTag 2，爆料称全新的AirTag 2将升级芯片，并改进了位置跟踪功能，能在更远的距离内响应。Mark Gurman还透露，这款设备的代号是B589，它内置的扬声

2024-11-18 10:05:02

NVIDIA Blackwell架构的新一代服务器正在批量出货，而在OCP Summit 2024峰会上，官方进行了公开展示，而且是直接将芯片裸露在外，随便看。这台服务器一共配备了八颗B200芯片，4NP工艺

2024-11-17 23:04:05

Intel锐炫独立显卡会在下个月有一场好戏，但细节不详，现在又有了更进一步的消息。有曝料者贴出了一张预告海报，上边写着Intel锐炫、Battlemage SoC、2024年12月等字样，再次证实In

2024-11-17 21:23:54

技嘉发布了一款新的专业显卡Radeon PRO W7800 AI TOP 48G，一如其名拥有多达48GB显存，比之前的32GB版本增加了一半，可以更好地用于AI大模型训练。AMD去年4月发布了首批两款基于R

2024-11-17 21:23:28

据媒体报道，近日全球范围内的苹果用户报告称，他们收到了多年前参与以旧换新计划的iPhone所购买的AppleCare+服务费退款。这些退款涵盖了从iPhone 11 Pro到iPhone 14 Pro的多种

2024-11-17 21:23:09

随着iPhone、Mac等产品逐渐成熟，苹果也在积极尝试不同领域，据媒体报道，苹果正探索三个主要方向来推出新产品。方向一：AirPods转型分析师郭明錤预测，未来的AirPods Pro 3可能会加

2024-11-17 16:03:46

据媒体报道，谷歌的AI聊天机器人Gemini近日又引起了争议。一名密歇根州的研究生在使用该机器人辅助作业时，突然向用户发送了“请去死”的恶意信息。Gemini回复道：&ldq

2024-11-17 16:03:26

在近日的一次采访中，Intel技术传播经理Florian Maislinger证实，Intel正在开发具有大缓存产品。但这些产品将主要针对数据中心市场，而非主流的消费级市场，因为与服务器市场相比，游

2024-11-17 16:03:09

为庆祝经典游戏《半条命2》正式发行20周年，V社宣布在北京时间11月19日凌晨2点之前，用户可以在Steam平台上免费获取这款游戏。这款游戏在国区原价为42元，整体评价为好评如潮。而

2024-11-17 16:02:34

显示专家Ross Young在社交平台上表示，最新的M4 MacBook Pro使用量子点（QD）薄膜，而不是红色KSF荧光粉薄膜。过去苹果通常采用KSF解决方案，因为它的成本低，而且不含镉，但最新的无镉QD

2024-11-17 10:30:19

一名女生在社交平台上称，她11月6日买的iPhone 16，在看综艺的时候突然自燃，目前已经联系商家及平台，但都没有回应。该女生表示，她没有使用磁吸充电器充电，没有边充电边看手机，我就是

2024-11-17 10:29:56

作为全球用户最多的操作系统，相信很多玩家从开始用电脑的那一天起，就一直在和Windows打交道。随着技术一天天地进步，Windows系统也在不停的更新，三年前微软推出了最新Windows 11

2024-11-16 21:15:09

《剑星》女主eva的原装紧身衣显然已经不能满足众多COSER的二创热情了，最近来自俄罗斯的符文姐姐Alin Ma就带来了全新版本的eva COS。镂空服装黑丝吊带，把该遮住的地方完美展现

2024-11-16 21:14:41

游戏盗号是令玩家非常崩溃的事，尤其腾讯游戏一般还是用QQ、微信登陆，一旦被盗号还会引发社交、财产安全问题。前些天就有一位用户向腾讯反馈，称自己的账号因为借给了游戏内认识

2024-11-16 21:14:13

字节跳动视频生成模型PixelDance和Seaweed在即梦AI正式上线，面向公众免费开放使用。用户进入即梦AI的“视频生成”界面，在视频模型里选择“视频P2.0 Pro&rdquo

2024-11-15 23:46:40

RTX 40全系标配了新一代12VHPWR 16针供电接口，但因为缺陷而在RTX 4090上出现了多次烧毁事件，后续悄悄升级了新版12V-2x6，那么下一代呢？海盗船在谈论未来电源的时候意外确认，下一

2024-11-15 23:44:32

近日，一位Reddit网友称自己的锐龙7 9800X3D被烧毁了，连带微星MAG X870 TOMAHAWK WIFI主板插座也被烧毁，引发广泛关注和议论。今天，微星发布了一则简短的官方声明，表示正在与AMD密

2024-11-15 23:44:07

近日游戏博主tfAIart分享了《最终幻想7》多角色3D美图。据悉，这些图片是他用AI生成制作的。但即便是AI图，这些角色也很性感魅惑，让人心动不已。一起来欣赏下吧！&zwnj;《最终幻想

2024-11-15 23:43:42

AMD官方博客撰文，详细对比了两家当红轻薄本笔记本处理器的性能，一方是锐龙AI 9 HX 370(RDNA3.5架构的Radeon 890M)，一方是酷睿Ultra 7 258V(Xe2-LPG架构的锐炫140V)。双方的笔

2024-11-15 23:43:21

NVIDIA Blackwell GPU相当强悍，大家都知道，但到底有多强呢？除了官方宣传数据，现在终于第一次看到了实测数据，来自MLCommons MLPerf v4.1，考察AI训练推理性能的最佳平台。对比对象

2024-11-14 21:57:47

伴随着AI投资热潮，今年以来，英伟达股价不断创下新高，累计上涨了约2倍。华尔街知名投资机构Melius Research在本周早些时候发布的一份报告中称，投资者应该继续持有英伟达，该公司的

2024-11-14 21:57:24

微星最近推出了新款GeForce RTX 3050 Ventus 2X XS White显卡，采用了全白的外观设计。据悉，该显卡整体尺寸仅为205 x 112 x 45毫米，采用双槽厚度设计，轻至570克，便于安装于各种机

2024-11-14 21:57:06

近日PlayStation中国官方介绍了《剑星》 x 《尼尔：机械纪元》DLC相机模式，该模式将于11月20日上线。现在游戏中每一刻都能转变成个人杰作。玩家可以尽情捕捉美丽的风景、热血

2024-11-14 21:56:43

Windows on ARM版本由来已久，但无论是Windows 10还是Windows 11，微软一直没有单独提供官方ISO镜像，安装的时候不是很方便。如今，微软终于在官网上提供了Windows 11 on ARM的官方

2024-11-14 21:54:28

特斯拉宣布将在美国召回2,400辆Cybertruck电动皮卡。原因是一个故障部件可能导致车辆动力损失，从而增加撞车风险。这是特斯拉今年第六次对Cybertruck进行召回。根据特斯拉提

2024-11-14 21:54:08

据媒体报道，英国消费者权益组织“Which?”代表约4000万iCloud用户向苹果提起反垄断诉讼，指控苹果违反了竞争法，并寻求30亿英镑（约合人民币276亿元）的赔偿。他们认为，苹

2024-11-14 21:53:47

TIOBE发布了最新的2024年11月的编程语言排行榜，Go语言在TIOBE指数中的排名不断上升，本月排名已经提升至第7，创下该语言的历史新高。TIOBE CEO Paul Jansen点评称，Go在前十名中独

2024-11-14 21:53:31

11月初，爱奇艺限制投屏案二审判决，二审维持了一审判决，即爱奇艺方须在老会员有效期内持续提供高清投屏，且须补偿41天黄金会员时长。今日，爱奇艺限制投屏案“朱元律师”

2024-11-14 21:53:12

2018-09-24

2019-02-01

2019-09-12

2019-04-09

2020-03-30

2019-06-25

2019-04-24

2019-09-23

2019-09-21

2020-03-25

60亿参数AI模型测试：Intel 2.4倍领先！唯一可替代NVIDIA

苹果揭秘自研芯片成功原因：竞争对手没法用最新尖端技术

英伟达Blackwell新款芯片过热：面临延迟交付问题

万能防丢神器！曝苹果AirTag 2明年亮相

NVIDIA Blackwell B200新照：八卡并行总功耗8000W

Intel不放弃独立显卡！第三代真的会有

AMD显卡史上最大显存：Radeon PRO W7800 48GB低调发布

毫无原因苹果突然退款！用户收到AppleCare+服务费

不再只靠iPhone和Mac！苹果3大方向打造全新产品线

谷歌Gemini AI惊人回复用户请求帮助：竟收到“请去死吧”！

Intel确认会出3D V-Cache大缓存CPU！遗憾的是：你可能用不上…

正式发行20年！经典游戏《半条命2》免费领取：还有海量更新修复

苹果官方没宣传：M4 MacBook Pro首发量子点显示技术

苹果iPhone 16刚买一个月就自燃了女生：发誓没用磁吸充电器

Win11升级需谨慎：列举用户遇到最多的五大问题

俄妹COS《剑星》女主镂空服：完美还原

腾讯游戏号终于不怕被盗了！账号异常提醒、冻结等功能上线

字节视频生成模型PixelDance上线即梦AI：用户可免费体验

RTX 50全系升级12V-2x6供电接口！最高功率450W

锐龙7 9800X3D首次烧毁：微星官方回应正在调查

《最终幻想7》多角色3D美图赏：性感魅惑让人心动

AMD大秀锐龙AI 9 HX 370：游戏性能平均领先酷睿Ultra 7 258V 75％

NVIDIA Blackwell GPU首次实测跑分：提升多达2.2倍

英伟达股价还能再涨26% 分析师：“iPhone时刻”即将来袭

微星推出RTX 3050 Ventus 2X XS White显卡：全白配色

《星刃》×《尼尔》照相模式来了：女主多种新姿势解锁

Windows 11 ARM版官方ISO镜像终于发布！高通、苹果都能用

存在动力丧失隐患！特斯拉宣布召回2400辆Cybertruck皮卡

苹果被提起4000万用户集体诉讼！索赔近280亿元

TIOBE 8月编程语言排行公布：Go排名第7创新高！超越JavaScript不远了

爱奇艺限制投屏案引热议原告呼吁：对所有受损会员合理补偿

热点内容

免费资源网

在线工具

扫一扫随时看

本站下载频道