server - 当前一代至强处理器之间的差异
问题描述
Xeon W 系列、Bronze、Silver、Gold 和 Platinum 系列之间的实际区别是什么?
对于早期版本的至强,E3 是单插槽 CPU。而 E5 可用于带有两个插槽的主板。E7 支持四插槽(也可能是 8 个)
但是,与当前一代至强相比,大多数阵容具有 2S 的可扩展性(一块主板中的 2 个处理器)
如果 Xeon Silver 和 Xeon Platinum 可以用于双路主板,我为什么需要一个铂金处理器,它至少比银色零件贵 5 倍?除非有其他区别。
当前一代至强处理器之间有什么区别?我看到缓存大小有一些差异。除此之外,我找不到其他任何东西。
解决方案
Gold/Platinum 每个插槽有更多内核,和/或更高的基础时钟或涡轮时钟。这就是你付出的大部分。
让它们在 4S 或更高系统中工作的额外 UPI 链接在 2 插槽系统中使用时无关紧要,但这不是唯一的功能。据推测,这只是成本的一小部分。随着从包含 L3 缓存到非包含的更改,Skylake Xeon 和更高版本已经需要一个与 L3 标签分开的监听过滤器,即使对于单插槽也是如此,这与 Xeon E5 不同,它只是将所有内容广播到另一个插槽。据推测,Xeon-SP 的窥探过滤器也可以用于将窥探过滤到另一个套接字,因此它不需要成为 1S 与 2S 的单独功能。
例如,高端第二代(Cascade Lake)英特尔® 至强® 铂金 9282 处理器具有 56 个内核(112 个线程),最大睿频 = 3.8 GHz,基本时钟 = 2.6 GHz,以及 77 MB 的三级缓存。
高端 Silver 是Intel® Xeon® Silver 4216:16c/32t 3.2 GHz turbo,2.10 GHz 基础,22 MB L3 缓存。
尽管拥有近 4 倍的内核,但 Platinum 的持续和峰值涡轮时钟更高。(TDP 为 400W,而 Silver 为 100W!不那么疯狂的 Platinum 芯片的 TDP 较低,例如,具有 2.3GHz 基础/3.7GHz turbo 的 32c/64t 为 250W TDP)。
此外,一些(全部?)银牌/铜牌 CPU 只有一个 AVX512 FMA 执行单元,因此 512 位 SIMD FP 数学指令的吞吐量会降低,包括所有 FP 数学和 int<->FP 转换,以及_mm512_lzcnt_epi32
. 在 Ark 页面上查找# of AVX-512 FMA Unit
特定 CPU 的行。 对于整数 SIMD,只有乘法受到影响。 (在硬件中,SIMD 整数乘法微指令在 FMA 单元上运行。)移位、混合、混洗、加/减、比较和布尔运算都具有单独的矢量 ALU,其宽度为 512 位,并且不像乘法器那样占用太多的芯片面积.
即使是高端 Silver 4216 Cascade Lake 也只有 1 512 位 FMA 单元。
运行 AVX2 代码,差异为零。即使仅使用 256 位向量的 AVX512 也可以。(gcc -march=skylake-avx512
默认为,-mprefer-vector-width=256
因为完全使用 512 位向量会暂时降低最大 turbo。它希望避免一个不重要的 512 位向量化循环会影响程序其余部分的时钟速度,而其余程序大部分时间都花在标量代码中.)
但是,如果您正在处理繁重的 AVX-512 FP 数字运算,您可能需要一个具有 2 个 FMA 单元并使用 512 位向量进行编译的 CPU。
IDK 为什么你标记了这个 Xeon Phi;这是一个完全不同的微架构。
推荐阅读
- amazon-web-services - 将 POST API 请求中的数据传递给 lambda 函数
- swift - 为什么过滤器数据不显示在表格视图中?
- amazon-web-services - 授予 EC2 实例中的代码访问另一个账户的 S3 存储桶的权限
- python-3.x - Tkinter 如何立即销毁在 Python 函数调用中创建的窗口?
- javascript - 如何使用javascript获取li的id值
- flutter - 将 Flutter 提供程序与 Firestore 一起使用的最佳方式是什么
- sql - 第一个表的 DB2 SQL COUNT() 结果
- java - 如何使用 Android Java 将条形码打印到斑马 ez320?
- python - 使用内部有字典的 pandas 列在 DataFrame 中创建新列
- python - 使用 Python 和 Beautiful Soup 从文本中抓取数字