芯片算力计算方案分析
芯片算力公式主要有两个:
1. 计算=(单芯片)性能*规模(即数量)*利用率
2. CPU算力计算公式:Flops=[CPU核数][单核主频][CPU单个周期浮点计算能力]
注意,这两个公式只适用于特定情况,根据实际情况选择合适的公式。
1. 硬件算力计算公式
以上公式为硬件上限总和,N 即设备数,ECP 即各设备算力。本文中均以64位双精度浮点数的运算来进行衡量。在同构处理器时代,一般使用主频来衡量一个处理器的性能。
而到了异构处理器时代,随着人工智能、大数据、多媒体编解码对海量数据的计算需求,一般使用浮点运算能力FLOPS来衡量一个处理器的性能。
1.1 细化
按算力类型分类进行细化,并且由于超算类算力与其他两类算力量级差距较大,所以在此处暂时将其省略,公式表示为如下:
1.2 进一步细化
具体到每种不同的芯片,上述公式可写为:
以上即为不考虑算法及场景下的理想化供给端算力上限计算公式。
以下各设备算力数据均来自维基百科相关页面:
ECP_cpu:目前桌面端及服务器大部分仍采用 X64 架构芯片,其中主要由 Intel和 AMD 两家厂商所提供:
表3-1 部分CPU算力
微架构 |
FP64 |
Intel CPU |
|
Intel Atom (Bonnell, Saltwell, Silvermont and Goldmont) |
2 |
Intel Ice Lake, Tiger Lake and Rocket Lake |
32 |
AMD CPU |
|
AMD Zen 2 (Ryzen 3000 series, Threadripper 3000 series, Epyc Rome)) |
16 |
AMD Zen 3 (Ryzen 5000 series) |
16 |
Intel CPU 总平均 9.22;AMD CPU 总平均 6.33
(a) Intel CPU total avg 9.222222222222221
(b) AMD CPU total avg 6.333333333333333
2. ECP_soc: 而移动端 Soc 主要代表就是 ARM 公司设计的高级精简指令集机器(Advanced RISC Machine)
表3-2 部分Soc算力
微架构 |
FP64 |
ARM Soc |
|
ARM Cortex-A32, A35, A53, A55, A72, A73, A75 |
2 |
ARM Cortex-A57 |
4 |
ARM Cortex-A76, A77, A78 |
8 |
ARM Cortex-X1 |
16 |
3. ECP_gpu: Nvidia总平均 0.53;AMD 总平均 0.63
表3-3 部分GPU算力
微架构 |
FP64 |
Nvidia GPU |
|
Nvidia Volta |
1 |
Nvidia Turing (only GeForce 16XX) |
1/16 |
Nvidia Turing (all except GeForce 16XX) |
1/16 |
Nvidia Ampere (only Tesla A100/A30) |
2 |
AMD GPU |
|
AMD GCN Vega 20 (only Radeon Instinct MI50 / MI60 and Radeon Pro VII) |
16 |
AMD CDNA |
1 |
AMD RDNA |
1/8 |
表3-4 芯片按类别平均算力
设备类型 |
Intel CPU |
AMD CPU |
ARM Soc |
Nvidia GPU |
AMD GPU |
平均算力(FP64) |
9.22 |
6.33 |
4.67 |
0.53 |
0.63 |
以上的数据均为 FLOPs, 当设备只拥有一块 CPU 的情况时具体的 FLOPS通过以上公式计算,即浮点性能 (FLOPS) = 总运算核心数 x 每周期运算次数 x 处理器相对运作频率。
2. 各类型硬件占比或出货量
2.1 CPU 市场调研
根据 businessquant 网站的 2020 年 5 月发布的统计数据,AMD 的出货量在4 月份再次激增。按绝对值计算,AMD 在 4 月份售出了超过 45,000 片处理器,高于 3 月份的 19000 片。
另一方面,Intel 于 4 月份售出了约 4,300 片处理器,而 3 月份为 2,415 片。这意味着 AMD 和 Intel 在 4 月份的市场份额分别为 91% 和 9%。
以下基于德国零售商 http://mindfactory.de 德国最大的零售商之一)的销售数据。
MindFactory 每个月都会详细统计 AMD 锐龙、Intel 酷睿处理器的销售情况。自从发布 Zen3 架构以来,AMD 几乎完全击败了 Intel,尤其是在收入和平均销售价格方面。
虽然英特尔让步且大幅降价,但 AMD 却反其道而行之,以较为合适的价格开始售卖 Zen3。
这导致 AMD 自 Zen 1 推出以来首次出现,现在销售的 CPU 数量显著高于英特尔,每个 CPU 的平均销售价格也超过了英特尔。AMD 一款型号 5950X 的价格约 900 欧元,它热卖如潮。
2.2 Soc 市场 ARM 销售量:
图3-4 包含ARM核心的销售量
2.3 GPU 市场调研
表 3-5 GPU全球市场份额
公司 |
Q4 2016 |
Q4 2017 |
Q4 2018 |
Q4 2019 |
Q4 2020 |
Q1 2021 |
AMD |
29.50% |
33.70% |
18.80% |
31.08% |
17.00% |
20.00% |
Nvidia |
70.50% |
66.30% |
81.20% |
68.92% |
83.00% |
80.00% |
由于 DSP,FPGA,ASIC,NPU 的种类繁多且数据较难获取,故算力公式中仅以CPU,Soc,GPU 三类为主;
根据以上调研到的数据,我们可以把上述的算力计算公式除了设备数之外都具体到数值
表3-6 2020 年至 2022 年全球各类设备出货量
|
|
|
|
|
Ultramobile(顶级机型)类别包括微软的 Windows 10、Intel x86 产品与苹果的 MacBook Air 等。
Ultramobile(平板及翻盖式)类别包括 iPad、iPad mini、Samsung Galaxy Tab S2、Amazon Fire HD、Lenovo Yoga Tab 3、Acer Iconia One。
Ncpu:Nsoc:Ngpu = 145:100:1120 (i.e. 10.58:7.30:81.76≈11:7:82)。
每 100 个设备里,大约 11 块 CPU, 7 块 GPU, 82 块 Soc。
其中:
:用户所持有设备的 CPU 数
:用户所持有设备的 Soc 数
:用户所持有设备的 GPU 数
表3-7 2020年主要工业产品产量
产品名称 |
单位 |
产量 |
移动通信手持机 |
万台 |
146961.8 |
微型计算机设备 |
万台 |
37800.4 |
在 FLOPS 资料来源的中文页面上,我们可以得到几个具体的典型设备芯片的FLOPS,通过它们来重新构成上述公式
具体选择的典型代表以当世代最新的主流芯片为主:(但由于中文页面更新频率较低,所以得到的数据时效性也较低)。
表3-8 各类芯片代表的FLOPS
各类芯片代表 |
GFLOPS |
Intel Core i7-10700KF |
5470 |
AMD Ryzen 7 3700X |
5460 |
NVIDIA Tegra X1 |
512 |
Nvidia Ampere (only Tesla A100/A30) |
7200 |
AMD Radeon RX 5700 XT |
9754 |
此处仅单纯考虑了理想化的算力计算方式,算力用途以及功耗很多指标并未考虑在内。
cpui 代表 Intel 出产的 CPU,cpua代表 AMD 出产的 CPU; gpun 代表 Nvidia出产的 GPU,gpua 代表 AMD 出产的 GPU
[1] Wikipedia contributors, “FLOPS,” Wikipedia, The Free Encyclopedia, https://en.wikipedia.org/w/index.php?title=FLOPS&oldid=1052271908 (accessed October 31, 2021).
[2] https://businessquant.com/amd-and-intel-sales-volume
[3] https://imgur.com/a/Uvor6ep
[4]Wikipedia contributors, “Arm Ltd.,” Wikipedia, The Free Encyclopedia, https://en.wikipedia.org/w/index.php?title=Arm_Ltd.&oldid=1049541238(accessed November 11, 2021).
[5] https://businessquant.com/global-gpu-market-share
[6] Gartner, Forecast: PCs, Ultramobiles and Mobile Phones, Worldwide, 2017-2023, 4Q19 Update