提示:下载链接在文章最后。
HOTCHIPS是一个关于计算机体系结构和电子设计的会议,主要探讨芯片设计、存储器、能源效率、机器学习和人工智能等方面的发展。该会议每年都会召开一次,吸引着来自世界各地的专业人士和研究人员。
在HOTCHIPS 2020年会上,由于新冠疫情的影响,会议改为了线上举行。尽管如此,许多重要的芯片设计和技术仍然被展示和讨论,包括Trent XT、EUV光刻机、Zen 4、128-Tensor TPU等。会议还讨论了未来芯片设计的趋势,例如定制芯片、量子计算等。
此外,AMD在会议上介绍了其未来的芯片设计策略,即推出基于Zen 4微架构的第四代EPYC服务器处理器,并强调了5nm制程技术的重要性。同时,其他公司也在会议上展示了多款5nm产品,包括Nvidia的A100 GPU、高通的新款服务器芯片等。
总之,HOTCHIPS 2020年会议是一个关于计算机体系结构和电子设计的重要论坛,尽管由于疫情改为线上举行,但仍然讨论了许多重要的芯片设计和技术。
HOTCHIPS(High-Performance Chips)是一个聚焦于微处理器和半导体技术的年度技术会议,主要的主题:
新一代处理器架构和设计:HOTCHIPS会议通常会介绍最新的处理器架构、设计方法和优化技术,以及如何在高性能和能效之间取得平衡。
人工智能硬件:人工智能领域的硬件加速器、神经网络处理器、深度学习芯片等技术在HOTCHIPS可能会得到深入讨论。
高性能计算和超级计算机:针对高性能计算和超级计算机的硬件设计、体系结构和优化也是会议的重点。
新型存储技术和存储层次:会议可能关注新型存储技术,如非易失性存储器(NVM)、快闪存储器,以及如何在存储层次中进行优化。
封装和互联技术:芯片封装、高速互联技术、片上系统(SoC)互联等方面的创新也可能是HOTCHIPS的热门话题。
边缘计算和物联网:边缘计算、物联网设备的硬件设计和优化在HOTCHIPS可能会得到关注。
安全性和隐私保护:硬件安全性和隐私保护是当前热门话题,会议可能会涵盖与之相关的技术。
新兴技术和趋势:HOTCHIPS可能会关注半导体技术领域的新兴趋势,如量子计算、光计算、生物计算等。
会议要点摘录:
HotChips全称为A Symposium on High Performance Chips,每年8月份举行。不同于其他会议以学术研究前沿为主,HotChips是一场产业界的盛会,以各大处理器设计公司的最新产品或在研产品为主。IBM、Intel、AMD、ARM等都是HotChip会议的常客。HotChips能够让从业者了解产业发展趋势。
HotChips2020一共规划了8个Section,覆盖了服务器处理器、移动处理器、边缘计算和传感、GPU和游戏架构、FPGA和可配置架构、网络和分布式系统、机器学习训练以及机器学习推断。Section的规划还是比较传统的。
HotChips没有论文集,只提供幻灯片。两天的会议一共进行25篇演讲,其中有23篇来自产业界,只有2篇来自学术界(分别来自哈佛大学和苏黎世理工大学),而且都与AI加速器有关。另外会议还接受了11篇Poster,以学术界成果为主。会议还安排了2个主题演讲,分别由Intel架构师Raja M. Koduri带来的《No Transistor Left Behind》和DeepMind杰出工程师Dan Belov带来的《AI Research at Scale-Opportunities on the Road Ahead》。
服务器处理器
Section1有4篇演讲,分别涉及Intel的IceLake-SP架构、IBM的POWER10处理器和z15处理器以及Marvell的ThunderX3处理器。
Icelake-SP架构使用10nm+工艺,采用Sunny Cove大核。相对于Cascake Lake,Ice Lake的IPC提高了18%,主要原因是大比例增加的各种资源,比如乱序执行窗口、物理寄存器、L1 Cache等。演讲的主要内容集中于IceLake-SP的系统架构,主要改进包括:可扩展的功耗控制、系统管理机制,可以减少SoC管理的复杂度,改进响应时间;对Cache机制的调整,缩短Cache的响应时间,提高通信带宽;从电路、算法和架构层面改进DVFS的效果。Intel将处理器核的电压频率调整时间缩短到0,体现了Intel的电路优化的根基。
系统架构vs微架构
对于处理器领域来说,很多概念需要正本清源。第一个需要着重说明的就是微架构和系统架构。虽然都是架构设计,但是差别很大。微架构指的是处理器内部流水线的架构设计,也就是“取指-执行-发射-执行-回写-退休”这一个过程。系统架构的范围比微架构大得多。系统架构原本指的是整个计算机系统的架构,包括了CPU、总线、外设等构成完整系统。随着芯片集成度的提高,单个芯片也能实现一个完整系统,也就是片上系统(SoC)。SoC的系统架构包括内存系统、互联结构、加速器以及系统管理等等。所以,系统架构和微架构的侧重点和覆盖范围的区别还是很大的。
2010年之前,是微架构的黄金时代,各种微架构的概念层出不穷。不过最近10年,处理器微结构的设计逐渐趋同,已经形成了以超标量、乱序执行等为主要特征的CPU微架构,还有多核缓存、分支预测、同时多进程等典型特性。不仅仅是高性能CPU,甚至嵌入式和边缘计算场景的处理器也开始具备这些特征。此次HotChips2020中介绍的处理器微架构都符合这一特征。各家处理器的微架构非常相似,甚至关键的调度和预测算法都是相同的,相互对标的产品的架构参数也很接近的。
这种情况是处理器追求通用性的必然结果。如果按照集成电路的通用性和专用性做一个坐标轴的话,那么现在讨论的这种处理器就是各种集成电路中最为通用的一种。通过软件的参与,处理器可以完成世界上绝大部分的工作。对于通用性的要求,使得处理器的微架构需要满足对各种类型程序的支持,同时也失去了对特性应用优化的动力。正如Intel在演讲中提到,IceLake是对于所有类型的服务和应用都很平衡的处理器。
2010年之后,在“多核、众核”以及“异构”两大概念的推动下,系统架构的研究成为热点。各类处理器的系统架构的区别还是很明显的。
对于服务器处理器,设计目标主要是冲刺高性能。在微架构优化空间缩小的情况下,需要通过充分挖掘线程级并行(TLP)来获得更高的性能。所以,服务器处理器以众核同构集成为主,并通过环形或者Mesh互联结构来提高互联带宽,再通过优化cache协议来提高有效的访存带宽。在服务器处理器中集成一些特定业务场景的加速器也是一个明显的潮流。
对于移动端处理器,设计目标是为多功能场景提供能效最高的解决方案。常见的架构是4到8个不同规格的处理器(大-小核或大-中-小核)通过共享内存集成。同时集成在芯片中还有图形处理器、视频处理器、音频处理器、以及AI处理器等。这些加速器的存在保证了芯片在多媒体、AI等场景的用户体验。
对于边缘计算处理器,处理器已经完全不是重点了。设计重点完全转换到加速器电路上。处理器是用来处理不适合加速器电路完成的工作,比如控制类和交互类的事务。边缘计算场景处理器的微架构有可能不会遵循目前流行的处理器微架构,因为在有些特定场景,处理器的功耗比性能更加重要。单一边缘计算处理器的应用场景比服务器或移动端处理器要狭小很多,从而可以针对业务需求进行优化和调整。
随着IOT和AI的蓬勃发展,面向不同场景的SoC的系统架构会有明显的不同。系统架构师的主要工作就是,针对产品的应用场景,选择最合适的IP并将其集成为SoC。这也就是大神为什么称“未来的十年(应该还剩八年)是体系架构的黄金十年的原因”。
工艺、电路、架构、功能
私以为,支撑处理器指标(性能、功耗、面积)的主要因素包括四个方面, 分别是制造工艺、电路设计、系统架构和功能实现。
制造工艺是决定芯片的规模、功耗和频率的关键。集成电路设计领域有一个显著的特点,其能力边界并不是由设计师本身决定的,而是由半导体领域决定的。设计师只能做到最大程度地挖掘制造工艺给集成电路设计划定的边界。在处理器行业,鲜有通过架构设计来弥补工艺代差的例子。更多的例子都是通过抢占工艺制高点来提高芯片的各种指标,尤其在国内厂商更加常见。目前,性能最好的处理器都尽可能使用最先进的工艺,比如TSMC的7nm或5nm。在工艺方面的失守会给处理器设计带来很大的压力。
在本文中,电路设计特指的是在标准单元甚至以下层面进行的电路设计,比如定制SRAM和计算电路等。对于处理器来说,提供更多的资源(分支预测表容量、ROB队列深度、Load/StoreQ深度以及Cache容量等)对于提升处理器性能的作用远远大于处理器微架构的改进。可以看到,Intel每一代处理器的Cache容量都有至少50%以上的提升。资源的提升除了借助于工艺之外,还要借助于电路设计。在今年的ISSCC上,AMD和IBM都提到了他们与制造商合作,在SRAM上所做的优化。国内厂商即便使用了相同的工艺,也很难做到相同的资源容量和频率,这其中的差距就在于电路设计。
制造工艺和电路设计限定了处理器设计的边界,系统架构和微架构的目的就是挖掘这些边界,在性能、功耗和频率中某方面做到极致,或者在各个方面之间平衡。处理器的微架构已经基本稳定,国内处理器公司要做的是补课,做到不缺重要特性。系统架构还有很多的探索空间。架构设计可以利用的IP和参考的资料也很多。而且现在已经出现了系统级设计(ESL)的工具平台,比如Synopsys的Platform Architecture,以及强大的emulation工具,比如Zebu和Haps。搭配出一种系统架构的难度正在降低。近两年,国内厂商对于系统架构工程师的需要有所增加,但是对于微架构工程师的需求依然很小。
功能实现不仅仅包括通过加速器给片上系统添加功能,也包括实现各种调度和预测算法等。功能实现和电路设计的区别在于,功能实现利用标准单元实现逻辑,属于设计流程中的前端设计范畴,而电路设计则需要从晶体管级别重新设计电路,属于设计流程中的物理设计范畴。功能实现有完善的设计流程和设计工具可用。功能实现对于产品来说很重要。通过实现某一种加速器,可能会使得产品在某一个领域获得很好的市场占有率。
—————————————–
全部会议资料下载链接分享:
链接:https://pan.baidu.com/s/1JOZ-81KA3s5IfSkm04rlWw?pwd=qxcc
提取码:qxcc
本文使用 文章同步助手 同步