新闻资讯

了解最新公司新闻及行业资讯

计算论坛 | 从芯片异构,到系统层的CPU平台异构
发布:创始人时间:2023-02-10 10:22:36

遇贤微电子CTO陈争胜在由高效能服务器和存储技术国家重点实验室和开放计算中社区联合主办的 “异构计算研究与实践”第七期开放计算技术沙龙上,进行了芯片异构计算的技术分享。以“打破边界,从芯片异构到系统异构”为主题,对多层次的异构方案和实践,以及未来的机会做了深入解析。
联合承办方高效能服务器和存储技术国重实验室副主任公维锋在开场致辞中表示,异构计算已经成为推动IT硬件重构的重要力量,能够将不同架构的硬件单元整合到一起进行并行计算,用专用的硬件去做最适合的事,来达到性能和成本的优化,从而能够化解算力瓶颈,助力算力增长。高效能服务器和存储技术国家重点实验室首席研究员叶毓睿主持和开场分享了最近的一些思考和观点。他表示,我们面临着算力多元化,需求猛增,多元算力、异构计算、边缘计算、散热技术和一起皆是计算的硬件重构方向等趋势和相关技术的研究和实践,成为近些年来的热点。
遇贤微电子CTO陈争胜的分享内容有三部分,第一部分是从行业专家的经验和整个产业变迁历史来看服务器 CPU发展趋势与商业切入机会。
1675995952845.png
第二部分是以遇贤微电子正在设计的芯片为例来介绍在芯片设计过程中的多层级异构的研究与设计实践。
第三部分是关于异构带来的挑战和机会,以及 CPU公司和系统公司应该如何来协同面对这些挑战,抓住这些机会。
进入到智能时代后工艺红利与架构红利等一些低垂的果实都已经被摘完,计算进入到多样性计算的阶段。回顾整个演变的过程,从Power\SPARC等向x86转变是非常清晰的,但这个过程并不是自然发生的,而是很多业界的同仁,基于技术的优势与商业的利益去推动完成转变。遇贤微电子创始人罗勇博士当年从超算实验室到英特尔工作,极大地推动x86架构在服务器领域的迅速发展和高速的市场占用。
Arm架构无论是在端侧还是在最近非常热门的数据中心侧,其发展与生态的建立也是经历了很长的时间与很多人的努力。遇贤联合创始人姬信伟总裁在Linaro工作期间,凝聚国内众多厂家,推动了Arm架构在服务器领域的应用。
现在除了 Arm、x86,还有RISC-V,未来会进入一个更加多样化的计算时代。遇贤微电子的研发主要围绕Arm架构,同时也协助RISC-V的发展。计算行业的发展背后是由摩尔定律和登纳德定律所描述的技术演进规律。登纳德定律已经失效,摩尔定律还在延续。遇贤微电子首款高性能160核CPU 集成的晶体管数量将超过800亿,未来的产品也会按照摩尔定律描述的集成度提升速度演进。
1675996076849.png
CPU最大的一个障碍是生态,生态有软件生态和硬件生态,软件生态本质上来说是关于一个软件供应链的问题。除了生态外,还有很多“墙”需要去打破,需要非常多的技术手段,有些措施会导致另外一个“墙”变得更严重,比如说不恰当地采用异构架构降低功耗,可能反而会带来生态的问题。要设计好一款高性能 CPU芯片,一个能够大规模量产,实现商业价值的芯片,必须非常巧妙的去应对多重技术难题。
针对技术与产品上这些困难和演进趋势,遇贤有大量的异构研究与实践。第一种异构就是集成一些加速引擎模块,这是最传统的异构设计,如遇贤CPU集成了200Gbps吞吐处理能力的数据加速引擎,支持各种国际密码算法、中国国家商用密码算法的处理。
1675996133951.png
也可以根据应用场景的需求和芯片的系统架构,集成一些视频、AI加速功能。另外一个是CPU核的异构,同一个芯片上集成不同大小的处理器核。大小核的技术,在数据中心或者企业级应用中有没有价值,需要根据应用场景,根据客户的应用诉求做更具体的分析。
1675996186739.png
第二个层次就是封装类的异构,通过一致的接口实现不同Die封装到同一个芯片。这个待定的接口是非常关键的。对于CPU及XPU的多Die互联,遇贤微电子定义了清晰的接口,支持多芯片的扩展,可以和合作伙伴一起,为客户提供定制化服务。该接口基于开放的AMBA协议构建多die之间的存储一致性系统,支持采用低成本的MCM先进封装技术。 
下一个层级就是系统级。整个系统层级除 CPU以外那还有 memory,各种加速卡,NVMe存储设备,网络接口设备等。系统层面上具有大量通过异构设计进行差异化和性能提升的机会。
1675996226041.png
遇贤微电子CPU支持CXL2.0协议,支持系统扩展CXL Memory,也支持通过CXL协议扩展GPGPU等芯片,通过共享内存的编程方式构建一个“内存一致”的异构系统。
异构会带来很大的收益,但也会带来行业碎片化的挑战。对于系统厂商来说,原来只有很少单板类型,但随着多样性计算、异构计算的引入,单板的数量、系统的配置种类就会变得非常多。如何从技术应对,一个直接的思路就是引入若干抽象层级,比如对芯片封装、PINMAP等物理形态做一些抽象后,遇贤CPU第一代和第二代之间支持单板层面的兼容。
在单一架构的情况下,整个计算生态和整个产业的价值被少数上游芯片公司所把持和垄断。随着以多样性 cpu计算平台为核心,以及各种xPU卡的生态完善,以CPU原厂和系统厂商一起主导的异构计算生态会是一个极佳的重构产业价值链的机会。
1675996268803.png
随着数字经济的迅猛发展,云计算、AI、5G等领域对计算量需求激增,同时数据信息安全进入到发展深水区,传统的体系架构已面临多方面性能瓶颈和发展挑战,异构计算作为突破点和新抓手,将深刻影响智算中心、数据中心、边缘计算等系统架构。遇贤以CPU为中心,依托多年技术体系化发展的积累,将持续在异构计算中芯片、系统、软件等多层次贡献技术价值,与生态公司,共同发展。