“2019飞腾生态伙伴大会”上,百.度昆仑芯片总经理欧阳剑透露,旗下昆仑AI芯片正在适配国产飞腾服务器,做性能调优工作。
三星代工和百度本周表示,两家公司将在2020年初开始批量生产AI加速器芯片。百度的昆仑芯片将使用三星成熟的14纳米制程技术制造,并使用该公司的Interposer-Cube 2.5 D封装结构。
中研产业研究院《2019-2025年中国AI芯片行业深度调研与投资前景预测报告》介绍,昆仑AI芯片是基于百.度自研的XPU神经处理器架构,采用三星2.5D I-Cube封装工艺,经由中介层连接SoC主芯片和两颗HBM2高带宽内存,统一封装在一块基板上,提供高达512GB/s内存带宽,并支持PCIe 4.0 x8,可在150W功耗下提供260TOPS(每秒260万亿次操作)的算力。这款芯片预计在明年初量产。
百度昆仑AI加速器基于该公司的XPU神经处理器架构,该架构使用数千个小内核,这些小内核可用于云和网络边缘的各种应用程序。该芯片在150瓦特下可提供每秒260万亿次操作(TOPS),并使用两个HBM2内存封装提供512 GB / s的内存带宽。值得注意的是,当SoC 在2018年中期推出时,其TDP被描述为下降100瓦,因此最终产品似乎未达到最初的功耗目标。
据百度称,其昆仑芯片在ERNIE(具有信息实体的增强语言表示)推理应用程序中的速度是传统GPU或FPGA的三倍。此外,它还可以用于自动驾驶(假设可以减轻其150 W TDP),语音识别,图像处理和深度学习。
而与飞腾服务器的适配,包括三个方面:算力、架构、技术。
新算力层面,AI对对算力的需求是无止境的,飞腾本身就是高性能的64位处理器,昆仑芯片基于飞腾,完全可以带来新算力。
新架构层面,飞腾是从云到端的通用计算架构,同一套架构支持不同的场景。而百.度昆仑正好采用XPU架构,两者结合有机会打造新的架构,百.度昆仑称之为“普适架构”。
新技术层面,信息产业的迭代,底层技术例如芯片和操作系统,一直是国外巨头占据主导地位。但每一次迭代,都是一次洗牌的机会,当前处于AI+智能云的时代,芯片架构发生了很大变化,也涌现出了很多新操作系统。百.度昆仑+国产OS,加国产的深度学习的框架,加上新时代的应用,会出现新的技术,这种技术将是全国产的技术。