欢迎访问ic37.com |
会员登录 免费注册
发布采购

微软宣布将使用英特尔的最新下一代Xeon处理集成FPGA

日期:2019-6-24 (来源:互联网)

英特尔宣布他们已经向特定客户提供集成FPGA加速器的Xeon 6138P Gold处理器。英特尔至强6138P包括一个Arria10 GX 1150 FPGA内核,和高达160Gbps的I/O吞吐量的带宽和高速缓存接口,可实现紧耦合加速。 Arria FPGA拥有自己的缓存,并通过Intel ultra fast UPI(Ultra Path Interconnect)接口与Xeon处理器连接。处理器和FPGA之间的数据共享不需要DMA访问,从而减少了编程复杂度。

据Anandtech报道,"Xeon Scalable Gold 6138已经开始发货,6138P上的x86芯片在两部分之间看起来完全相同:20C/40T CPU,2GHz基本时频率,可超频到3.7GHz;支持6通道DDR4内存。 PCIe通道数根据型号不同,基础版6138为48通道,6138P版为32通道相比。但是,可以肯定是这些通道中的16通道用于FPGA的带宽。据英特尔称,集成处理器Xeon的吞吐量比无FPGA的Xeon设备低一半,吞吐量提高了3.2倍。

英特尔在发布中宣称:"富士通,作为领先地合作伙伴计划计划发布集成FPGA和英特尔OVS设计的Intel ® Xeon®处理器系统。他们使用英特尔®虚拟交换的设计提高系统可靠性,可用性和可服务性(RAS)以及性能监视和调试辅助功能,对于网络环境更加强大。预计这一解决方案将在本周东京的富士通论坛上展示。

FPGA全称现场可编程门阵列(Field-Programmable Gate Array),主要用于专门集成电路领域中的一种半定制电路,具有一定的可编程性,可同时进行数据并行和任务并行计算,在处理特定应用时明显提高计算性能。Inetel 公司167亿美元收购Altera,从而获得了第一手的FPGA技术。在用此技术改进至强处理器后,使得计算性能提升了70%。

和CPU不同,FPGA和GPU一样,使用了内核大计算单元的架构,具有强大的计算能力。在进行深度运算等计算密集型的应用的时候,两者都比传统的CPU具很大优势。FPGA和GPU更具优势的地方时,FPGA硬件部分是可编程的,灵活性更强,可以通过不同计算任务设定不同的参数,而GPU则是架构固定,指令固定做不到。

随着AI,深度计算的快速发展,这种架构灵活和强大算力结合的芯片必然是以后芯片发展的趋势。

微软称其使用来自芯片制造商英特尔的FPGA技术,至少在某种程度上是为了Bing智能搜索功能的性能。该公司的搜索引擎现在能够收集来自多个来源的信息,并将其调查结果作为事实分析的参考。这种用较少时间获取网上信息的方法是智能搜索功能集合的一部分,该功能基于一个深度学习加速平台Project Brainwave。

Project Brainwave是一个运行在英特尔Arria和Stratix 10 FPGA上的深度神经网络系统,它使人工智能工作负载在几毫秒内就可以得到结果。 Arria FPGA由可编程逻辑器件制造商Altera生产,英特尔在2015年以约167亿美元收购。 StraTIx 10 FPGA结合了14纳米制造工艺和英特尔HyperFlex结构架构,可加速大规模工作负载。

微软代表在一篇博客文章中写道:“英特尔的FPGA芯片使Bing能够在整个网络上快速阅读和分析数十亿文件,并在不到一秒的时间内为您的问题提供最佳答案。“英特尔的FPGA器件不仅为Bing提供实时性能,保持我们用户的搜索速度,而且还能灵活地使用越来越先进的技术持续快速创新,为您带来更多智能答案和更好的搜索结果。”

微软估计,FPGA的智能搜索模式所产生的延迟减少了10倍,同时使搜索模型的规模增加了10倍。

虽然它们可能会提升当今最棘手的IT工作负载的性能,但FPGA很快将会受到来自Xilinx的自适应计算加速平台(ACAP)芯片的竞争。加利福尼亚州圣何塞市的FPGA公司于3月19日宣布推出一种专有芯片,与公司自己的Virtex VU9P FPGA相比,其深层神经网络性能可提高20倍。

Bing的新智能搜索功能包括行话查询功能,技术术语或其他不常用的单词。 Bing现在自动识别这些类型的单词并高亮它们,当用户将鼠标悬停在某个术语上时将显示一个解释。对于DIY套件,微软正在开发一项新功能,为问题解答提供多个答案。这种方法派上用场,当查询可能不足以产生正确答案或用户难以提出正确类型的问题时。该功能将在未来几周内启用。