GPU和FPGA优缺点的对比详细概述你现在要开始了解FPGA了

FPGA极客空间 2018-06-10 11:44 次阅读
GPU和FPGA优缺点的对比详细概述你现在要开始了解FPGA了 我知道,我对与电子有关的所有事情都很着迷,但不论从哪个角度看,今天的现场可编程门阵列(FPGA),都显得“鹤立鸡群”,真是非常棒的器件。如果在这个long8龙8国际pt时代,在这个领域,想拥有一技之长的你还没有关注FPGA,那么世界将抛弃你,时代将抛弃你。 从几个方面来介绍一下GPU和FPGA。 从峰值性能来说,GPU(10Tflops)远远高于FPGA(<1TFlops)。GPU上面成千上万个core同时跑在GHz的频率上还是非常壮观的,最新的GPU峰值性能可达10TFlops以上。GPU的架构经过仔细龙8国际下载(例如使用深度流水线,retiming等技巧),在电路实现上是基于标准单元库而在critical path上可以用手工定制电路,甚至在必要的情形下可以让半导体fab依据龙8国际下载需求微调工艺制程,因此可以让许多core同时跑在非常高的频率。相对而言,FPGA首先龙8国际下载资源受到很大的限制,例如GPU如果想多加几个core只要增加芯片面积就行,但FPGA一旦你型号选定了逻辑资源上限就确定了(浮点运算在FPGA里会占用很多资源)。而且,FPGA里面的逻辑单元是基于SRAM-查找表,其性能会比GPU里面的标准逻辑单元差好多。最后,FPGA的布线资源也受限制(有些线必须要绕很远),不像GPU这样走ASIC flow可以随意布线,这也会限制性能。 除了芯片性能外,GPU相对于FPGA还有一个优势就是内存接口。GPU的内存接口(传统的GDDR,最近更是用上了HBM和HBM2)的带宽远好于FPGA的传统DDR接口,而众所周知服务器端机器学习算法需要频繁访问内存。 GPU和FPGA优缺点的对比详细概述你现在要开始了解FPGA了 但是从灵活性来说,FPGA远好于GPU。FPGA可以根据特定的应用去编程硬件(例如如果应用里面的加法运算非常多就可以把大量的逻辑资源去实现加法器),但是GPU一旦龙8国际下载完那就没法改动了,没法根据应用去调整硬件资源。目前机器学习大多数适合使用SIMD架构(即只需一条指令可以平行处理大量数据),因此用GPU很适合。但是有些应用是MISD(即单一数据需要用许多条指令平行处理,微软在2014年ISCA paper里面就举了一个MISD用于并行提取feature的例子),这种情况下用FPGA做一个MISD的架构就会比GPU有优势。不过FPGA的编程对于程序员来说并不容易,所以为了能让机器学习程序员能方便地使用FPGA往往还需要在FPGA公司提供的编译器基础上进行二次开发,这些都是只有大公司才能做。 FPGA实现的机器学习加速器在架构上可以根据特定应用优化所以比GPU有优势,但是GPU的运行速度(>1GHz)相比FPGA有优势(~200MHz)。 GPU和FPGA优缺点的对比详细概述你现在要开始了解FPGA了 所以,对于平均性能,看的就是FPGA加速器架构上的优势是否能弥补运行速度上的劣势。如果FPGA上的架构优化可以带来相比GPU架构两到三个数量级的优势,那么FPGA在平均性能上会好于GPU。例如,百度在HotChips上发布的paper显示,GPU的平均性能相比FPGA在矩阵运算等标准batch data SIMD bench上远好于FPGA;但是在处理服务器端的少量多次处理请求(即频繁请求但每次请求的数据量和计算量都不大)的场合下,平均性能会比GPU更好。 GPU和FPGA优缺点的对比详细概述你现在要开始了解FPGA了 功耗方面,虽然GPU的功耗(200W)远大于FPGA的功耗(10W),但是如果要比较功耗应该比较在执行效率相同时需要的功耗。如果FPGA的架构优化能做到很好以致于一块FPGA的平均性能能接近一块GPU,那么FPGA方案的总功耗远小于GPU,散热问题可以大大减轻。反之,如果需要二十块FPGA才能实现一块GPU的平均性能,那么FPGA在功耗方面并没有优势。 能效比的比较也是类似,能效指的是完成程序执行消耗的能量,而能量消耗等于功耗乘以程序执行的时间。虽然GPU的功耗远大于FPGA的功耗,但是如果FPGA执行相同程序需要的时间比GPU长几十倍,那FPGA在能效比上就没有优势了;反之如果FPGA上实现的硬件架构优化得很适合特定的机器学习应用,执行算法所需的时间仅仅是GPU的几倍或甚至于接近GPU,那么FPGA的能效比就会比GPU强。
原文标题:谈谈GPU与FPGA的一些看法 文章出处:【微信号:ALIFPGA,微信公众号:FPGA极客空间】欢迎添加关注!文章转载请注明出处。
收藏 人收藏
分享:

评论

相关推荐

无芯可用,谁将是人脸识别的最佳伴侣?

在这一波AI浪潮中,人脸识别作为爆发点,是目前成长最为迅速的AI应用。
的头像 芯师爷 发表于 08-21 17:35 317次 阅读
无芯可用,谁将是人脸识别的最佳伴侣?

FPGA是什么?数字芯片之母

当FPGA 80年代出现后,很快就变成了各家数字芯片公司开发的必需品,没有FPGA之前,数字芯片开发....
的头像 FPGA极客空间 发表于 08-21 14:51 86次 阅读
FPGA是什么?数字芯片之母

为什么以FPGA来说嵌入式的出路?

你一般就业面很广,但时时刻刻会听到或接触FPGA,这很正常,因为FPGA这些年一年比一年好,很有....
的头像 FPGA2嵌入式 发表于 08-21 14:35 76次 阅读
为什么以FPGA来说嵌入式的出路?

卷积码编码及译码实验 浅谈卷积编码下的FPGA实现

卷积编码是现代数字通信系统中常见的一种前向纠错码,区别于常规的线性分组码,卷积编码的码字输出不仅与当....
的头像 沈丹 发表于 08-21 10:26 107次 阅读
卷积码编码及译码实验 浅谈卷积编码下的FPGA实现

FPGA结构原理

发表于 08-21 10:08 13次 阅读
FPGA结构原理

FPGA与CPLD

发表于 08-21 10:07 13次 阅读
FPGA与CPLD

“老司机”:我不推荐因找工作而学习FPGA

最近的几篇论文都改好投出去了,希望后面有好的结果。暂时也就有点闲暇时间空出来了,好久没有写龙8娱乐城官网文章来总结提炼一下了,今天...
发表于 08-21 09:54 136次 阅读
“老司机”:我不推荐因找工作而学习FPGA

为什么微软选择FPGA做AI?

AI计算的几条路线 1993年,当黄仁勋等三个电子工程师在加州圣何塞的一家餐馆碰头准备成立一家图形处理芯片公司时,他们还不...
发表于 08-21 09:50 116次 阅读
为什么微软选择FPGA做AI?

FPGA中系统运行频率计算方法

我们的龙8国际下载需要多大容量的芯片?我们的龙8国际下载能跑多快?这是经常困扰工程师的两个问题。对于前一个问题,我们可能还能先以一个比较...
发表于 08-21 09:46 91次 阅读
FPGA中系统运行频率计算方法

FPGA代码优化方法和准则

一、 面积类 1、不进行不必要的数据清零。     说明:一般在数据总线赋值额时候,习惯加上例如的:“else dout ...
发表于 08-21 09:36 79次 阅读
FPGA代码优化方法和准则

如何扩展FPGA的工作温度范围?

  一位客户请求我们 Aphesa 的团队龙8国际下载一款能够在油井中工作的高温摄像头(如图 1 所示)。该器件要求使用相当大的 FPGA...
发表于 08-21 09:31 86次 阅读
如何扩展FPGA的工作温度范围?

学FPGA有前途吗?FPGA有哪些发展方向?

目前FPGA的应用主要是三个方向:   第一个方向,也是传统方向主要用于通信设备的高速接口电路龙8国际下载,这一方向主要是用F...
发表于 08-21 09:23 38次 阅读
学FPGA有前途吗?FPGA有哪些发展方向?

IC insights:2018年上半年全球前15大半导体厂商榜单揭晓

IC Insights的这份调查预测,2018年三星半导体销售额的84%为内存,比去年上升3%。此外....
的头像 章鹰 发表于 08-21 09:22 437次 阅读
IC insights:2018年上半年全球前15大半导体厂商榜单揭晓

学习FPGA有哪些书可以推荐一下?

《Verilog数字系统龙8国际下载教程(第二版)》 夏宇闻 《深入浅出玩转FPGA(内附光盘一张)》 吴厚航 这本书有视频教程 《A...
发表于 08-21 09:20 33次 阅读
学习FPGA有哪些书可以推荐一下?

一种以FPGA为基础的多路模拟信号自适应采集系统龙8国际下载

目前,在PCM/FM遥测体系中模拟信号采集普遍采用8位量化,全部模拟信号均归一化到O~5 V范围内....
发表于 08-21 09:20 29次 阅读
一种以FPGA为基础的多路模拟信号自适应采集系统龙8国际下载

[AD16资料分享]Altium Designer 16电路龙8国际下载与仿真从入门到精通(PDF+教学视频)

《altium designer 16电路龙8国际下载与仿真从入门到精通》以Altium Designer 16为平台,介绍了电路龙8国际下载的方法和技巧。 《alti...
发表于 08-21 08:33 68次 阅读
[AD16资料分享]Altium Designer 16电路龙8国际下载与仿真从入门到精通(PDF+教学视频)

FPGA在大数据时代的机遇与挑战

8月8日,英特尔在美国总部召开了名为“以数据为中心(Data-Centric)”的创新峰会。在会上,....
的头像 罗欣 发表于 08-20 14:40 443次 阅读
FPGA在大数据时代的机遇与挑战

赛灵思推出Spartan-7 FPGA系列密集型器件,能够快速集成和实现

赛灵思公司为成本敏感型应用推出灵活的 I/O 密集型器件——Spartan-7 FPGA系列。该新....
发表于 08-20 10:48 29次 阅读
赛灵思推出Spartan-7 FPGA系列密集型器件,能够快速集成和实现

赛灵思推出高级龙8国际下载工具,能大幅简化无线电算法的龙8国际下载生产力

赛灵思推出业界领先的高级龙8国际下载工具System Generator for DSP 2015.3版,....
发表于 08-20 10:13 56次 阅读
赛灵思推出高级龙8国际下载工具,能大幅简化无线电算法的龙8国际下载生产力

华为计划10月推出Mate 20搭配麒麟980,全球首款商用7nm芯片

华为向南非媒体发布官方消息,华为消费者业务CEO余承东证实,麒麟980处理器将在今年9月份的IFA展....
的头像 摄像头观察 发表于 08-19 09:22 673次 阅读
华为计划10月推出Mate 20搭配麒麟980,全球首款商用7nm芯片

深度神经决策树:深度神经网络和树模型结合的新模型

近日,来自爱丁堡大学的研究人员提出了一种结合深度神经网络和树模型的新型模型——深度神经决策树(Dee....
的头像 将门创投 发表于 08-19 09:14 307次 阅读
深度神经决策树:深度神经网络和树模型结合的新模型

美高森美综合龙8国际下载软件工具最新版本Libero SoC Version 11.6,主要用于FPGA产品开发

美高森美公司(Microsemi) 宣布发布用于其最新现场可编程门阵列(FPGA)产品开发的综合设....
发表于 08-19 09:04 97次 阅读
美高森美综合龙8国际下载软件工具最新版本Libero SoC Version 11.6,主要用于FPGA产品开发

从数据、算力、算法、教学总结机器学习的民主化

Siraj Raval从数据、算力、算法、教学四个方面总结了近年来机器学习是如何民主化的
的头像 论智 发表于 08-18 11:35 323次 阅读
从数据、算力、算法、教学总结机器学习的民主化

以FPGA为核心控制的电子龙8国际下载竞赛电路板龙8国际下载和实现

大学生电子竞赛题目以模拟电子、数字电子、可编程逻辑器件及单片机龙8娱乐城官网为核心, 涉及电子仪器仪表、通信、....
发表于 08-18 10:03 118次 阅读
以FPGA为核心控制的电子龙8国际下载竞赛电路板龙8国际下载和实现

以FPGA为核心的纯数字真随机数发生器龙8国际下载与实现

其中n是输入序列的个数,bi是每个序列的偏置。容易看出b≤bi(1≤i≤n),等式当且仅当在bi=0....
发表于 08-18 10:00 80次 阅读
以FPGA为核心的纯数字真随机数发生器龙8国际下载与实现

以FPGA为控制核心的程控滤波器龙8国际下载

方案1:数字电位器控制两级INA129级联。用FPGA控制数字电位器DS1267使其输出不同的阻值,....
发表于 08-18 09:56 64次 阅读
以FPGA为控制核心的程控滤波器龙8国际下载

以FPGA机载为核心的实时视频图形处理系统龙8国际下载

结合系统需求,确定系统的总体龙8国际下载方案为:以Xilinx公司的Virtex-5 XC5VFX70T F....
发表于 08-18 09:53 75次 阅读
以FPGA机载为核心的实时视频图形处理系统龙8国际下载

怎样利用FPGA龙8国际下载一个跨时钟域的同步策略?

触发器是FPGA龙8国际下载中最常用的基本器件。触发器工作过程中存在数据的建立(setup)和保持(hold....
发表于 08-18 09:50 49次 阅读
怎样利用FPGA龙8国际下载一个跨时钟域的同步策略?

如何利用FPGA龙8娱乐城官网来解决DSP的龙8国际下载难题?

如果采用MAC模式,DSP48则非常适用,因为DSP48 Slice内含输入寄存器、输出寄存器和加法....
发表于 08-18 09:47 241次 阅读
如何利用FPGA龙8娱乐城官网来解决DSP的龙8国际下载难题?

SPI总线是什么?FPGA串行外围接口SPI龙8国际下载应如何实现?

在数据串并转换的过程中, 必须用到寄存器来存放临时数据。一般情况下,发送数据需要1 个发送寄存器,接....
发表于 08-18 09:43 64次 阅读
SPI总线是什么?FPGA串行外围接口SPI龙8国际下载应如何实现?

1394b数据传输有什么特点?如何利用FPGA龙8国际下载一个1394b双向数据传输系统?

随着时代和龙8娱乐城官网的发展,对于数据总线带宽的要求越来越高,现有的总线标准越来越难以满足实际应用中对高总线....
发表于 08-18 09:40 66次 阅读
1394b数据传输有什么特点?如何利用FPGA龙8国际下载一个1394b双向数据传输系统?

如何利用FPGA硬件实现固定倍率的图像缩放?

近年来,FPGA龙8娱乐城官网发展迅速,片内集成了PLL、硬件乘法器、存储器,具有了实现优秀算法的充足资源。许....
发表于 08-18 09:36 47次 阅读
如何利用FPGA硬件实现固定倍率的图像缩放?

如何用FPGA实现UART电路龙8国际下载?

发送数据由接口模块控制,接口模块给出w rn 信号,发送器根据此信号将并行数据锁存,并通过发送保持寄....
发表于 08-18 09:33 80次 阅读
如何用FPGA实现UART电路龙8国际下载?

赛灵思推出Vivado龙8国际下载套件HLx版本,助力SoC和FPGA以及打造可复用的平台

赛灵思公司推出 Vivado 龙8国际下载套件 HLx 版本,为All Programmable SoC ....
发表于 08-17 11:43 139次 阅读
赛灵思推出Vivado龙8国际下载套件HLx版本,助力SoC和FPGA以及打造可复用的平台

关于使用FPGA三段式状态机的三点好处,你有什么看法?

用三段式描述状态机的好处,国内外各位大牛都已经说的很多了,大致可归为以下三点:
发表于 08-17 11:43 56次 阅读
关于使用FPGA三段式状态机的三点好处,你有什么看法?

一位fpga工程师的烦恼

你是否体会,你的职业路途遥远,前方很迷茫。
的头像 工程师人生 发表于 08-17 10:42 344次 阅读
一位fpga工程师的烦恼

FPGA学习系列:30. 数模转换的龙8国际下载(DA)

龙8国际下载背景: 数模转换器( Digital to Analog Converter)即DAC,是数字世....
的头像 FPGA学习交流 发表于 08-17 09:52 1045次 阅读
FPGA学习系列:30. 数模转换的龙8国际下载(DA)

简谈基于fpga龙8国际下载9/7小波变换原理

大家好,又到了每日学习的时间了,今天我们来聊一聊基于fpga龙8国际下载9/7小波变换原理。 9/7小波变换....
的头像 FPGA学习交流 发表于 08-17 09:52 529次 阅读
简谈基于fpga龙8国际下载9/7小波变换原理

彻底变革工作流程,NVIDIA推出首款基于Turing架构GPU

NVIDIA今日宣布推出首款基于Turing™ 架构GPU,为五千万龙8国际下载师和艺术家带来实时的逼真场景....
的头像 英伟达NVIDIA企业解决方案 发表于 08-16 17:11 453次 阅读
彻底变革工作流程,NVIDIA推出首款基于Turing架构GPU

英伟达发布了首款光线追踪GPU,图灵构架开始刷屏

在加拿大温哥华举行的 SIGGRAPH 计算机图形学顶级年度会议中,NVIDIA 新一代 GPU 架....
的头像 电子那些事儿 发表于 08-16 13:50 500次 阅读
英伟达发布了首款光线追踪GPU,图灵构架开始刷屏

Altera与ZMDI签署协议,意在进一步提高Altera FPGA和SoC的功效

Altera公司今天宣布,与德国模拟和混合信号半导体公司ZMDI (Zentrum Mikroel....
发表于 08-16 11:26 79次 阅读
Altera与ZMDI签署协议,意在进一步提高Altera FPGA和SoC的功效

麒麟980处理器已开始生产,CPU、GPU和NPU的性能都会有质的飞跃提升

日前,从台湾产业链曝光的消息称,台积电已经正式开始试生产麒麟980处理器了,由于7nm工艺制程目前的....
发表于 08-16 11:26 203次 阅读
麒麟980处理器已开始生产,CPU、GPU和NPU的性能都会有质的飞跃提升

业界首款集成了HBM2 DRAM以及FPGA和SoC的异构SiP器件公开

Altera公司(Nasdaq: ALTR)今天公开业界第一款异构系统级封装(SiP,System....
发表于 08-16 11:15 81次 阅读
业界首款集成了HBM2 DRAM以及FPGA和SoC的异构SiP器件公开

英伟达发布全球首款支持实时光线追踪的GPU

英伟达(NVIDIA)又在“GPU历史长廊”上留下浓重的一笔——全球首款支持实时光线追踪(ray t....
的头像 DIGITIMES 发表于 08-16 10:45 342次 阅读
英伟达发布全球首款支持实时光线追踪的GPU

国产FPGA厂商强势发力 紫光同创大幅增资加速28nm研发

作为紫光集团从“芯”到“云”战略中芯片板块的重点发展方向,深圳市紫光同创电子有限公司的发展得到了紫光....
的头像 章鹰 发表于 08-16 10:06 693次 阅读
国产FPGA厂商强势发力 紫光同创大幅增资加速28nm研发

汇总DC/DC转换器内部开发的误区

复杂的现代电路通常包含大量元器件,例如微控制器、IC、DSP 和 FPGA 等。每个元器件均具有特定....
的头像 电子龙8国际下载 发表于 08-16 09:13 892次 阅读
汇总DC/DC转换器内部开发的误区

Lattice ECP3/ECP5器件中的SerDes/PCS简要介绍

Lattice ECP3,ECP5(ECP5-5G)的SerDes/PCS结构基本相同,区别主要在于....
的头像 电子龙8娱乐城官网应用ChinaAET 发表于 08-16 09:07 245次 阅读
Lattice ECP3/ECP5器件中的SerDes/PCS简要介绍

FPGA龙8国际下载所需相关硬件技能

1 具备自己龙8国际下载高速数字电路板(PCB)的能力并且掌握DSP的基础理论 现在的电子产品系统越来越复....
发表于 08-15 18:45 81次 阅读
FPGA龙8国际下载所需相关硬件技能

2018安路科技FPGA龙8娱乐城官网研讨会圆满召开

高级FAE陈安芝详细介绍了安路主要的EAGLE系列和ELF2系列FPGA器件龙8娱乐城官网。其中ELF2是安路....
发表于 08-15 18:36 177次 阅读
2018安路科技FPGA龙8娱乐城官网研讨会圆满召开

英伟达发布全新的图灵绘图架构

近日,在加拿大温哥华举行的 SIGGRAPH会上,NVIDIA(英伟达)公司创始人黄仁勋发布了全新的....
的头像 机器人龙8娱乐城官网与应用 发表于 08-15 15:57 504次 阅读
英伟达发布全新的图灵绘图架构

Nvidia采用Turing核心架构发布GPU新品

Turing核心,黄仁勋称之为2006年(8800GTX G80核心)以来最大的飞跃。其核心面积达到....
的头像 满天芯 发表于 08-15 10:54 370次 阅读
Nvidia采用Turing核心架构发布GPU新品

国产FPGA发展迎来“天时”生态系统不完善,乃当前最大难题

FPGA因龙8娱乐城官网门槛极高,全球市场份额主要被美国四大巨头高度垄断。据不完全统计,在全球约50亿美元的F....
的头像 电子发烧友网 发表于 08-15 10:43 430次 阅读
国产FPGA发展迎来“天时”生态系统不完善,乃当前最大难题

基于带处理器和FPGA的SoC的新型SoM

本文将讨论使用 SoM 来开发嵌入式系统的优势,这些系统需要借由 FPGA 提供更高的处理能力。本文....
的头像 电子龙8国际下载 发表于 08-15 09:21 693次 阅读
基于带处理器和FPGA的SoC的新型SoM

四强联手发布了基于FPGA的一系列vBRAS解决方案,加快了FPGA硬件加速的步伐

在近日举行的2018上海世界移动大会期间,中国电信、英特尔、联想与赛特斯联合发布了基于FPGA的一系....
发表于 08-14 16:20 179次 阅读
四强联手发布了基于FPGA的一系列vBRAS解决方案,加快了FPGA硬件加速的步伐

英伟达CEO黄仁勋发布史上最强GPU 世界首个实时光线追踪新一代图灵架构

刚刚,英伟达CEO黄仁勋在SIGGRAPH 2018上大秀肌肉,推出世界首个实时光线追踪GPU,基于....
的头像 章鹰 发表于 08-14 15:32 894次 阅读
英伟达CEO黄仁勋发布史上最强GPU 世界首个实时光线追踪新一代图灵架构

现代先进武器装备为何越来越青睐高端芯片?

至于FPGA,它包含大量门电路,使芯片更集成化,速度更快,可靠性更高.尤其是具有系统内可再编程(可再....
的头像 半导体观察IC 发表于 08-14 14:58 546次 阅读
现代先进武器装备为何越来越青睐高端芯片?

数字电路中最简单的混频知识

在FPGA龙8国际下载中,不管是Altera还是Xilinx,它们的IP核几乎都是采用二进制补码带符号数,也....
的头像 FPGA龙8娱乐城官网联盟 发表于 08-14 14:35 284次 阅读
数字电路中最简单的混频知识

FPGA在音乐科技及医疗照护领域的应用

FPGA的应用领域包罗万象,我们今天来看看在音乐科技领域及医疗照护的long8龙8国际pt巧思。
的头像 芯榜 发表于 08-14 10:39 349次 阅读
FPGA在音乐科技及医疗照护领域的应用

以FPGA和CPLD为基础的灵活可行的降低汽车电子物料成本解决方案

汽车制造商们坚持不懈地改进车内舒适性、安全性、便利性、工作效能和娱乐性,反过来,这些努力又推动了各....
发表于 08-14 10:01 185次 阅读
以FPGA和CPLD为基础的灵活可行的降低汽车电子物料成本解决方案

将FPGA作为下一代汽车电子龙8国际下载的灵活及低成本解决方案还需要考虑这些问题

随着汽车在过去 25 年中从纯机械设备演变成高度集成的线控驾驶汽车电子系统,龙8国际下载人员面临的挑战也不....
发表于 08-14 09:31 253次 阅读
将FPGA作为下一代汽车电子龙8国际下载的灵活及低成本解决方案还需要考虑这些问题