AMD HD7970显卡GCN架构解析(一):
HD7970显卡最受人期待的地方正在于其强大的性能,而性能则源自于强大、高效的核心架构。HD7970显卡的GCN核心架构内建2048个流处理器、43亿个晶体管,是当前规模最大的图形芯片,但显卡核心面积却仅365平方毫米,小于上一代旗舰HD6970,这就是28纳米最先进制程的神奇魅力。借助28nm工艺,HD7970显卡默认运行频率已经逼近1GHz,而且显卡发热量更低。更小的核心面积,还可以在日后成熟量产时降低芯片成本。
HD7970采用的GCN核心架构,是在HD6000系列显卡的核心架构上大幅度优化而来,主要是提改进了核心内运算单元处理指令的灵活性,从而提升了效率。借助28nm工艺,GCN架构还可以达成更高的运行频率,而且发热量更小、芯片面积更小,从而可以提升芯片性能,并在日后成熟量产时降低芯片成本。
HD7970(Tahiti)核心面积比HD6970(Cayman)还小
HD7970的GCN架构,在最底层的流处理器管理模式上经历了大幅的优化重组,内部组织架构更灵活、更高效。在指令运行方式上,GCN也改变了AMD自R600以来一直沿用的VLIW打包吞吐模式,这个改动幅度可以说是对GPU运算模式基础的变更,对AMD GPU架构发展意义重大。VLIW(超长指令字)单线程执行密度很高,有高吞吐低灵活性的特点,但却在多个流处理器并行性上存在一些难以预料的指令打包、分派灵活性逻辑缺陷,在GPU这样规模巨大的并行处理器上,数千个流处理器的整体效率反而受到影响。
GCN驾构:为高性能运算优化
因此,在设计理念上,GCN架构已经不再单纯的追求图形渲染能力,而是更注重于为高性能运算优化,这个理念转变,更符合“通用计算就是图形计算”的今后趋势。GCN架构正是AMD加强通用计算性能思路的表现,而且高性能通用计算也能同时带来更高的图形性能。放弃VLIW不仅意味着GPU大规模并行框架内普通SIMD指令模式的回归,更标志着AMD理念转向GPU高性能计算。
HD7970的2048个流处理器被划分成了32个"GCN"并行执行单元
HD7970的2048个流处理器被划分成了32个并行计算单元(Compute Unit),每个计算单元都相当于一个运算中枢,在芯片高负荷时,每个计算单元都能同时分配、执行指令,架构利用率和吞吐量很高,更适合处理多线程多任务并行运算。