开心棋牌

AMD最新推土机处理器

2019-04-21 14:36 admin

  AMD 最新推土机处理器 其实推土机 FX 系列处理器在 10 月份就已经全球正式发布,技术特性如下: 推土机从根本上改变了 AM▲★-●D 处理器的底层架构设计,简单地说就是变为模块化。AMD 宣称推 土机相比 K10 可在每◆●△▼●瓦特性能上△▪▲□△提升 30-100%,会成为“有史以▪▲□◁来最高性能的单线程和多 有史以来最高性能的单线程和多 线程计算核心”。 线程计算核心 双核心一模块 在着手设计下一代 x86 处理器核心的时候,AMD 的工程师们认为必须实现核心功耗与面积的 优化,而且 PC 应用的发展也让工程师们必须寻找一条新的路子,能够在不同核心之间实现 峰值★▽…◇带宽的最大化,并通过共享模块来充分利用每一平方毫米的核心面▲●…△积。 公司历史上制造的最大规模芯片, 亿个晶体管, 八核心推土机是 AMD 公司历史上制造的最大规模芯片,集成了大约 20 亿个晶体管 是六 核心 Phenom II X6、 四核心 •●Sandy Bridge 的两倍多, 但通过功能单元的合理分配, 以及 32nm SOI 新工艺的应用, 核心面积被控制在仅仅为 315 平方毫米, 比六核心、 45nm 工艺的 Phenom II X6 还要小 9%,比四核心、32nm HKMG 工艺的 Sandy Bridge 也只大了 46%。 【推土机模块△▪▲□△化架构(二)】 推土机模块化架构( 浮点 推土机中的浮点单元也经过了完全重新设计, 可以在不同核心之间共享资源。 每个推土机模 块内都有共享的两个 128 位乘法累加单元(FMAC), 可以每个核心执行 128 位指令, 或者每个 模块执行 256 位指令。 推土机浮点单元还改进支持了大量新的指令集。 Phenom II X6 仅有 128 位浮点, Intel Sandy Bridge 增加了 SSSE3/SSE4.1/SSE4.2、128/256 位 AVX、每周期两个 128 位 AVX、每周期 128 位 AVX+SSE。推土机 不但将这些照单全收,还独家支持 FMA4 乘加指令、XOP 扩展操作指令 乘加指令、 还独家支持 SSE5)。 (曾经的 SSE5)。 另外在每个时钟周期内,推土机运行双精度 x87 指令的速度为 8FLOPSs,持平 Sandy Bridge 且比 Phenom II X6 快一半,128 位 AVX 指令的执行速度则是 64FLOPS,前者达到了 Sandy Bridge 的两倍。 指令集的变化自然需要软件的支持才能发挥效力,尤其是 FMA、XOP 两大独家指令。如果软 件还在使用老•□▼◁▼的浮点指令, 推土机的特点显然就发挥不出来。 在操作系统和软件程序完善之 前,可以运行一下 AMD 提供的两个 XOP、AVX 补丁程序,再跑分就会有明显的不同。 其实, 这两个小程序正是近日网上传闻的所谓“鸡血补丁 鸡血补丁”, 而且有●时候确实能“鸡血”一 鸡血补丁 下,比如让 FX-8150 wPrime 32M 运算时间从 15 秒钟缩短到 10 秒钟 秒钟。 让 FX- 共享前端 前端(Front End)的任务是驱动处理管线、确保核心随时获取所需▷•●信息。在推土机中,每个 前端配合一个模块,并负责为其中的两个核心分配线程。AMD 在这里也做了大刀 阔斧的改 进,涉及不相关预测和拾取管线、预测定•☆■▲向指令预取器等等。一个预测队列可以管理一级、 二级分支目标缓冲(存储目标地址)所需的直接、间接分支。推土机模块可以在每个时钟周 推土机模块可以在每个时钟周 期内解码最多四条指令, 只有三条。换句话说,推土机从三发射变成了 期内解码最多四条指令,而 K10 Phenom II 只有三条。换句话说,推土机从三▪…□▷▷•发射变成了 四发射, Bridge。 四发射,就像 Intel Sandy Bridge。 预测管线会生成一个拾取地址队列。拾取管线则在每个时钟周期内从指令缓存里拉取 32 个 字节加入拾取队列,再送往解码◇…=▲器。 一样使用了物理寄存器文件(PRF) (PRF)。 推土机和 Sandy Bridge 一样使用了物理寄存器文件(PRF)。这是一个单★-●=•▽独的位置,用于▪•★保 持执行指令的寄存器结果。 这种设计◇=△▲可以消除不必要的数据移动和复制, 只保留一个拷贝而 不用对数据进行广播。 缓存 推土机的每个核心都有 64KB 一级数据缓存、64KB 一级指令缓存 一级数据缓存、 一级指令缓存、32-entry 全关联数据页 表缓存(DATA TLB)、完整乱序载入/保存单元,后者可以在每个时钟周期内载入两个 128 位 或载入一个 128 位指令。 每个模块配备 2MB 16 路关联二级缓存 路关联二级缓存、124-entry 二级页表缓存,可同时处理指令和数据 请求。推土机支持最多 23 个二级缓存不命中,用于保持内存系统一致性。 最后,一颗推土机处理器的所有模块与核心共享 8MB 64 路关联三级缓存 路关联三级缓存。

开心棋牌