受到推崇的, 2024

编辑的选择

英特尔Haswell CPU内部性能更佳:全天候电池性能更佳

目录:

Anonim

在旅途中的个人电脑用户需要很长的电池寿命,但不想牺牲性能。平衡这些相互矛盾的要求是英特尔新代号为Haswell的CPU架构的核心,该架构预计将于2013年出现在运输平板电脑,超极本和其他计算机上。

在本周早些时候举行的2012年英特尔开发者论坛上,英特尔鸠更深入的是什么使Haswell打勾。或者,也许“tock”会更好,因为Haswell代表了英特尔CPU开发计划中的“tock”。英特尔使用“tick-tock”来表示其CPU发展策略。一个“嘀嗒”是由现有的CPU设计所代表的,只是稍微调整了一下,但享有新制造工艺的所有效率。常春藤桥代表着一个滴答声,在Sandy Bridge上逐渐改善,但是转向了22纳米。与此同时,像Haswell这样的新体系结构总是建立在经过验证的制造流程上,而英特尔的22纳米制造工艺由于该公司的Ivy Bridge生产线已经很好地动摇了。所以Haswell代表了一个“tock”。

Haswell是一个“tock”

Haswell不仅仅是另一个Intel PC处理器。英特尔正在讨论基于Haswell处理器的处理器,这些处理器的运行功率低于10瓦(适用于平板电脑)的双核芯片,可以超越最快的Ivy Bridge处理器的四核桌面CPU。英特尔是如何实现其20倍提高能效的积极目标?在深入研究CPU之前,有必要先看看Haswell的电源管理技术。

Sleepily Active

现代CPU电源管理包括根据您的任何任务,切断处理器大块的电源,重新要求你的设备去做。英特尔可以通过使用直接内置于主CPU内部的特殊处理单元来管理功率,几乎达到晶体管级别 - 英特尔将其称为功率控制单元。 PCU查看处理器的哪些部分未被使用,并且可以根据需要打开和关闭各个部分。

然而,问题并未使CPU的某些部分处于睡眠状态。问题是唤醒处理器足够快以至于很有用。毕竟,如果每次笔记本电脑进入睡眠状态时都必须等待一分钟,那么您可能会沮丧地将它靠在墙上。英特尔CPU达到常春藤桥有两个主要状态:主动和睡眠。 (它比这更复杂,但这是总体思路。)多年来,英特尔一直在稳步减少唤醒睡眠CPU所需的时间。当前的Ivy Bridge处理器需要几秒钟才能从深度睡眠状态中唤醒。几秒钟仍然不是“即时打开”。

Haswell的解决方案是添加第三个电源状态,这是英特尔设计人员称之为“主动空闲”的情况。主动空闲,也被称为SOIX,是一个极低功耗的活动状态,使用的功耗比常青藤桥低20倍。个人电脑系统本身认为它是清醒的,但CPU仍然大多是睡着了。这个窍门可以转化为几百毫秒的唤醒时间。从用户角度来看,最差唤醒时间为半秒的时间要比几秒钟当前的CPU唤醒时好得多。运行时,Haswell几乎总是处于“即时恢复”状态。大部分技术都是直接从英特尔的Atom处理器电源管理中借用的。

Haswell电源管理改进

英特尔在构建Haswell时使用了其他一些技巧。此前,我们讨论了闲置和睡眠状态。睡眠和活动空闲状态实际上分为多个较小的状态。每个迷你状态(称为“C状态”)都确切地定义了CPU的哪部分被关闭。 Haswell为更细化的电源管理增加了新的C状态。这样可以延长电池寿命,因为CPU不会一直唤醒它的一部分

不需要 来唤醒 不需要的部分CPU。 英特尔还研究了CPU功耗与系统显示器的接口。事实上,在今天的系统中需要很长时间才能醒来的是LCD面板,所以Haswell处理器将包含面板自刷新。因此,例如,如果您只是坐在那里盯着屏幕,Haswell CPU会进入睡眠状态,只有一小部分保持清醒状态以刷新显示器。只要您移动鼠标或按下某个键,CPU就会唤醒。您不会注意到唤醒时间,因为显示器从未进入睡眠状态。 现在您已经看到了英特尔如何实现更高的能效,让我们来谈谈CPU架构增强功能。

更多性能,更好的电源效率

在IDF技术会议期间,英特尔高级首席工程师Ronak Singhal多次重复说,如果引入功率损失,CPU不会添加任何新功能。尽管如此,CPU设计师仍然有许多技巧可以在平衡电源需求的同时提高性能。一种技巧是分支预测,它可以让CPU向前看,看看哪些指令可能在附近执行未来。如果CPU知道哪些指令将流入管道,那么分配CPU资源的效率会更高,从而只打开所需的部分CPU。因此,英特尔调整了架构元素以改善分支预测,包括更大的内部缓冲区和更大的乱序窗口。

Haswell CPU核心框图

此外,CPU在单个周期内可以执行的工作越多,在相同的功率使用情况下的性能。因此,英特尔增加了在每个时钟周期内执行两次浮点乘加的能力,在同样的功耗下,性能吞吐量比Ivy Bridge提高了一倍。 L1和L2高速缓存的吞吐量也得到了提高,从而缩短了CPU等待数据到达的时间。

当然,这些好东西都不是免费的。虽然功效提高了,但这是以芯片房地产为代价的。鉴于Haswell仍将采用22纳米工艺制造,这些芯片本身可能比Ivy Bridge CPU更大。

芯片尺寸也有可能因为另一个原因而增加:图形。

平板电脑上的高端PC游戏:Haswell Graphics

Haswell基于Sandy Bridge现有的英特尔HD图形核心,大部分都增加了精细度并提高了能效。 Haswell现在为英特尔CPU提供三种不同的集成显卡选项,称为GT1,GT2和GT3,与Ivy Bridge提供的两种选项(Intel HD 2500和HD 4000)不同。

GT3是性能最有趣的版本透视。通过将执行单元的数量加倍,GT3使性能超过了旧款HD 4000 GPU。执行单元是GPU的核心计算引擎,用于处理图形着色器和GPU计算任务。这些执行单元被内置到一个通用的模块化单元中,英特尔称之为“通用切片”。

切片通用还包含许多其他用于实时图形的关键组件,如光栅引擎和缓存。为了使HD 4000的计算引擎数量增加一倍,英特尔简单地增加了GT3通用的第二个片。这需要额外的芯片空间,但实际上可以节省功耗,因为GPU不需要进入Turbo模式以获得额外的性能。

GPU还有其他一些调整,包括纹理采样器的改进,改善整体带宽和增加更多的电路来处理当前在HD 4000中由驱动程序处理的任务。

这些功能都可以在不增加功耗的情况下提高性能。英特尔估计,8W Haswell设备可能会集成一个完整的GT3 GPU,但没有给出产品版本的具体细节。英特尔展示了两种不同的应用程序:Unigine Heaven和合成图形基准测试程序Bethesda's Skyrim,这是一款具有严格图形要求的PC RPG游戏。 Haswell以两倍于Ivy Bridge的表现进行两项测试,创造出更平滑的视觉体验。

从历史上看,英特尔已经迟迟未能加入对最新编程接口的软件支持。 Haswell通过实施所有最新标准来改变这一点:Windows 7和Windows 8的DirectX 11.1,GPU计算和OpenGL 4.0的OpenCL 1.2。英特尔对驱动程序支持非常好,同时提供Windows和Linux驱动程序。虽然Haswell的3D图形引擎比以往的英特尔显着改进,但桌面PC用户仍可能需要高端独立显卡才能获得最佳PC游戏性能。但Haswell的图形核心将使超薄笔记本电脑的游戏平台变得非常薄,而新的GPU为在基于Haswell的平板电脑上运行的现代PC游戏开辟了可能性。

视频引擎

Ivy Bridge推出了QuickSync视频模块, ,内置于GPU中的固定功能视频单元。构建一个固定功能的视频引擎可以实现更快的视频编码和解码性能。缺点是它不能编程,所以如果有一些热门的新高清编解码器出现,视频引擎无法处理它。由于视频编解码器相当标准化,所以不太可能。

Haswell视频引擎详细信息

但是,英特尔确实为Haswell视频引擎添加了其他编解码器支持。 Motion JPEG(MJPEG)对视频会议很重要。 SVC或可伸缩视频编解码器在视频质量取决于连接速度而变化的移动环境中非常有用,因此视频质量可以优雅地进行缩放。如果网络带宽降低,用户仍然会看到好的帧速率,而不是抖动或丢帧。此外,Haswell还在超高清显示屏上运行4k x 2k视频。

底线:芯片更大,性能更好,功耗更低

Haswell将比Ivy Bridge占用更多的裸片空间,这意味着Intel的每CPU成本更高,因为它无法在单个晶片上构建尽可能多的Haswell CPU。然而,Haswell的模块化有助于缓解这种情况,这可以让英特尔构建许多不同的Haswell产品,以更小的版本为目标,瞄准低功耗领域。更好的是,Haswell在英特尔下一代14nm制造工艺中的定位良好。

与Ivy Bridge相比,主CPU的大多数性能调整都是渐进式的。在相同的时钟频率下,用户可能会看到高达10%的性能提升。最大的收益在于节能和图形性能。电源效率的提高将使笔记本电脑终于在Ultrabook中实现了全天电池寿命,而GPU的改进意味着移动用户将在旅途中拥有相当强劲的游戏体验.Hostwell看起来是对潜在影响最大的CPU英特尔多年来的任何CPU的底线。新款CPU的模块化特性和功效使其广泛的产品可能会看到Haswell产品具有多种外形尺寸。用户将受益于移动和桌面外形的选择比以往更多,性能更高,电池寿命更长。

Top