Nehalem的前端扩展
Nehalem微架构的前端扩展同样是一个广为关注的问题,07年秋季Intel公司副总裁兼移动平台事业部总经理Shmuel (Mooly) Eden 先生也就前端如何改进的疑问,给出了如下的解答。
他提到Penryn处理器的改进是显而易见的,如果说Penryn是做的美容整形手术的话,那么Nehalem的改进就像是做了一次心脏手术一样,微架构的很多部分都做出了较大的调整,这也就是Nehalem的改进之处。
Nehalem处理器的指令解码部分,采用了64bit的Macro-Fusion,这点并没有被改进,不过却增加了uOPs以及stream detector的支持,从而带来了性能的提升。根据Intel公司公布的资料表明,Intel公司有着彻底改进X86体系CPU指令的取指和解码等设计,进而用庞大的逻辑晶片取代。而此处的改进也将继续1比1原则。考虑到x86架构处理器的前端不足,x86的指令集也已经过于复杂,所以这样的改进是非常必要的,但在不提高电力消耗的情况下,实现这样的改进也还需要更多技术的支持。
这样就不难发现了Nehalem虽然提升了性能,但从根本上还是无法改变x86的指令执行流程,而之前存在的比如也并未从根本上解决,其中很重要一点原因,就在于功率增加的取舍。x86的取指和编码部分是最容易着手改进的,于是Nehalem就在保留足够晶体管预算的前提下,做出了指令流程的改进。
这样的改进是非常合乎一般逻辑的,也是提升性能最立竿见影的手段。而在uOPs之后的缓冲,也提高了uOPs的重新使用率。而Nehalem的streamdetector也在此基础上使用了uOPs缓存。由于NetBurst(Pentium 4)曾经用大量的缓存uOPs,所以在开发Core MA的intel公司以色列研究员,在多年前就发飙了Power AwaReness thRough selective dynamically Optimized Traces(PARROT)架构的论文,并提出了在uOPs水平的基础上进行最大优化的构想。
从根本上来看,指令执行过程中的局部改进,对于处理器性能的整体提升也是大有裨益的。比如多媒体处理器等也可以提升其性能。而CPU的进化和性能的提升速度也将继续加快。
缓存和解码结构
缓存和等待时间