和Core MA相同的取指/解码
Nehalem微架构的整体和Core MA相同这点也可以从Fetch和Decoding等方面来体现,Intel公司oregon州处理器机构首席工程师Ronak Singhal先生也就此进行了介绍,他提高关于指令取指以及编码等流程,两个处理器微架构都有着相似的设计。
Ronak Singhal先生
也就是说虽然Nehalem微架构虽然在性能上更加出色,但指令的执行流程还是没有脱离Core MA的成型轨迹,因此在Core MA架构上出现的无法突破的瓶颈,仍然会在Nehalem内出现。但无论如何x86体系的处理器,front end的设计已经成为了绝对的关键。
Nehalem的取指和解码流程图
对于x86体系而言,指令的解码工作相当复杂,而RISC和IA-64则带来了更多的指令,但这些对于处理器解码来说并不会带来额外负担,指令也仍然是简单的逻辑解码。不过要是X86的指令编码增长的话,在op Code前增加 Prefix的话,指令也就更加复杂了。
负责x86处理器生产的Glenn Henry先生提到Prefixs的出现,实际上将先前简单的解码工作变的更加复杂了,从而就需要了更加复杂的并行处理机制,而指令序列也将带来全新的寄存器和缓存,这也是x86架构发展所必须突破的限制。
因此对于x86架构的处理器来说,如果更好的实现指令的高效率执行是势在必行的,而内部指令Uops的效率则更加容易洗洗,所以就从提升CPU内部指令执行的并行通路上着手,而front end也势必会成为瓶颈。最终Core MA和Nehalem都实现了最高4条指令并行执行的高效率。就此问题AMD公司前任CTO Phil Hester先生对此处改进也颇为认可。