●支持32-bit单精度16-wide宽vector运算单元
缓存采用的是两层设计,除了共享的二级高速缓存以外,还配备了32KBL1指令缓存和32KB的L1数据缓存。同时为了各个处理器核心能够访问二级高速缓存,核心间的数据为共同所有并进行交换。NVIDIA和AMD公司为了实现GPU处理器核心间的数据交换都选择配备了小容量的存储器。因此虽然Larrabee是可编程GPU产品,但是其设计要偏向CPU设计。
Larrabee处理器核心为顺序scalar单元和vector单元组成。每个单元都有专用的scalar寄存器和vector寄存器。CPU的内核的二级缓存里,256KB为的本地直接连接(Local Subset)。处理器核心间的交流是通过总线进行。
根据介绍Larrabee处理器的vector运算单元为16-wide。支持Int32(32-bit整数),Float32(32-bit浮点),Float64(64-bit浮点)。在进行32-bit运算的时候能够以16-wide的全容量进行运算。Larrabee将可以预测mask register,如果产生了分歧可以以更高的效率进行流通量控制。这个设计与NVIDIA的G80/GT200系列产品有些相似。
Larrabee vector单元组成
Larrabee x86核心组成