淘客熙熙

主题:【文摘】龙芯意见 -- 【子衿】

共:💬57 🌺229
全看分页树展 · 主题 跟帖
家园 NetBurst其实是生不逢时

那个把译码以后的指令放icache的想法是很好的,这样就把流水线减少了几级,所以后面的计算部分稍微增加几级也可以,分支预测失败并不会对性能有重大影响。但是,x86相较于risc的一大优势,是代码密度高30%左右,所以,在相同大小的cache下,x86的执行性能会高不少。而现代的cpu,其核心面积基本上由cache大小决定。所以,x86综合性能在现代电子技术下并不比risc差。

如果icache存储译码指令,这个优势就不存在了,而且还会需要不少的附加开销。所以P4的12kuop icache大致只相当于4-6KB的icache。由于这个icache还非常占面积,所以dcache也被缩小了。P4的cache指标在当时也是最低的,比别的cpu低了一半还多。这就导致P4综合性能大幅度下降。

如果是现在来做,电子技术可以集成更大的cache,虽然使用NetBurst仍然会降低缓存的指令量,但是现在可实现的cache规模已经基本不会对对性能有重大影响了。这样,主频可以更进一步,综合性能可能有不少提升。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河