クアッドコア Phenom II 64 ビット Linux マシン(ubuntu 9.10、両方とも)を 2 台持っているが、-4way オプションでハッシュ速度が非常に上がるので怪しいと感じている。以前は、そして n-4way オプションなしでは、これらのボックスで約 5〜6khash/秒だった。-4way では 11khash/秒以上出る!つまり-4way スイッチで報告されるハッシュ速度がほぼ倍増する。この程度の改善は予想以上に思え、ボックスが本当にそれだけ速くハッシュしているのか、何らかの理由で数学演算が実際にはスキップされていて見かけ上の速度向上とブロック生成能力の欠如を引き起こしている可能性はないのか疑問に思う。
o_O……ハッシュ頑張ってくれ、健闘を祈る!
サトシ・ナカモトの投稿(2010年8月16日 02:57)NewLibertyStandardの投稿(2010年8月16日 01:49)4wayありだと、仮想コアをすべて有効にしたときに大幅にパフォーマンスが向上する。ハイパースレッディングをオフにすると、4wayの有無にかかわらず同じくらいのハッシュ数になると思う。
ねえ、何かに気づいているかもしれない!
以前はハイパースレッディングが効かなかった。なぜならすべての処理が算術論理ユニットで行われ、ハイパースレッドがそれを共有するからだ。
tcatmのSSE2コードは通常のx86命令とSSE2命令の混合に違いない。だから一方がx86コードを実行している間に、もう一方がSSE2を実行できる。
ハイパースレッディングでどれくらい改善するんだ?
数値を頼む。どんなCPUだ?
Ubuntu 10.04 amd64 上の i7 860 2.8 GHz で、自分のかなり曖昧な記憶からの結果はこちら。数値は少しずれているかもしれない。
4way なし、HT あり、4/8 仮想コア、4.5~5 Mhash/sec 4way なし、HT あり、8/8 仮想コア、上より少し低いが、基本的に同じ
4way あり、HT あり、8/8 仮想コア、6.5~8 Mhash/sec(気のせいかもしれないが、明らかにばらつきが大きいように見える。) 4way あり、HT あり、4/8 仮想コア、5~6 Mhash/sec
4way なし、HT なし、4/4 物理コア、4.5~5 Mhash/sec(ただし最初の結果より少し遅い。) 4way あり、HT なし、4/4 物理コア、5~6 Mhash/sec