0.3.6向けSSE2 CPUでの4ハッシュ並列処理

このパッチは、ベクトル命令を使用して1つのコアで4つのハッシュを同時に計算するものである。新しいハッシュ関数を旧来のものと照合するテストプログラムが含まれているため、正確性は担保されているはずである。

このパッチは0.3.6に対するものである。khash/sが約115%向上する。

http://pastebin.com/XN1JDb53