真・SSEを使って8flops/clockを実現する
カーネル/VM Advent Calendar の34日目として書きます.
記事の内容自体はこのイベントと関係ありませんので,どなたでもお楽しみ下さいませ.
今回は 自分の前回の記事 で見つけた誤りを訂正しつつ,
Intelの一部CPUがサポートするSSE(Streaming SIMD Extensions)命令により1clockで8個の単精度浮動小数点演算を行なう方法を紹介します.
なるべく前回の記事とは独立した記述を心がけます.
カーネル/VM Advent Calendar の34日目として書きます.
記事の内容自体はこのイベントと関係ありませんので,どなたでもお楽しみ下さいませ.
今回は 自分の前回の記事 で見つけた誤りを訂正しつつ,
Intelの一部CPUがサポートするSSE(Streaming SIMD Extensions)命令により1clockで8個の単精度浮動小数点演算を行なう方法を紹介します.
なるべく前回の記事とは独立した記述を心がけます.
恩師田浦健次朗先生の講義、「オペレーティングシステム」で試験を受ける代わりにカーネルハックする課題をやりました。
目覚ましい成果とは言えない結果でしたが、調査や実装の記録を書いた発表スライドを残しておきます。
講義資料として上がってるPDF (なぜかはてブがいっぱいついてる)
上記のはいつ研究室のサーバから消されてもおかしくないので、ここでも配信しておきます。