Intel® Optimized MP LINPACK Benchmark for Clusters の概要

Intel® Optimized MP LINPACK Benchmark for Clusters は、テネシー大学ノックスビル校 (UTK) の Innovative Computing Laboratories (ICL) が提供している HPL 2.0 をベースに修正、追加したものです。この Intel® Optimized MP LINPACK Benchmark for Clusters は、Top 500 (http://www.top500.org を参照) の実行に使用することができます。ベンチマークを使用するには、HPL ディストリビューションと使用法について熟知している必要があります。Intel® Optimized MP LINPACK Benchmark for Clusters は、HPL をより便利に使用できるように、追加の拡張とバグフィックスが行われています。パフォーマンスを向上するインテル® メッセージ・パッシング・インターフェイス (MPI) 設定についても説明します。./benchmarks/mp_linpack ディレクトリーには、長時間の実行における検索時間を最小限に抑えるための手法が加えられています。

Intel® Optimized MP LINPACK Benchmark for Clusters は、HPL コードによる Massively Parallel MP LINPACK (LINPACK の超並列対応版) ベンチマークの実装です。このベンチマークは、ランダムで稠密な (real*8) 連立線形方程式 (Ax=b) を解き、因数分解して解くためにかかった時間を測定し、時間をパフォーマンス比率に変換して結果の精度をテストします。メモリーに収まる任意のサイズ (N) の連立方程式を解くことができます。ベンチマークは、正確な結果が得られるように、完全な行ピボット演算を使用しています。

Intel® Optimized MP LINPACK Benchmark for Clusters は、分散メモリーマシンで使用します。共有メモリーマシンでは、Intel® Optimized LINPACK Benchmark を使用してください。

インテルでは、HPL ベンチマークよりも簡単にインテル® プロセッサー・ベースのシステムで高い LINPACK ベンチマーク結果が得られる LINPACK ベンチマークの最適化バージョンを提供しています。クラスターのベンチマークには、Intel® Optimized MP LINPACK Benchmark を使用してください。事前構築バイナリーを使用するには、クラスターにインテル® MPI 3.x をインストールする必要があります。インテル® MPI のランタイムバージョンはwww.intel.com/software/products/cluster からダウンロードできます。

このパッケージには、テネシー大学ノックスビル校の Innovative Computing Laboratories (ICL) で開発されたソフトウェアが含まれていますが、これはテネシー大学や ICL が本製品を推奨あるいは販促していることを意味するわけではありません。HPL 2.0 は特定の条件の下で再配布することができますが、このパッケージはインテル® マス・カーネル・ライブラリー (インテル® MKL) の使用許諾契約書に基づきます。

インテル® MKL の新しいバージョンでは、ハイブリッド・ビルドと呼ばれる新しい機能が MP LINPACK に追加されました。以前のバージョンも引き続きサポートしています。 「ハイブリッド」とは、OpenMP*/MPI を組み合わせた並列処理を活用するために追加された特別な最適化のことを指します。

ノードあたり 1 つの MPI プロセスを使用して、OpenMP* によるさらに高度な並列処理を行うには、ハイブリッド・ビルドを使用してください。一般に、ハイブリッド・ビルドはコアあたりの MPI プロセスの数が 1 未満の場合に適しています。MPI で並列処理を行い、コアあたり 1 つの MPI プロセスを使用する場合は、非ハイブリッド・ビルドを使用してください。

特定の事前構築ハイブリッド・ライブラリーに加えて、インテル® MKL では、OpenMP* の最適化を活用するインテル® MPI 用の事前構築ハイブリッド・ライブラリーをいくつか提供します。

インテル® MPI 以外の MPI バージョンを使用する場合は、提供されている MP LINPACK ソースを使用してください。ソースからハイブリッド・モードで利用できる非ハイブリッド・バージョンをビルドすることもできますが、その場合、ハイブリッド・バージョンに追加される最適化の一部は含まれません。

提供されるソース・コード・メイクファイルのデフォルトは、非ハイブリッド・ビルドです。場合によっては、ハイブリッド・モードの利用が必要なことがあります。バージョンを選択できる場合、非ハイブリッド・コードのほうが高速です。非ハイブリッド・コードをハイブリッド・モードで利用するには、インテル® MKL BLAS のスレッド化バージョンを使用して、スレッドセーフな MPI とリンクし、MPI_init_thread() 関数を呼び出して、MPI がスレッドセーフである必要があることを示します。

インテル® MKL は、インテル® MPI ライブラリーに対してダイナミックにリンクされた事前構築バイナリーも提供しています。

スタティックにリンクされた事前構築バイナリーとダイナミックにリンクされた事前構築バイナリーのパフォーマンスは異なります。パフォーマンスは、使用するインテル® MPI のバージョンに依存します。
インテル® MPI の特定のバージョンに対してスタティックにリンクしたバイナリーをビルドすることができます。

最適化に関する注意事項

インテル® コンパイラーは、互換マイクロプロセッサー向けには、インテル製マイクロプロセッサー向けと同等レベルの最適化が行われない可能性があります。これには、インテル® ストリーミング SIMD 拡張命令 2 (インテル® SSE2)、インテル® ストリーミング SIMD 拡張命令 3 (インテル® SSE3)、ストリーミング SIMD 拡張命令 3 補足命令 (SSSE3) 命令セットに関連する最適化およびその他の最適化が含まれます。インテルでは、インテル製ではないマイクロプロセッサーに対して、最適化の提供、機能、効果を保証していません。本製品のマイクロプロセッサー固有の最適化は、インテル製マイクロプロセッサーでの使用を目的としています。インテル® マイクロアーキテクチャーに非固有の特定の最適化は、インテル製マイクロプロセッサー向けに予約されています。この注意事項の適用対象である特定の命令セットの詳細は、該当する製品のユーザー・リファレンス・ガイドを参照してください。

改訂 #20110804


このヘルプトピックについてのフィードバックを送信