Intel® Optimized MP LINPACK Benchmark for Clusters の新機能

ツールセットは HPL 2.0 ディストリビューションと基本的に同一です。いくつかの変更は、オプションで指定してコンパイルしない限り無効です。以下の新機能があります。

ASYOUGO: 実行の進行に伴い、非侵入型のパフォーマンス情報を提供します。出力はわずかで、この情報はパフォーマンスに影響しません。情報を提供しなくても、多くの実行が長時間行われるため、特に役立つ機能です。

ASYOUGO2: すべての DGEMM 呼び出しを傍受して、わずかに侵入する付加的なパフォーマンス情報を提供します。

ASYOUGO2_DISPLAY: 実行内部の有効なすべての DGEMM のパフォーマンスを表示します。

ENDEARLY: いくつかのパフォーマンスのヒントを表示し、実行を早く終了します。

FASTSWAP: HPL のコードに LAPACK で最適化された DLASWP を挿入します。 この機能を使用して試験することで最良の結果を判断できます。

HYBRID: MP LINPACK のハイブリッド OpenMP*/MPI モードを有効にして、スレッド化されたインテル® マス・カーネル・ライブラリー (インテル® MKL) と MP LINPACK の事前構築ハイブリッド・ライブラリーを使用できるようにします。

警告

このオプションは、インテル® コンパイラーとインテル® MPI ライブラリー・バージョン 3.1 以降を使用している場合にのみ使用してください。コンパイラーはバージョン 10.0 以降を使用することを推奨します。

最適化に関する注意事項

インテル® コンパイラーは、互換マイクロプロセッサー向けには、インテル製マイクロプロセッサー向けと同等レベルの最適化が行われない可能性があります。これには、インテル® ストリーミング SIMD 拡張命令 2 (インテル® SSE2)、インテル® ストリーミング SIMD 拡張命令 3 (インテル® SSE3)、ストリーミング SIMD 拡張命令 3 補足命令 (SSSE3) 命令セットに関連する最適化およびその他の最適化が含まれます。インテルでは、インテル製ではないマイクロプロセッサーに対して、最適化の提供、機能、効果を保証していません。本製品のマイクロプロセッサー固有の最適化は、インテル製マイクロプロセッサーでの使用を目的としています。インテル® マイクロアーキテクチャーに非固有の特定の最適化は、インテル製マイクロプロセッサー向けに予約されています。この注意事項の適用対象である特定の命令セットの詳細は、該当する製品のユーザー・リファレンス・ガイドを参照してください。

改訂 #20110804


このヘルプトピックについてのフィードバックを送信