Intel CPU では、誤ったデータ依存関係が原因で 64 ビットのポップカウントが 32 ビットよりも遅いのはなぜですか?
誤ったデータ依存関係が Intel CPU の Popcount パフォーマンスに影響を与える
問題:
重大な問題が観察されましたポップカウント操作に 32 ビット ループ カウンターを使用した場合と 64 ビット ループ カウンターを使用した場合のパフォーマンスの差異Intel CPU の場合。 64 ビット カウンターを使用すると、パフォーマンスが 50% 低下しました。当初はコンパイラのバグが原因でした。
説明: 誤ったデータ依存関係
Intel CPU には誤った依存関係があります。これは、タイトなループの複数回の反復に影響します。この依存関係により、宛先レジスタが使用可能になるまで命令が停止します。この依存関係によって影響を受ける命令の数はループの局所性に依存するため、パフォーマンスに変動が生じます。
依存関係の結果:
- 異なるレジスタ: ループが連続する Popcnt 操作に異なるレジスタを使用すると、依存関係がループ全体に広がります。
- 同じレジスタ: すべての Popcnt 操作が同じレジスタを使用する場合、依存関係は単一の反復内に残り、パフォーマンスへの影響が軽減されます。
- 壊れた依存関係チェーン: 無関係な命令 (xor など) を導入して依存関係を壊すと、
コンパイラの動作:
GCC も Visual Studio もこの誤った依存関係を認識しないため、レジスタ割り当てに基づいて予測不能なパフォーマンスが発生します。 。 Clang や ICC などの他のコンパイラにも、この知識が欠けています。
AMD パフォーマンス:
AMD プロセッサには、この誤った依存関係がないようで、パフォーマンスの向上に寄与しています。ポップカウントでのパフォーマンス
軽減策:
- アセンブリのインライン化: インライン アセンブリを使用してアセンブリ コードを手動で最適化すると、コンパイラによる依存関係の認識を回避できます。 .
- を破る依存関係チェーン: 各 Popcnt 操作の後に無関係な命令を挿入すると、誤った依存関係が解消され、パフォーマンスが向上します。
- 異なるレジスタの使用: 連続した Popcnt 操作に異なるレジスタを割り当てると、問題が軽減されますが、常に可能であるとは限りません。
以上がIntel CPU では、誤ったデータ依存関係が原因で 64 ビットのポップカウントが 32 ビットよりも遅いのはなぜですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











C#とCの歴史と進化はユニークであり、将来の見通しも異なります。 1.Cは、1983年にBjarnestrostrupによって発明され、オブジェクト指向のプログラミングをC言語に導入しました。その進化プロセスには、C 11の自動キーワードとラムダ式の導入など、複数の標準化が含まれます。C20概念とコルーチンの導入、将来のパフォーマンスとシステムレベルのプログラミングに焦点を当てます。 2.C#は2000年にMicrosoftによってリリースされました。CとJavaの利点を組み合わせて、その進化はシンプルさと生産性に焦点を当てています。たとえば、C#2.0はジェネリックを導入し、C#5.0は非同期プログラミングを導入しました。これは、将来の開発者の生産性とクラウドコンピューティングに焦点を当てます。

CとXMLの将来の開発動向は次のとおりです。1)Cは、プログラミングの効率とセキュリティを改善するためのC 20およびC 23の標準を通じて、モジュール、概念、CORoutinesなどの新しい機能を導入します。 2)XMLは、データ交換および構成ファイルの重要なポジションを引き続き占有しますが、JSONとYAMLの課題に直面し、XMLSchema1.1やXpath3.1の改善など、より簡潔で簡単な方向に発展します。

C継続的な使用の理由には、その高性能、幅広いアプリケーション、および進化する特性が含まれます。 1)高効率パフォーマンス:Cは、メモリとハードウェアを直接操作することにより、システムプログラミングと高性能コンピューティングで優れたパフォーマンスを発揮します。 2)広く使用されている:ゲーム開発、組み込みシステムなどの分野での輝き。3)連続進化:1983年のリリース以来、Cは競争力を維持するために新しい機能を追加し続けています。

C#とCおよび開発者の経験の学習曲線には大きな違いがあります。 1)C#の学習曲線は比較的フラットであり、迅速な開発およびエンタープライズレベルのアプリケーションに適しています。 2)Cの学習曲線は急勾配であり、高性能および低レベルの制御シナリオに適しています。

Cは、サードパーティライブラリ(TinyXML、PUGIXML、XERCES-Cなど)を介してXMLと相互作用します。 1)ライブラリを使用してXMLファイルを解析し、それらをC処理可能なデータ構造に変換します。 2)XMLを生成するときは、Cデータ構造をXML形式に変換します。 3)実際のアプリケーションでは、XMLが構成ファイルとデータ交換に使用されることがよくあり、開発効率を向上させます。

最新のCデザインモデルは、C 11以降の新機能を使用して、より柔軟で効率的なソフトウェアを構築するのに役立ちます。 1)ラムダ式とstd :: functionを使用して、オブザーバーパターンを簡素化します。 2)モバイルセマンティクスと完全な転送を通じてパフォーマンスを最適化します。 3)インテリジェントなポインターは、タイプの安全性とリソース管理を保証します。

C学習者と開発者は、Stackoverflow、RedditのR/CPPコミュニティ、CourseraおよびEDXコース、Github、Professional Consulting Services、およびCPPCONのオープンソースプロジェクトからリソースとサポートを得ることができます。 1. StackOverFlowは、技術的な質問への回答を提供します。 2。RedditのR/CPPコミュニティが最新ニュースを共有しています。 3。CourseraとEDXは、正式なCコースを提供します。 4. LLVMなどのGitHubでのオープンソースプロジェクトやスキルの向上。 5。JetBrainやPerforceなどの専門的なコンサルティングサービスは、技術サポートを提供します。 6。CPPCONとその他の会議はキャリアを助けます

Cは、現代のプログラミングにおいて依然として重要な関連性を持っています。 1)高性能および直接的なハードウェア操作機能により、ゲーム開発、組み込みシステム、高性能コンピューティングの分野で最初の選択肢になります。 2)豊富なプログラミングパラダイムとスマートポインターやテンプレートプログラミングなどの最新の機能は、その柔軟性と効率を向上させます。学習曲線は急ですが、その強力な機能により、今日のプログラミングエコシステムでは依然として重要です。
