我們如何取消優化蒙特卡洛模擬以暴露英特爾 Sandybridge 管道瓶頸?
對Intel Sandybridge 系列CPU 中的管道進行去最佳化
此作業的目標是修改給定的程序以使其運行速度較慢,同時保持相同的演算法。這是為了更深入地了解英特爾 i7 管線的運作方式以及指令路徑如何重新排序以引入危險。
程序概述
該程序是對歐洲普通看漲期權和看跌期權進行定價的蒙特卡羅模擬。它使用 Box-Muller 演算法產生高斯隨機數並執行大量模擬來估計選擇權價格。
惡魔般的無能
目標是故意創建會減慢程式執行速度的不合格程式碼。以下是一些用「惡魔般的無能」來證明這種方法的合理性的想法:
錯誤共享
- 創建由多個線程訪問的共享資料結構,但未正確同步。這可能會導致緩存行乒乓球和記憶體順序錯誤推測管道清除。
儲存轉送停頓
- 避免使用浮點數變數的「-」運算子。相反,將高位元組與 0x80 進行異或以翻轉符號位,從而導致儲存轉發停頓。
過多的時間測量
- 每次迭代的時間具有 CPUID/RDTSC等繁重操作的主循環,它會序列化指令並停止
不利的數學運算
- 將常量乘法替換為倒數除法( 「為了方便閱讀」)。除法較慢且未完全流水線化。
向量化效率低
- 使用AVX 對乘/平方運算進行向量化,但在調用之前無法使用vzeroupper標量數學庫函數,導致AVXSSE轉換
資料結構
- 將 RNG 輸出儲存在鍊錶或亂序遍歷的陣列中。對每次迭代的結果執行相同的操作並在最後求和。這引入了指標追逐載入並破壞了快取局部性。
多執行緒誤用
- 多執行緒程序,但強制兩個執行緒共享相同的循環計數器(具有原子增量)來建立錯誤的共享和爭用。這也引入了原子操作不必要的開銷。
其他建議
- 引入不可預測的分支來建立錯誤預測和管道刷新。
- 使用惡魔般無能的理由來增加循環攜帶的依賴鏈的長度。
- 引入非連續記憶體存取模式可最大限度地減少快取利用率。
- 額外費用學分:寫自己的平方根演算法來取代作業中提供的演算法。
修改的影響
這些修改預計會顯著透過引入管道停頓、快取未命中和其他效能瓶頸來減慢程式的執行速度。這項作業鼓勵創造力和願意探索悲觀化程式碼同時保持原始演算法的不同方法的意願。
以上是我們如何取消優化蒙特卡洛模擬以暴露英特爾 Sandybridge 管道瓶頸?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

C#和C 的歷史與演變各有特色,未來前景也不同。 1.C 由BjarneStroustrup在1983年發明,旨在將面向對象編程引入C語言,其演變歷程包括多次標準化,如C 11引入auto關鍵字和lambda表達式,C 20引入概念和協程,未來將專注於性能和系統級編程。 2.C#由微軟在2000年發布,結合C 和Java的優點,其演變注重簡潔性和生產力,如C#2.0引入泛型,C#5.0引入異步編程,未來將專注於開發者的生產力和雲計算。

C#和C 的学习曲线和开发者体验有显著差异。1)C#的学习曲线较平缓,适合快速开发和企业级应用。2)C 的学习曲线较陡峭,适用于高性能和低级控制的场景。

C 學習者和開發者可以從StackOverflow、Reddit的r/cpp社區、Coursera和edX的課程、GitHub上的開源項目、專業諮詢服務以及CppCon等會議中獲得資源和支持。 1.StackOverflow提供技術問題的解答;2.Reddit的r/cpp社區分享最新資訊;3.Coursera和edX提供正式的C 課程;4.GitHub上的開源項目如LLVM和Boost提陞技能;5.專業諮詢服務如JetBrains和Perforce提供技術支持;6.CppCon等會議有助於職業

C 通過第三方庫(如TinyXML、Pugixml、Xerces-C )與XML交互。 1)使用庫解析XML文件,將其轉換為C 可處理的數據結構。 2)生成XML時,將C 數據結構轉換為XML格式。 3)在實際應用中,XML常用於配置文件和數據交換,提升開發效率。

靜態分析在C 中的應用主要包括發現內存管理問題、檢查代碼邏輯錯誤和提高代碼安全性。 1)靜態分析可以識別內存洩漏、雙重釋放和未初始化指針等問題。 2)它能檢測未使用變量、死代碼和邏輯矛盾。 3)靜態分析工具如Coverity能發現緩衝區溢出、整數溢出和不安全API調用,提升代碼安全性。

C 在現代編程中仍然具有重要相關性。 1)高性能和硬件直接操作能力使其在遊戲開發、嵌入式系統和高性能計算等領域佔據首選地位。 2)豐富的編程範式和現代特性如智能指針和模板編程增強了其靈活性和效率,儘管學習曲線陡峭,但其強大功能使其在今天的編程生態中依然重要。

使用C 中的chrono庫可以讓你更加精確地控制時間和時間間隔,讓我們來探討一下這個庫的魅力所在吧。 C 的chrono庫是標準庫的一部分,它提供了一種現代化的方式來處理時間和時間間隔。對於那些曾經飽受time.h和ctime折磨的程序員來說,chrono無疑是一個福音。它不僅提高了代碼的可讀性和可維護性,還提供了更高的精度和靈活性。讓我們從基礎開始,chrono庫主要包括以下幾個關鍵組件:std::chrono::system_clock:表示系統時鐘,用於獲取當前時間。 std::chron

C 的未來將專注於並行計算、安全性、模塊化和AI/機器學習領域:1)並行計算將通過協程等特性得到增強;2)安全性將通過更嚴格的類型檢查和內存管理機制提升;3)模塊化將簡化代碼組織和編譯;4)AI和機器學習將促使C 適應新需求,如數值計算和GPU編程支持。
