我們如何在 AVX2 中為 Intel 和 AMD 處理器高效實現 log2(_

AVX2 中log2(__m256d) 的高效率實作

首頁

後端開發

C++

我們如何在 AVX2 中為 Intel 和 AMD 處理器高效實現 log2(__m256d)？

Mary-Kate Olsen

Nov 27, 2024 pm 03:49 PM

How Can We Efficiently Implement log2(__m256d) in AVX2 for Both Intel and AMD Processors?

AVX2 中log2(__m256d) 的高效率實作

SVML 的__m256d _mm256_log2_pd (__m256d a處理器) 僅限於「Intel」較慢。存在替代實現，但它們通常專注於 SSE 而不是 AVX2。本次討論旨在為四個雙精度數向量提供 log2() 的高效實現，該實現與各種編譯器兼容，並且在 AMD 和 Intel 處理器上均表現良好。

傳統策略

通常的方法利用公式log2(a*b) = log2(a) log2(b)，此公式可簡化為指數log2(尾數) 對於雙數。尾數的範圍有限，為 1.0 到 2.0，因此適合透過多項式逼近來獲得 log2(尾數)。

準確度和精確度

所需的準確度和投入的範圍影響實作。 Agner Fog 的 VCL 旨在使用誤差避免技術實現高精度。但是，為了更快地近似float log()，請考慮JRF 的多項式實現（可在此處找到：http://jrfonseca.blogspot.ca/2008/09/fast-sse2-pow-tables-or-polynomials .html）。

VCL 演算法

VCL 的log float 和double 函數遵循兩部分方法：

提取指數和尾數：指數將轉換回浮點數，並透過檢查小於的值來調整尾數SQRT2*0.5。接下來從尾數減去 1.0。
多項式近似： 將多項式近似應用於調整後的尾數，以計算 x=1.0 附近的 log(x)。對於雙精度，VCL 使用兩個 5 階多項式的比率。

透過將指數加到多項式近似值來獲得最終結果。 VCL 包含額外的步驟來最小化舍入誤差。

替代多項式近似

為了提高準確性，您可以直接使用 VCL。然而，為了更快實現 float 的近似 log2()，請考慮使用 FMA 將 JRF 的 SSE2 函數移植到 AVX2。

避免捨入誤差

VCL 使用各種技術來減少捨入誤差。其中包括：

將 ln2 拆分為更小的常數（ln2_lo 和 ln2_hi）
加行 res = nmul_add(x2, 0.5, x);多項式評估

去除不必要的步驟

如果已知您的值是有限且正的，則可以透過註解掉以下檢查來顯著提高效能下溢、溢位或非正規。

進一步正在閱讀

[具有極小極大誤差的多項式逼近](http://gallium.inria.fr/blog/fast-向量化-math-approx/)
[使用位的快速近似對數操縱](http://www.machinedlearnings.com/2011/06/fast-approximate-logarithm-exponential.html)

以上是我們如何在 AVX2 中為 Intel 和 AMD 處理器高效實現 log2(__m256d)？的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

熱工具

熱門話題

Java教學

1673

CakePHP 教程

1429

Laravel 教程

1333

PHP教程

1278

C# 教程

1257

Related knowledge

C＃與C：歷史，進化和未來前景 Apr 19, 2025 am 12:07 AM

C#和C 的歷史與演變各有特色，未來前景也不同。 1.C 由BjarneStroustrup在1983年發明，旨在將面向對象編程引入C語言，其演變歷程包括多次標準化，如C 11引入auto關鍵字和lambda表達式，C 20引入概念和協程，未來將專注於性能和系統級編程。 2.C#由微軟在2000年發布，結合C 和Java的優點，其演變注重簡潔性和生產力，如C#2.0引入泛型，C#5.0引入異步編程，未來將專注於開發者的生產力和雲計算。

C＃vs. C：學習曲線和開發人員的經驗 Apr 18, 2025 am 12:13 AM

C#和C 的学习曲线和开发者体验有显著差异。1)C#的学习曲线较平缓，适合快速开发和企业级应用。2)C 的学习曲线较陡峭，适用于高性能和低级控制的场景。

什麼是C 中的靜態分析？ Apr 28, 2025 pm 09:09 PM

靜態分析在C 中的應用主要包括發現內存管理問題、檢查代碼邏輯錯誤和提高代碼安全性。 1）靜態分析可以識別內存洩漏、雙重釋放和未初始化指針等問題。 2）它能檢測未使用變量、死代碼和邏輯矛盾。 3）靜態分析工具如Coverity能發現緩衝區溢出、整數溢出和不安全API調用，提升代碼安全性。

C和XML：探索關係和支持 Apr 21, 2025 am 12:02 AM

C 通過第三方庫（如TinyXML、Pugixml、Xerces-C ）與XML交互。 1)使用庫解析XML文件，將其轉換為C 可處理的數據結構。 2)生成XML時，將C 數據結構轉換為XML格式。 3)在實際應用中，XML常用於配置文件和數據交換，提升開發效率。

C 中的chrono庫如何使用？ Apr 28, 2025 pm 10:18 PM

使用C 中的chrono庫可以讓你更加精確地控制時間和時間間隔，讓我們來探討一下這個庫的魅力所在吧。 C 的chrono庫是標準庫的一部分，它提供了一種現代化的方式來處理時間和時間間隔。對於那些曾經飽受time.h和ctime折磨的程序員來說，chrono無疑是一個福音。它不僅提高了代碼的可讀性和可維護性，還提供了更高的精度和靈活性。讓我們從基礎開始，chrono庫主要包括以下幾個關鍵組件：std::chrono::system_clock：表示系統時鐘，用於獲取當前時間。 std::chron

C的未來：改編和創新 Apr 27, 2025 am 12:25 AM

C 的未來將專注於並行計算、安全性、模塊化和AI/機器學習領域：1)並行計算將通過協程等特性得到增強；2)安全性將通過更嚴格的類型檢查和內存管理機制提升；3)模塊化將簡化代碼組織和編譯；4)AI和機器學習將促使C 適應新需求，如數值計算和GPU編程支持。

C：死亡還是簡單地發展？ Apr 24, 2025 am 12:13 AM

1）c relevantduetoItsAverity and效率和效果臨界。 2）theLanguageIsconTinuellyUped，withc 20introducingFeaturesFeaturesLikeTuresLikeSlikeModeLeslikeMeSandIntIneStoImproutiMimproutimprouteverusabilityandperformance.3）

C＃vs. C：內存管理和垃圾收集 Apr 15, 2025 am 12:16 AM

C#使用自動垃圾回收機制，而C 採用手動內存管理。 1.C#的垃圾回收器自動管理內存，減少內存洩漏風險，但可能導致性能下降。 2.C 提供靈活的內存控制，適合需要精細管理的應用，但需謹慎處理以避免內存洩漏。

See all articles

我們如何在 AVX2 中為 Intel 和 AMD 處理器高效實現 log2(__m256d)？

AVX2 中log2(__m256d) 的高效率實作

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題