重新解释硬件 SIMD 向量指针和相应类型之间的转换是否是 C 中未定义的行为？-C++-PHP中文网

首页

后端开发

C++

重新解释硬件 SIMD 向量指针和相应类型之间的转换是否是 C 中未定义的行为？

DDD

Dec 27, 2024 pm 02:38 PM

Is Reinterpreting Casts Between Hardware SIMD Vector Pointers and Corresponding Types Undefined Behavior in C ?

硬件 SIMD 向量指针和相应类型之间的重新解释转换是否是未定义的行为？

在 C 中，是否允许重新解释_转换浮点数 到 __m256 并通过不同的指针访问浮点对象type?

以下代码示例说明了这一点：

#include <immintrin.h>

constexpr size_t _m256_float_step_sz = sizeof(__m256) / sizeof(float);
alignas(__m256) float stack_store[100 * _m256_float_step_sz ]{};
__m256& hwvec1 = *reinterpret_cast<__m256*&>(&stack_store[0 * _m256_float_step_sz]);

using arr_t = float[_m256_float_step_sz];
arr_t& arr1 = *reinterpret_cast<float(*)[_m256_float_step_sz]&>(&hwvec1);

登录后复制

hwvec1 和 arr1 是否有未定义的行为？是否违反了严格的别名规则（[basic.lval]/11）？或者，是否只有一种定义的内在方式：

__m256 hwvec2 = _mm256_load_ps(&stack_store[0 * _m256_float_step_sz]);
_mm256_store_ps(&stack_store[1 * _m256_float_step_sz], hwvec2);

登录后复制

答案：

ISO C 没有定义 __m256，所以我们需要看看定义了什么他们在支持他们的实现上的行为。 Intel 的内在函数将像 __m256 这样的向量指针定义为允许为其他任何东西起别名，就像 ISO C 将 char 定义为允许起别名一样。（但反之亦然：在实践中将 int* 指向 __m256i 并取消引用它是 UB 和中断。）

所以，是的，取消引用 __m256 是安全的，而不是使用 _mm256_load_ps( ) 内在的对齐负载。但特别是对于 float/double，使用内在函数通常更容易，因为它们也负责从 float 进行转换。对于整数，AVX512 加载/存储内在函数被定义为采用 void，但 AVX2 及更早版本需要像 (__m256i)&arr[i] 这样的强制转换，这是相当笨重的 API 设计，并且使用它的代码会变得混乱。

还使用 void 添加了一些非 AVX512 内在函数，例如movd/movq 加载/存储对齐和别名安全内在函数，例如 _mm_loadu_si32(void)。以前我认为英特尔假设你会使用 _mm_cvtsi32_si128 ，它需要自己安全地加载一个 int ，这意味着使用 memcpy 来避免 UB （至少在经典 ICC 和 MSVC 之外的编译器上，如果它们允许未对齐的 int* 并且不强制执行严格的

这可能是在英特尔开始考虑迁移到 LLVM 的时候ICX/ICPX / OneAPI，并意识到处理强制严格别名的编译器上的狭窄负载是多么混乱。

以上是重新解释硬件 SIMD 向量指针和相应类型之间的转换是否是 C 中未定义的行为？的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

Undresser.AI Undress

人工智能驱动的应用程序，用于创建逼真的裸体照片

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

免费脱衣服图片

Clothoff.io

AI脱衣机

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸！

显示更多

热工具

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

中文版，非常好用

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

显示更多

热门话题

Java教程

1663

CakePHP 教程

1419

Laravel 教程

1313

PHP教程

1263

C# 教程

1236

显示更多

Related knowledge

C＃与C：历史，进化和未来前景 Apr 19, 2025 am 12:07 AM

C#和C 的历史与演变各有特色，未来前景也不同。1.C 由BjarneStroustrup在1983年发明，旨在将面向对象编程引入C语言，其演变历程包括多次标准化，如C 11引入auto关键字和lambda表达式，C 20引入概念和协程，未来将专注于性能和系统级编程。2.C#由微软在2000年发布，结合C 和Java的优点，其演变注重简洁性和生产力，如C#2.0引入泛型，C#5.0引入异步编程，未来将专注于开发者的生产力和云计算。

C和XML的未来：新兴趋势和技术 Apr 10, 2025 am 09:28 AM

C 和XML的未来发展趋势分别为：1)C 将通过C 20和C 23标准引入模块、概念和协程等新特性，提升编程效率和安全性；2)XML将继续在数据交换和配置文件中占据重要地位，但会面临JSON和YAML的挑战，并朝着更简洁和易解析的方向发展，如XMLSchema1.1和XPath3.1的改进。

继续使用C：耐力的原因 Apr 11, 2025 am 12:02 AM

C 持续使用的理由包括其高性能、广泛应用和不断演进的特性。1)高效性能：通过直接操作内存和硬件，C 在系统编程和高性能计算中表现出色。2)广泛应用：在游戏开发、嵌入式系统等领域大放异彩。3)不断演进：自1983年发布以来，C 持续增加新特性，保持其竞争力。

C多线程和并发：掌握并行编程 Apr 08, 2025 am 12:10 AM

C 多线程和并发编程的核心概念包括线程的创建与管理、同步与互斥、条件变量、线程池、异步编程、常见错误与调试技巧以及性能优化与最佳实践。1)创建线程使用std::thread类，示例展示了如何创建并等待线程完成。2)同步与互斥使用std::mutex和std::lock_guard保护共享资源，避免数据竞争。3)条件变量通过std::condition_variable实现线程间的通信和同步。4)线程池示例展示了如何使用ThreadPool类并行处理任务，提高效率。5)异步编程使用std::as

C和XML：探索关系和支持 Apr 21, 2025 am 12:02 AM

C 通过第三方库（如TinyXML、Pugixml、Xerces-C ）与XML交互。1)使用库解析XML文件，将其转换为C 可处理的数据结构。2)生成XML时，将C 数据结构转换为XML格式。3)在实际应用中，XML常用于配置文件和数据交换，提升开发效率。

C＃vs. C：学习曲线和开发人员的经验 Apr 18, 2025 am 12:13 AM

C#和C 的学习曲线和开发者体验有显着差异。 1)C#的学习曲线较平缓，适合快速开发和企业级应用。 2)C 的学习曲线较陡峭，适用于高性能和低级控制的场景。

C社区：资源，支持和发展 Apr 13, 2025 am 12:01 AM

C 学习者和开发者可以从StackOverflow、Reddit的r/cpp社区、Coursera和edX的课程、GitHub上的开源项目、专业咨询服务以及CppCon等会议中获得资源和支持。1.StackOverflow提供技术问题的解答；2.Reddit的r/cpp社区分享最新资讯；3.Coursera和edX提供正式的C 课程；4.GitHub上的开源项目如LLVM和Boost提升技能；5.专业咨询服务如JetBrains和Perforce提供技术支持；6.CppCon等会议有助于职业