首页 后端开发 C++ x86_64 架构上如何处理原子浮点和向量运算?

x86_64 架构上如何处理原子浮点和向量运算?

Dec 07, 2024 am 06:08 AM

How are Atomic Floating-Point and Vector Operations Handled on x86_64 Architectures?

x86_64 上的原子浮点运算

虽然 C 本身不支持原子双精度运算,但它确实提供无锁原子 操作。大多数平台上的实现。这些实现通常使用带有锁定 cmpxchg 指令的比较和交换 (CAS) 操作。

对于 x86_64 上的原子向量操作,没有直接的硬件支持。然而,对齐的 128 位和 256 位加载和存储通常保证是原子的。对于非对齐向量操作,原子性保证不太明确。

对双精度和向量操作的汇编级支持

x86_64 为原子操作提供汇编级支持双打和向量:

  • 双精度: 通过内存目标指令 movsd、movq、addsd、subsd 和 mulsd 支持原子加载、存储和加/减/乘操作。
  • 向量:对齐128 位和 256 位加载和存储在具有 AVX 支持的 x86_64 上是原子的。对于非对齐向量操作,没有直接的原子性硬件保证。

MSVC 2017 实现无锁原子

MSVC 2017实现无锁原子使用双宽度整数寄存器进行操作。例如,加载操作涉及:

CAS: movq QWORD PTR [dst_addr], rax  // 64-bit CAS
登录后复制

添加操作使用:

CAS: lock cmpxchg16b QWORD PTR [dst_addr], rax  // 128-bit CAS
登录后复制

原子RMW(读-修改-写)操作

原子读-修改-写 (RMW) 操作,例如 fetch_add,需要 CAS 循环实现。在 x86_64 上,CAS 指令支持 16 字节操作 (cmpxchg16b)。

CAS: lock cmpxchg16b QWORD PTR [dst_addr], rax
登录后复制

虽然 CAS 循环提供原子 RMW 功能,但它们比原子加载和存储更昂贵。

附加说明

  • 一些非 x86 硬件支持 float/double 类型的原子加法操作。
  • Intel 的事务内存扩展 (TSX) 改进了对原子 FP 和 SIMD 操作的支持。
  • 编译器通常会生成低效的原子代码< ;双>操作,但正在改进。
  • 对对齐双精度数共享数组的原子操作应该是安全的,而对未对齐向量的操作可能涉及撕裂。
  • 可以在 16 上实现原子操作-byte 对象使用 cmpxchg16b,但性能会很差。

以上是x86_64 架构上如何处理原子浮点和向量运算?的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

热门话题

Java教程
1664
14
CakePHP 教程
1423
52
Laravel 教程
1317
25
PHP教程
1268
29
C# 教程
1243
24
C#与C:历史,进化和未来前景 C#与C:历史,进化和未来前景 Apr 19, 2025 am 12:07 AM

C#和C 的历史与演变各有特色,未来前景也不同。1.C 由BjarneStroustrup在1983年发明,旨在将面向对象编程引入C语言,其演变历程包括多次标准化,如C 11引入auto关键字和lambda表达式,C 20引入概念和协程,未来将专注于性能和系统级编程。2.C#由微软在2000年发布,结合C 和Java的优点,其演变注重简洁性和生产力,如C#2.0引入泛型,C#5.0引入异步编程,未来将专注于开发者的生产力和云计算。

C和XML的未来:新兴趋势和技术 C和XML的未来:新兴趋势和技术 Apr 10, 2025 am 09:28 AM

C 和XML的未来发展趋势分别为:1)C 将通过C 20和C 23标准引入模块、概念和协程等新特性,提升编程效率和安全性;2)XML将继续在数据交换和配置文件中占据重要地位,但会面临JSON和YAML的挑战,并朝着更简洁和易解析的方向发展,如XMLSchema1.1和XPath3.1的改进。

继续使用C:耐力的原因 继续使用C:耐力的原因 Apr 11, 2025 am 12:02 AM

C 持续使用的理由包括其高性能、广泛应用和不断演进的特性。1)高效性能:通过直接操作内存和硬件,C 在系统编程和高性能计算中表现出色。2)广泛应用:在游戏开发、嵌入式系统等领域大放异彩。3)不断演进:自1983年发布以来,C 持续增加新特性,保持其竞争力。

C#vs. C:学习曲线和开发人员的经验 C#vs. C:学习曲线和开发人员的经验 Apr 18, 2025 am 12:13 AM

C#和C 的学习曲线和开发者体验有显着差异。 1)C#的学习曲线较平缓,适合快速开发和企业级应用。 2)C 的学习曲线较陡峭,适用于高性能和低级控制的场景。

C和XML:探索关系和支持 C和XML:探索关系和支持 Apr 21, 2025 am 12:02 AM

C 通过第三方库(如TinyXML、Pugixml、Xerces-C )与XML交互。1)使用库解析XML文件,将其转换为C 可处理的数据结构。2)生成XML时,将C 数据结构转换为XML格式。3)在实际应用中,XML常用于配置文件和数据交换,提升开发效率。

C社区:资源,支持和发展 C社区:资源,支持和发展 Apr 13, 2025 am 12:01 AM

C 学习者和开发者可以从StackOverflow、Reddit的r/cpp社区、Coursera和edX的课程、GitHub上的开源项目、专业咨询服务以及CppCon等会议中获得资源和支持。1.StackOverflow提供技术问题的解答;2.Reddit的r/cpp社区分享最新资讯;3.Coursera和edX提供正式的C 课程;4.GitHub上的开源项目如LLVM和Boost提升技能;5.专业咨询服务如JetBrains和Perforce提供技术支持;6.CppCon等会议有助于职业

C的未来:改编和创新 C的未来:改编和创新 Apr 27, 2025 am 12:25 AM

C 的未来将专注于并行计算、安全性、模块化和AI/机器学习领域:1)并行计算将通过协程等特性得到增强;2)安全性将通过更严格的类型检查和内存管理机制提升;3)模块化将简化代码组织和编译;4)AI和机器学习将促使C 适应新需求,如数值计算和GPU编程支持。

超越炒作:评估当今C的相关性 超越炒作:评估当今C的相关性 Apr 14, 2025 am 12:01 AM

C 在现代编程中仍然具有重要相关性。1)高性能和硬件直接操作能力使其在游戏开发、嵌入式系统和高性能计算等领域占据首选地位。2)丰富的编程范式和现代特性如智能指针和模板编程增强了其灵活性和效率,尽管学习曲线陡峭,但其强大功能使其在今天的编程生态中依然重要。

See all articles