


La réinterprétation des conversions entre les pointeurs vectoriels matériels SIMD et les types correspondants est-elle un comportement non défini en C ?
La réinterprétation de la diffusion entre le pointeur vectoriel SIMD matériel et le type correspondant est-elle un comportement non défini ?
En C, est-il permis de réinterpréter_cast un float à un __m256 et accédez aux objets flottants via un pointeur différent type ?
L'exemple de code suivant illustre ceci :
#include <immintrin.h> constexpr size_t _m256_float_step_sz = sizeof(__m256) / sizeof(float); alignas(__m256) float stack_store[100 * _m256_float_step_sz ]{}; __m256& hwvec1 = *reinterpret_cast<__m256*&>(&stack_store[0 * _m256_float_step_sz]); using arr_t = float[_m256_float_step_sz]; arr_t& arr1 = *reinterpret_cast<float(*)[_m256_float_step_sz]&>(&hwvec1);
Hwvec1 et arr1 ont-ils des comportements non définis ? Les règles strictes d'alias sont-elles violées ([basic.lval]/11) ? Alternativement, existe-t-il une seule manière intrinsèque définie :
__m256 hwvec2 = _mm256_load_ps(&stack_store[0 * _m256_float_step_sz]); _mm256_store_ps(&stack_store[1 * _m256_float_step_sz], hwvec2);
Réponse :
ISO C ne définit pas __m256, nous devons donc examiner ce qui définit leur comportement sur les implémentations qui les supportent. Les valeurs intrinsèques d'Intel définissent les pointeurs vectoriels comme __m256 comme étant autorisés à créer un alias, de la même manière que l'ISO C définit char comme étant autorisé à créer un alias. (Mais pas l'inverse : c'est UB et c'est une pratique courante de pointer un int* sur un __m256i et de le déréférencer.)
Alors oui, il est prudent de déréférencer un __m256 au lieu d'utiliser un _mm256_load_ps( ) charge alignée intrinsèque. Mais surtout pour float/double, il est souvent plus facile d'utiliser les intrinsèques car ils s'occupent également du casting depuis float. Pour les entiers, les intrinsèques de chargement/stockage AVX512 sont définis comme prenant void mais AVX2 et les versions antérieures ont besoin d'un cast comme (__m256i)&arr[i] qui est une conception d'API assez maladroite et encombre le code qui l'utilise.
Quelques éléments intrinsèques non-AVX512 ont également été ajoutés en utilisant void comme movd/movq charge/stocke l'alignement et l'alias des intrinsèques sûrs tels que _mm_loadu_si32(void). Auparavant, je pense qu'Intel supposait que vous utiliseriez _mm_cvtsi32_si128, ce qui nécessitait de charger vous-même un int en toute sécurité, ce qui signifiait utiliser memcpy pour éviter UB (au moins sur les compilateurs autres que ICC et MSVC classiques, s'ils autorisent des int* non alignés et n'appliquent pas de règles strictes. aliasing).
Cela aurait pu se produire à l'époque où Intel a commencé à envisager de migrer vers LLVM pour ICX/ICPX/OneAPI, et réaliser à quel point il était compliqué de gérer des charges étroites sur les compilateurs qui appliquent un alias strict.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds











L'histoire et l'évolution de C # et C sont uniques, et les perspectives d'avenir sont également différentes. 1.C a été inventé par Bjarnestrousstrup en 1983 pour introduire une programmation orientée objet dans le langage C. Son processus d'évolution comprend plusieurs normalisations, telles que C 11, introduisant des mots clés automobiles et des expressions de lambda, C 20 introduisant les concepts et les coroutines, et se concentrera sur les performances et la programmation au niveau du système à l'avenir. 2.C # a été publié par Microsoft en 2000. Combinant les avantages de C et Java, son évolution se concentre sur la simplicité et la productivité. Par exemple, C # 2.0 a introduit les génériques et C # 5.0 a introduit la programmation asynchrone, qui se concentrera sur la productivité et le cloud computing des développeurs à l'avenir.

C Les raisons de l'utilisation continue incluent ses caractéristiques élevées, une application large et en évolution. 1) Performances à haute efficacité: C fonctionne parfaitement dans la programmation système et le calcul haute performance en manipulant directement la mémoire et le matériel. 2) Largement utilisé: briller dans les domaines du développement de jeux, des systèmes intégrés, etc. 3) Évolution continue: depuis sa sortie en 1983, C a continué à ajouter de nouvelles fonctionnalités pour maintenir sa compétitivité.

Il existe des différences significatives dans les courbes d'apprentissage de l'expérience C # et C et du développeur. 1) La courbe d'apprentissage de C # est relativement plate et convient au développement rapide et aux applications au niveau de l'entreprise. 2) La courbe d'apprentissage de C est raide et convient aux scénarios de contrôle haute performance et de bas niveau.

C interagit avec XML via des bibliothèques tierces (telles que TinyXML, PUGIXML, XERCES-C). 1) Utilisez la bibliothèque pour analyser les fichiers XML et les convertir en structures de données propices à C. 2) Lors de la génération de XML, convertissez la structure des données C au format XML. 3) Dans les applications pratiques, le XML est souvent utilisé pour les fichiers de configuration et l'échange de données afin d'améliorer l'efficacité du développement.

C Les apprenants et les développeurs peuvent obtenir des ressources et le soutien de Stackoverflow, des cours R / CPP de Reddit, Coursera et EDX, des projets open source sur GitHub, des services de conseil professionnel et CPPCON. 1. StackOverflow fournit des réponses aux questions techniques; 2. La communauté R / CPP de Reddit partage les dernières nouvelles; 3. Coursera et Edx fournissent des cours de C officiels; 4. Projets open source sur GitHub tels que LLVM et Boost Améliorer les compétences; 5. Les services de conseil professionnel tels que Jetbrains et Perforce fournissent un support technique; 6. CPPCON et d'autres conférences aident les carrières

C a toujours une pertinence importante dans la programmation moderne. 1) Les capacités de fonctionnement matériel et directes en font le premier choix dans les domaines du développement de jeux, des systèmes intégrés et de l'informatique haute performance. 2) Les paradigmes de programmation riches et les fonctionnalités modernes telles que les pointeurs intelligents et la programmation de modèles améliorent sa flexibilité et son efficacité. Bien que la courbe d'apprentissage soit raide, ses capacités puissantes le rendent toujours important dans l'écosystème de programmation d'aujourd'hui.

L'avenir de C se concentrera sur l'informatique parallèle, la sécurité, la modularisation et l'apprentissage AI / Machine: 1) L'informatique parallèle sera améliorée par des fonctionnalités telles que les coroutines; 2) La sécurité sera améliorée par le biais de mécanismes de vérification et de gestion de la mémoire plus stricts; 3) La modulation simplifiera l'organisation et la compilation du code; 4) L'IA et l'apprentissage automatique inviteront C à s'adapter à de nouveaux besoins, tels que l'informatique numérique et le support de programmation GPU.

C isnotdying; il se révolte.1) C reste réévèreurtoitSversatity et effecciation en termes
