


Mengapa Popcount 64-bit Lebih Lambat Daripada 32-bit pada CPU Intel Kerana Ketergantungan Data Palsu?
Ketergantungan Data Palsu Kesan Prestasi Popcount pada CPU Intel
Isu:
Anda melihat ketara sisihan prestasi antara menggunakan pembilang gelung 32-bit dan 64-bit untuk operasi kiraan pop pada Intel CPU. Prestasi menurun sebanyak 50% apabila menggunakan pembilang 64-bit, pada mulanya dikaitkan dengan pepijat pengkompil.
Penjelasan: Ketergantungan Data Palsu
CPU Intel mempunyai pergantungan palsu pada daftar destinasi dalam arahan popcnt, yang mempengaruhi berbilang lelaran gelung ketat. Kebergantungan ini menghentikan arahan sehingga daftar destinasi tersedia. Bilangan arahan yang dipengaruhi oleh kebergantungan ini bergantung pada lokaliti gelung, menghasilkan variasi prestasi.
Akibat Ketergantungan:
- Daftar Berbeza: Apabila gelung menggunakan daftar berbeza untuk operasi popcnt berturut-turut, kebergantungan tersebar merentas lelaran gelung, memberi kesan ketara kepada prestasi.
- Daftar Sama: Jika semua operasi popcnt menggunakan daftar yang sama, kebergantungan kekal dalam satu lelaran, mengurangkan kesan prestasi.
- Rantaian Ketergantungan Terputus: Memecahkan kebergantungan dengan memperkenalkan arahan yang tidak berkaitan (cth., xor) meningkatkan prestasi dengan membenarkan pemproses menyelaraskan lelaran gelung.
Gelagat Pengkompil:
GCC mahupun Visual Studio tidak menyedari pergantungan palsu ini, yang membawa kepada prestasi yang tidak dapat diramalkan. mengenai peruntukan daftar. Penyusun lain, seperti Clang dan ICC, juga kekurangan pengetahuan ini.
Prestasi AMD:
Pemproses AMD nampaknya tidak mempunyai pergantungan palsu ini, menyumbang kepada peningkatannya prestasi dalam popcount operasi.
Mitigasi:
- Inlining Assembly: Mengoptimumkan kod pemasangan secara manual menggunakan pemasangan inline boleh memintas ketidaksedaran pengkompil tentang kebergantungan .
- Memecahkan Kebergantungan Rantaian: Memasukkan arahan yang tidak berkaitan selepas setiap operasi popcnt memecahkan kebergantungan palsu dan meningkatkan prestasi.
- Menggunakan Daftar Berbeza: Menetapkan daftar berbeza untuk operasi popcnt berturut-turut boleh mengurangkan isu tetapi mungkin tidak selalu boleh.
Atas ialah kandungan terperinci Mengapa Popcount 64-bit Lebih Lambat Daripada 32-bit pada CPU Intel Kerana Ketergantungan Data Palsu?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas











Sejarah dan evolusi C# dan C adalah unik, dan prospek masa depan juga berbeza. 1.C dicipta oleh BjarnestroustRup pada tahun 1983 untuk memperkenalkan pengaturcaraan berorientasikan objek ke dalam bahasa C. Proses evolusinya termasuk pelbagai standardisasi, seperti C 11 memperkenalkan kata kunci auto dan ekspresi Lambda, C 20 memperkenalkan konsep dan coroutin, dan akan memberi tumpuan kepada pengaturcaraan prestasi dan sistem pada masa akan datang. 2.C# telah dikeluarkan oleh Microsoft pada tahun 2000. Menggabungkan kelebihan C dan Java, evolusinya memberi tumpuan kepada kesederhanaan dan produktiviti. Sebagai contoh, C#2.0 memperkenalkan generik dan C#5.0 memperkenalkan pengaturcaraan tak segerak, yang akan memberi tumpuan kepada produktiviti pemaju dan pengkomputeran awan pada masa akan datang.

Trend pembangunan masa depan C dan XML adalah: 1) C akan memperkenalkan ciri -ciri baru seperti modul, konsep dan coroutin melalui piawaian C 20 dan C 23 untuk meningkatkan kecekapan dan keselamatan pengaturcaraan; 2) XML akan terus menduduki kedudukan penting dalam pertukaran data dan fail konfigurasi, tetapi akan menghadapi cabaran JSON dan YAML, dan akan berkembang dengan lebih ringkas dan mudah untuk menghuraikan arahan, seperti penambahbaikan XMLSChema1.1 dan XPath3.1.

C Alasan penggunaan berterusan termasuk prestasi tinggi, aplikasi luas dan ciri -ciri yang berkembang. 1) Prestasi kecekapan tinggi: C melaksanakan dengan baik dalam pengaturcaraan sistem dan pengkomputeran berprestasi tinggi dengan terus memanipulasi memori dan perkakasan. 2) Digunakan secara meluas: bersinar dalam bidang pembangunan permainan, sistem tertanam, dan lain -lain. 3) Evolusi berterusan: Sejak pembebasannya pada tahun 1983, C terus menambah ciri -ciri baru untuk mengekalkan daya saingnya.

Terdapat perbezaan yang signifikan dalam lengkung pembelajaran C# dan C dan pengalaman pemaju. 1) Keluk pembelajaran C# agak rata dan sesuai untuk pembangunan pesat dan aplikasi peringkat perusahaan. 2) Keluk pembelajaran C adalah curam dan sesuai untuk senario kawalan berprestasi tinggi dan rendah.

C Berinteraksi dengan XML melalui perpustakaan pihak ketiga (seperti TinyXML, PugixML, Xerces-C). 1) Gunakan perpustakaan untuk menghuraikan fail XML dan menukarnya ke dalam struktur data C-diproses. 2) Apabila menjana XML, tukar struktur data C ke format XML. 3) Dalam aplikasi praktikal, XML sering digunakan untuk fail konfigurasi dan pertukaran data untuk meningkatkan kecekapan pembangunan.

Model reka bentuk C moden menggunakan ciri -ciri baru C 11 dan seterusnya untuk membantu membina perisian yang lebih fleksibel dan cekap. 1) Gunakan Ekspresi Lambda dan STD :: Fungsi untuk memudahkan corak pemerhati. 2) Mengoptimumkan prestasi melalui semantik mudah alih dan pemajuan sempurna. 3) Penunjuk pintar memastikan jenis keselamatan dan pengurusan sumber.

C Pelajar dan pemaju boleh mendapatkan sumber dan sokongan dari StackOverflow, Komuniti R/CPP Reddit, Coursera dan EDX, Projek Sumber Terbuka di GitHub, Perkhidmatan Perundingan Profesional, dan CPPCON. 1. StackOverflow memberikan jawapan kepada soalan teknikal; 2. Komuniti R/CPP Reddit berkongsi berita terkini; 3. Coursera dan EDX menyediakan kursus f rasmi; 4. Projek sumber terbuka pada GitHub seperti LLVM dan meningkatkan kemahiran meningkatkan; 5. Perkhidmatan perundingan profesional seperti jetbrains dan perforce menyediakan sokongan teknikal; 6. CPPCON dan persidangan lain membantu kerjaya

Masa depan C akan memberi tumpuan kepada pengkomputeran selari, keselamatan, modularization dan pembelajaran AI/mesin: 1) Pengkomputeran selari akan dipertingkatkan melalui ciri -ciri seperti coroutine; 2) keselamatan akan diperbaiki melalui pemeriksaan jenis dan mekanisme pengurusan memori yang lebih ketat; 3) modulasi akan memudahkan organisasi dan penyusunan kod; 4) AI dan pembelajaran mesin akan mendorong C untuk menyesuaikan diri dengan keperluan baru, seperti pengkomputeran berangka dan sokongan pengaturcaraan GPU.
