


Comment puis-je détecter les séquences d'octets UTF-8 invalides dans Go ?
Détection des séquences d'octets invalides dans Go
Dans Go, lors de la conversion d'une tranche d'octets ([]byte) en chaîne, il est possible de rencontrez des séquences d'octets invalides qui ne peuvent pas être traduites en Unicode. Cela vient du fait que toutes les séquences d'octets ne représentent pas des caractères UTF-8 valides.
Pour détecter de telles occurrences, deux approches sont disponibles :
Contrôle de validité UTF-8 :
Comme le mentionne Tim Cooper, la fonction utf8.Valid peut être utilisée pour tester si une tranche d'octets contient un UTF-8 valide. octets. Si le résultat est faux, cela indique la présence de séquences d'octets invalides.
Considérations sur la conversion de chaînes :
Contrairement aux hypothèses courantes, Go permet la conversion de fichiers non UTF. - Tranches de 8 octets en chaînes. Cependant, il est important de noter qu'une chaîne dans Go est essentiellement une tranche d'octets en lecture seule et peut donc accueillir des octets qui ne sont pas valides en UTF-8.
Ce n'est que dans des situations spécifiques que Go exécute automatiquement l'UTF-8. 8 décodage :
- Lors d'une itération sur une chaîne en utilisant la syntaxe for i, r := range s, la variable r représente un point de code Unicode (rune) et est toujours valide.
- Lors de la conversion d'une chaîne en une tranche de runes (c'est-à-dire, []rune(s)), Go décode la chaîne entière en runes.
Dans les deux cas , les caractères UTF-8 non valides sont remplacés par le caractère de remplacement U FFFD. Ce remplacement peut ne pas être acceptable dans toutes les applications, il est donc recommandé d'effectuer une validation UTF-8 explicite si nécessaire.
Exemple :
Considérez le programme Go suivant :
package main import ( "fmt" "unicode/utf8" ) func main() { a := []byte{0xff} s := string(a) // Check UTF-8 validity if utf8.Valid(a) { fmt.Println("Valid UTF-8") } else { fmt.Println("Invalid UTF-8") } // Output string fmt.Println(s) }
Sortie :
Invalid UTF-8 �
Dans cet exemple, la tranche d'octets a contient un invalide séquence d'octets, ce qui entraîne un message "UTF-8 invalide". Par la suite, lors de sa conversion en chaîne, l'octet invalide est représenté par le caractère de remplacement "�".
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds











Golang est meilleur que Python en termes de performances et d'évolutivité. 1) Les caractéristiques de type compilation de Golang et le modèle de concurrence efficace le font bien fonctionner dans des scénarios de concurrence élevés. 2) Python, en tant que langue interprétée, s'exécute lentement, mais peut optimiser les performances via des outils tels que Cython.

Golang est meilleur que C en concurrence, tandis que C est meilleur que Golang en vitesse brute. 1) Golang obtient une concurrence efficace par le goroutine et le canal, ce qui convient à la gestion d'un grand nombre de tâches simultanées. 2) C Grâce à l'optimisation du compilateur et à la bibliothèque standard, il offre des performances élevées près du matériel, adaptées aux applications qui nécessitent une optimisation extrême.

GOIMIMPACTSDEVENCEMENTSPOSITIVEMENTS INSPECT, EFFICACTION ET APPLICATION.1) VITESSE: GOCOMPILESQUICKLYANDRUNSEFFIÉMENT, IDEALFORLARGEPROROSTS.2) Efficacité: ITSCOMPEHENSIVESTANDARDLIBRARYREDUCEEXTERNEDENDENCES, EnhancingDevelovefficiency.3) Simplicité: Simplicité: Implicité de la manière

GOISIDEALFORBEGINNERNERS et combinant pour pourcloudandNetWorkServicesDuetOtssimplicity, Efficiency, andCurrencyFeatures.1) InstallgofromTheofficialwebsiteandverifywith'goversion'..2)

Golang convient au développement rapide et aux scénarios simultanés, et C convient aux scénarios où des performances extrêmes et un contrôle de bas niveau sont nécessaires. 1) Golang améliore les performances grâce à des mécanismes de collecte et de concurrence des ordures, et convient au développement de services Web à haute concurrence. 2) C réalise les performances ultimes grâce à la gestion manuelle de la mémoire et à l'optimisation du compilateur, et convient au développement du système intégré.

Golang et Python ont chacun leurs propres avantages: Golang convient aux performances élevées et à la programmation simultanée, tandis que Python convient à la science des données et au développement Web. Golang est connu pour son modèle de concurrence et ses performances efficaces, tandis que Python est connu pour sa syntaxe concise et son écosystème de bibliothèque riche.

C est plus adapté aux scénarios où le contrôle direct des ressources matérielles et une optimisation élevée de performances sont nécessaires, tandis que Golang est plus adapté aux scénarios où un développement rapide et un traitement de concurrence élevé sont nécessaires. 1.C's Avantage est dans ses caractéristiques matérielles proches et à des capacités d'optimisation élevées, qui conviennent aux besoins de haute performance tels que le développement de jeux. 2. L'avantage de Golang réside dans sa syntaxe concise et son soutien à la concurrence naturelle, qui convient au développement élevé de services de concurrence.

Les différences de performance entre Golang et C se reflètent principalement dans la gestion de la mémoire, l'optimisation de la compilation et l'efficacité du temps d'exécution. 1) Le mécanisme de collecte des ordures de Golang est pratique mais peut affecter les performances, 2) la gestion manuelle de C et l'optimisation du compilateur sont plus efficaces dans l'informatique récursive.
