UTF-8 est un codage de caractères qui décrit chaque point de code Unicode en utilisant une séquence d'octets de un à quatre octets. Il est rétrocompatible avec ASCII tout en prenant en charge la représentation de tous les points de code Unicode.

Plus à propos utf-8...

Je suis en utilisant le code Python pour analyser plusieurs fichiers .xml import os import lxml.etree as ET import sys inputpath = "C:\\projects\\xmlformat\\uuid\\" xsltfile = "C:\\projects\\xmlformat\\uuid\\uuid.xslt" outpath = "C:\\projects\\xmlformat\\output" dir = [] if sys.version_info[0] >=....
24 mai 2021 à 18:23
Je sais que la charrette de rouille stocke un code hexadécimal unicode 4 octets. Et la chaîne (principalement) de UTF-8 (il est recompilé Unicode). Ces articles semblaient m'exprimer que l'utilisation de caractères non anglais est facile de faire des erreurs. Mais je n'ai pas pu trouver de code réel....
24 mai 2021 à 02:41
Il y a un fichier avec le contenu suivant: b'prefix:input_text' b'oEffect:PersonX \xd8\xaf\xd8\xb1 \xd8\xac\xd9\x86\xda\xaf ___ \xd8\xa8\xd8\xa7\xd8\xb2\xdb\x8c \xd9\x85\xdb\x8c \xda\xa9\xd9\x86\xd8\xaf' b'oEffect:PersonX \xd8\xaf\xd8\xb1 \xd8\xac\xd9\x86\xda\xaf ___ \xd8\xa8\xd8\xa7\xd8\xb2\xdb\x8c....
19 mai 2021 à 20:21
f.read(1) retournera 1 octet, pas un personnage. Le fichier est binaire mais des gammes particulières dans le fichier sont des chaînes codées UTF-8 avec la longueur venant avant la chaîne. Il n'y a pas de caractère de nouvelle ligne à la fin de la chaîne. Comment puis-je lire de telles chaînes? J'ai....
18 mai 2021 à 18:55
Actuellement, j'ai besoin de travailler avec les octets d'une chaîne en Java et il a soulevé tant de questions sur les codages et les détails de la mise en œuvre de la JVM. J'aimerais savoir si ce que je fais un sens, ou c'est redondant. Pour commencer, je comprends qu'à l'exécution d'un Java Char d....
18 mai 2021 à 13:24
La sortie de git diff --name-only n'est pas très utile pour les noms de fichiers qui ne sont pas ASCII. Exemple: git init echo Germany > Düsseldorf.txt echo Mexico > Cancún.txt git add *.txt while read f do cat "$f" done < <(git diff --cached --name-only) Il en résulte la sortie suivante: cat:....
18 mai 2021 à 10:25
J'ai eu un site web en cours d'exécution depuis presque 20 ans, j'ai malheureusement fait l'erreur de ne pas aligner le jeu de caractères HTML avec le jeu de caractères MySQL, de sorte que toutes mes données semblent être codées à double codation (je pense) ou éventuellement mojibaked, ou les deux .....
13 mai 2021 à 16:20
J'ai besoin de changer avec Python beaucoup de strings avec un format de date d'espagnol (DDMMYYYYY, MMM Abréviated mois en espagnol) dans un autre format DateTime, mais j'ai des problèmes car Mes paramètres espagnols locaux ont un "". (A DOT ) à la fin de la chaîne lorsqu'il modifie ce format d....
12 mai 2021 à 17:57
Il existe un fichier qui a un caractère spécial comme délimiteur (§) utfcode -> 0xa7 Snapshot of Fichier est ci-dessous "Diablo"§"tRaider"§"2019-08-12" "GOT"§"BeltMorham"§"2019-01-02" "Tomb Raider"§"RealMason"§"2019-04-02" Maintenant, le fichierFormat est ci-dessous Create FILE FORMAT GamerFF SET C....
10 mai 2021 à 23:44
Je voulais obtenir des données de Websocket (un échange) de Bitmart. J'ai pu abonner à la bande Web et récupérer des données mais il est compressé et en fonction du Documentation Je suis censé utiliser zlib pour décompresser les données, mais quand j'ai essayé de le faire, il a donné une erreur: U....
7 mai 2021 à 21:19
J'essaie d'analyser un fichier XML à partir d'une source externe contenant des octets UTF-8 non valides Utilisation du code Java suivant DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); factory.setValidating(false); factory.setIgnoringComments(true); factory.setNamespaceAware(....
4 mai 2021 à 11:46
J'ai un fichier zippé sur S3 auquel je dois préparer la chaîne. J'ai essayé de suivre le code. Mais cela n'ajoute pas la chaîne à la première ligne. s3_resource = boto3.resource('s3') zip_obj = s3_resource.Object(bucket_name=bucket, key=obj_key) buffer = BytesIO(zip_obj.get()["Body"].read()) try: ....
4 mai 2021 à 00:18
Comment convertir le texte dans ISO-8859-1 / Latin1 en UTF-8 en utilisant Python 3.7.4 (32 bits)? Voici ce que j'ai essayé: >>> inputText = "\xC4pple" >>> inputText.decode('iso-8859-1').encode('utf8') Et il a renvoyé cette erreur: Traceback (most recent call last): File "<stdin>", line 1, in <mod....
1 mai 2021 à 02:07
J'ai une application XPages pour les utilisateurs suédois. Quand j'envoie un message à la facescontext via msg = propStrings.getProperty("gen_CustDateDecided") ; FacesContext facesContext = FacesContext.getCurrentInstance(); facesContext.addMessage("msgBox", new javax.faces.application.FacesMessage(....
30 avril 2021 à 11:29
Je reçois une erreur d'API que j'utilise except Exception as e: return { "error": str(e), "senderInfo": None, "signInfo": None } Et je ne peux pas voir ou décoder le message d'erreur de celui-ci qui est en Ukraine {'ErrorCode': 51, 'ErrorDesc': b'\\xd0\\xa1\\xd0....
29 avril 2021 à 12:18
J'ai écrit un script Python3 qui télécharge une URL. Cependant, cela ne fonctionne pas s'il y a une "Umlaut" dans l'URL (dans ce cas "ü"). L'URL ne fonctionne pas si j'écris "ue". Comment puis-je changer de UTF 8? import urllib.request url = "https://www.corona-in-zahlen.de/landkreise/sk%20würzburg....
29 avril 2021 à 11:28
J'ai écrit une macro qui génère des lignes XML (avec la bonne mise en forme) dans la colonne A d'une certaine feuille. Donc, chaque ligne de cette feuille doit correspondre à une ligne dans un fichier XML. Si je copier-coller cette colonne dans le Bloc-notes, enregistrez-la sous forme de fichier .xm....
27 avril 2021 à 22:16
J'ai besoin de sauvegarder le fichier avec les noms UTF-8.mais lorsque je le fais une erreur Django: UnicodeEncodeError at /uploaded/document/ 'فیلتر.png' 'ascii' codec can't encode characters in position 55-59: ordinal not in range(128) Bien que mon fichier filefield aime-t-il: # -*- coding: utf-8....
18 avril 2021 à 07:46
Sur ce RFC: https://tools.ietf.org/html/rfc7616#page- 19 à la page 19, il y a cet exemple d'un texte codé dans UTF-8: J U+00E4 s U+00F8 n D o e 4A C3A4 73 C3B8 6E 20 44 6F 65 Comment le représenter dans une corde de rouille? J'ai essayé https://mothereff.in/utf-8 et faire J\00E4s\....
18 avril 2021 à 06:17
J'ai une chaîne Test\xc2\xae représentée en hexagonal comme 0x54 0x65 0x73 0x74 0x5c 0x78 0x63 0x32 0x5c 0x78 0x61 0x65. Le jeu de caractères \xc2\xae dans cette chaîne n'est que le codage UTF-8 de ® (marque déposée). Je veux écrire une fonction C ++ pouvant convertir \xc2 (dans hex {0x5c 0x78 0x63....
17 avril 2021 à 10:10
Basé sur la suggestion de ce fil, j'ai utilisé PowerShell pour faire la conversion UTF-8, je suis maintenant dans un autre problème, j'ai un fichier très énorme autour de 18 Go que j'essaie de convertir sur une machine avec environ 50 Go de RAM Gratuit, mais ce processus de conversion mange tout le ....
13 avril 2021 à 14:03
Je veux importer tous les fichiers d'un répertoire à mon SQL. Mais je dois d'abord apporter les mêmes modifications à chaque fichier .htb d'origine. Le problème avec le fichier d'origine est que Je ne veux pas importer les en-têtes de colonne et la 2e ligne parce que son blanc J'ai besoin de changer....
13 avril 2021 à 13:12
Voici le scénario: Active Directory Exporter à l'aide du commutateur CSVDE et -U (pour UNICODE) La sortie est un fichier UTF-16 LE. Certains caractères chinois et arabes sont exportés avec succès. "Enregistrer sous" UTF-8 à l'aide du bloc-notes Windows. Les caractères chinois et arabes apparaissent ....
23 mars 2021 à 17:55
J'ai une chaîne comme celle-ci: 'hello this is nice\\r\\n\\xc2\\xa0 goodbye' J'ai besoin de convertir cela en texte plain UTF-8. La bibliothèque de codecs n'a pas résolu ceci: codecs.unicode_escape_decode(x)[0] 'hello this is nice\r\nÂ\xa0 goodbye' Comment transformer cette chaîne en texte propre ....
23 mars 2021 à 11:59
J'utilise pyodbc pour lire une trame de données à partir d'une requête SQL mais je continue à recevoir une erreur indiquant que le codec 'utf-8' ne peut pas décoder l'octet 0xa0 en position n: octet de démarrage invalide. Code comme ci-dessous. Comment corriger cette erreur? Merci import pyodbc i....
15 mars 2021 à 18:07