UTF-8 est un codage de caractères qui décrit chaque point de code Unicode en utilisant une séquence d'octets de un à quatre octets. Il est rétrocompatible avec ASCII tout en prenant en charge la représentation de tous les points de code Unicode.

utf-8...

Ici, j'ai un code simple: #include <iostream> #include <cstdint> int main() { const unsigned char utf8_string[] = u8"\xA0"; std::cout << std::hex << "Size: " << sizeof(utf8_string) << std::endl; for (int i=0; i < sizeof(utf8_string); i++) { std::cout ....
29 avril 2020 à 18:44
J'essaye l'interface Perl de Bryan Henderson avec la bibliothèque ncurses: Curses Pour un exercice simple, j'essaie d'obtenir des caractères uniques tapés à l'écran. Ceci est directement basé sur le NCURSES Programming HOWTO, avec des adaptations . Lorsque j'appelle la bibliothèque Perl getchar(), j....
28 mars 2020 à 18:43
Ce petit programme python: #!/usr/bin/env python # -*- coding: utf8 -*- import json import sys x = { "name":u"This doesn't work β" } json.dump(x, sys.stdout, ensure_ascii=False, encoding="utf8") print Génère cette sortie lorsqu'elle est exécutée sur un terminal: $ ./tester.py {"name": "This does....
25 févr. 2020 à 22:21
Ma question a peut-être déjà été répondue sur StackoverFlow, mais je ne la trouve pas. Mon problème est simple: je demande des données via une API, et les données retournées ont des caractères Unicode, par exemple: "SpecialOffer":[{"title":"Offre Vente Priv\u00e9e 1 jour 2019 2020"}] J'ai besoin de....
24 févr. 2020 à 13:33
J'utilise perl 5, version 24, subversion 3 (v5.24.3) construit pour MSWin32-x64-multi-thread (avec 1 patch enregistré, voir perl -V pour plus de détails) (état actif). Essayer d'analyser la page HTML encodée en UTF-8: $request = new HTTP::Request('GET', $url); $response = $ua->request($request); $co....
3 janv. 2020 à 22:53
J'ai un tube avec une quantité infinie de chaînes écrites dessus. Ces chaînes sont un mélange d'ASCII et d'émojis. Le problème que j'ai c'est que je les lis comme ça char msg[100]; int length = read(fd,&msg,99); msg[length] =0; Mais parfois, l'emoji que je suppose est multi-octets et il est coupé e....
3 janv. 2020 à 02:58
J'essaie de supprimer un site Web. Tous les sites Web fonctionnent bien et renvoient du contenu HTML, à l'exception d'Amazon.com qui renvoie des caractères étranges: ���$����C����~/�2��!Ҧ�@@ PK��� ;y������~�R�{t�$�)�؊") ��N ������S�b��Db���y��D.e��%G~g���ú�6~�zB}}=�9)��.w��`�'D:��....
2 janv. 2020 à 20:47
J'essaye de faire un décodeur. Système de base .Net 4.7 J'essaie de migrer ce système en php, mais j'ai du mal à convertir les octets. Pour autant que je comprenne la chaîne par défaut UTF-16le sur C # , j'ai compris les fonctions ord et chr comme UCS-2 du côté PHP . Je veux faire ci-desso....
31 déc. 2019 à 16:41
Comment décoder cette chaîne présente dans utf-16 en utilisant python3 "b'\\xff\\xfeS\\x00H\\x00A\\x00D\\x00E\\x00K\\x00 \\x00D\\x00E\\x00E\\x00E\\x00P\\x00'" Essayé cela mais obtenir l'erreur TypeError: un objet de type octets est requis, pas 'str' a.rstrip("\n").decode("utf-16")....
24 déc. 2019 à 14:27
J'ai une chaîne d'unicode - сентрября et je sais que cela est exprimé dans la séquence comme ceci: \xd1\x81\xd0\xb5\xd0\xbd\xd1\x82\xd1\x8f\xd1\x80\xd0\xb1\xd1\x80\xd1\x8f Quel est ce type de caractères codés d'expression et comment convertir n'importe quel texte d'unicode en séquences comme celle-....
21 déc. 2019 à 00:00
J'ai un jeu de données hkscs que j'essaie de lire en python 3. Ci-dessous le code encoding = 'big5hkscs' lines = [] num_errors = 0 for line in open('file.txt'): try: lines.append(line.decode(encoding)) except UnicodeDecodeError as e: num_errors += 1 Cela me renvoie une erreu....
20 déc. 2019 à 03:47
J'essaie d'extraire des valeurs numériques d'une chaîne d'octets transmise à partir d'un port RS-232. Voici un exemple: b'S\xa0S\xa0\xa0\xa0\xa0\xa0\xa0\xb23.6\xb7\xa0\xe7\x8d\n' Si j'essaie de décoder la chaîne d'octets en tant que «utf-8», je reçois la sortie suivante: x = b'S\xa0S\xa0\xa0\xa0\xa0....
19 déc. 2019 à 22:50
Je suis nouveau sur python et j'ai du mal à encoder J'ai une liste de chaînes comme celle-ci: keys = ["u'part-00000-6edc0ee4-de74-4f82-9f8c-b4c965896224-c000.csv'", " u'part-00001-6edc0ee4-de74-4f82-9f8c-b4c965896224-c000.csv'"] Je fais ça pour encoder keys = [x.encode('UTF-8') for x in ke....
18 déc. 2019 à 03:17
J'utilise msxsl.exe pour générer dynamiquement un fichier HTML à partir d'un XML et XSL. J'ai écrit le code en C ++ en utilisant l'API CreateProcess et en appelant msxsl.exe. Étant donné que la sortie était UTF8 dans Windows 7, j'ai créé tous les fichiers associés (comme CSS et JavaScript) dans le m....
15 déc. 2019 à 18:13
J'ai une chaîne de littéraux UTF-8 '\ xe0 \ xa4 \ xb9 \ xe0 \ xa5 \ x80 \ xe0 \ xa4 \ xac \ xe0 \ xa5 \ x8b \ xe0 \ xa4 \ xb2' qui convertit en ही बोल en hindi. Je n'arrive pas à convertir string a en octets a = '\xe0\xa4\xb9\xe0\xa5\x80 \xe0\xa4\xac\xe0\xa5\x8b\xe0\xa4\xb2' #convert a to bytes #als....
14 déc. 2019 à 16:11
j'essaie d'enregistrer des chaînes qui contiennent des emojis dans un fichier .text, mais j'obtiens toujours une erreur lors de l'exécution du code. Code: I set the .txt file up to have an utf-8 encoding. subject_proper = subject.text.strip() subject_proper = subject_proper.decode('utf-8') Erreu....
13 déc. 2019 à 22:54
La conversion d'une chaîne XML à l'aide de CAST (AS XML) fonctionne comme prévu dans de nombreux scénarios, mais échoue avec une erreur "caractère xml illégal" si la chaîne contient des caractères accentués. Cet exemple échoue avec l'erreur "Analyse XML: ligne 2, caractère 8, caractère xml illégal":....
13 déc. 2019 à 21:51
Impossible d'imprimer la valeur de la chaîne thaïlandaise dans la console Java public static void main(String [] args){ String engParam = "Beautiful"; String thaiParam = "สวย"; System.out.println("Output :" + engParam + ":::" + thaiParam);} La sortie montre comme: Output :Beautiful:::à?ªà?....
13 déc. 2019 à 15:08
Cela semble être un problème étrange, et cela me cause des brûlures d'estomac, car j'utilise une bibliothèque qui cache les paramètres régionaux actuels et essaie de la remettre à ce qu'elle a caché. $ docker run --rm -it python:3.6 bash root@bcee8785c2e1:/# locale LANG=C.UTF-8 LANGUAGE= LC_CTYPE="C....
12 déc. 2019 à 01:43
mon environnement est nodejs let z = await x.text(); console.log(z) let y = JSON.parse(z) le journal de la console est { "errorCode":0, "errorMsg":"success", "result":{ "msg":"\u4e70\u5bb6\u5df2", "uid":"104", "username":"\u738b\u626d", "userphone":"1565777778", ....
11 déc. 2019 à 20:25
J'ai donc créé mon propre CMS rudimentaire, qui contient une page principale où les administrateurs peuvent saisir des éléments tels que le titre de la page, la description, les profils de médias sociaux, etc. J'ai également fait des entrées pour les injections de code dans la tête et le corps - des....
4 déc. 2019 à 19:19
J'ai un gros fichier que j'essaie d'importer. Le fichier est composé de millions de lignes de données créées par le client. Ainsi, certains utilisateurs ont utilisé des caractères non reconnus par l'encodage (moins de 1 caractère pour 100 000 caractères). Cependant, cela provoque la rupture du code,....
3 déc. 2019 à 16:51
J'ai AWS Config qui envoie des instantanés de mon système AWS à un compartiment S3 toutes les 12 heures. Ce sont des fichiers JSON stockés au format .json.gz qui contiennent des informations sur l'ensemble du système AWS. Lors de la création d'objet dans le compartiment, une fonction Lambda est décl....
Je veux transformer un dataframe en une chaîne. ce sujet Comment transformer une ligne de trame de données pandas en une chaîne séparée par des virgules est proche de ce que je veux. Le seul problème de cette solution: j'ai une colonne 'Country' avec une chaîne qui a un séparateur (par exemple, avec....
26 nov. 2019 à 18:37
J'essaie de charger et d'analyser un simple fichier XML encodé en utf-8 en javascript à l'aide de node et des packages xpath et xmldom. Aucun espace de noms XML n'est utilisé et le même XML analysé lors de la conversion en ASCII. Je peux voir dans le débogueur dans VS Code que la chaîne a des espace....
19 nov. 2019 à 21:23