Unicode est une norme pour l'encodage, la représentation et la gestion du texte avec l'intention de prendre en charge tous les caractères requis pour le texte écrit intégrant tous les systèmes d'écriture, symboles techniques et ponctuation.

unicode...

Je suis nouveau sur python et j'ai du mal à encoder J'ai une liste de chaînes comme celle-ci: keys = ["u'part-00000-6edc0ee4-de74-4f82-9f8c-b4c965896224-c000.csv'", " u'part-00001-6edc0ee4-de74-4f82-9f8c-b4c965896224-c000.csv'"] Je fais ça pour encoder keys = [x.encode('UTF-8') for x in ke....
18 déc. 2019 à 03:17
J'ai une chaîne comme celle-ci: "\"title\":\"👺TEST title value 😁\",\"text\":\"💖 TEST text value.\"" ... et je veux remplacer chaque symbole emoji par leur valeur unicode comme ceci: "\"title\":\"U+1F47ATEST title value U+1F601\",\"text\":\"U+1F496 TEST text value.\"" ... Après avoir beaucoup cherc....
17 déc. 2019 à 17:51
J'ai une chaîne de littéraux UTF-8 '\ xe0 \ xa4 \ xb9 \ xe0 \ xa5 \ x80 \ xe0 \ xa4 \ xac \ xe0 \ xa5 \ x8b \ xe0 \ xa4 \ xb2' qui convertit en ही बोल en hindi. Je n'arrive pas à convertir string a en octets a = '\xe0\xa4\xb9\xe0\xa5\x80 \xe0\xa4\xac\xe0\xa5\x8b\xe0\xa4\xb2' #convert a to bytes #als....
14 déc. 2019 à 16:11
J'ai des textes qui contiennent plusieurs langues. Je veux un nombre de mots qui enregistre uniquement les mots qui se produisent avec le jeu de caractères unicode grec en utilisant Python 3. Quelque chose comme: wordCount = 0 theText = open(file.txt, 'r') for word in theText.split(): if GreekUn....
Je dois supprimer certains signes diacritiques du texte hébreu. Si j'avais besoin de retirer le texte de TOUS les signes diacritiques, ce ne serait pas un tel problème. En unicode, la plage que je voudrais supprimer se situe entre \ u0591 et \ u05AF (ou 1425 - 1455 en décimal). tous les autres carac....
J'écris un script python pour récupérer l'image de l'url: url = `https://uploads0.wikiart.org/images/albrecht-durer/watermill-at-the-montaсa.jpg` urllib.request.urlretrieve(url, STYLE_IMAGE_UPLOAD + "wikiart" + "/" + url) Quand je cours j'ai le message UnicodeEncodeError: 'ascii' codec can't encode....
7 déc. 2019 à 18:37
Lecteurs respectés, J'ai récemment découvert que je peux utiliser des symboles Unicode à l'intérieur de python 3. En tant que chercheur, cela m'excite beaucoup car cela pourrait rendre mes équations plus lisibles. Pour un exemple, ceci est un morceau de mon code réécrit avec des caractères Unicode: ....
4 déc. 2019 à 15:29
J'essaie d'afficher le score d'un jeu de plateforme en haut de l'écran mais à chaque fois que je l'exécute, j'obtiens cette erreur: "Le texte doit être un Unicode ou des octets" J'ai déjà consulté le site et le code tout semble exactement comme ce que j'ai écrit mais je reçois toujours la même erreu....
4 déc. 2019 à 14:51
Je veux synchroniser mon ftp avec un dossier local avec des journaux. Les journaux enregistrés ainsi que la console montrent le caractère ESC ajouté comme ceci à la fin de chaque ligne lorsqu'il vérifie un fichier. vendor/phpmailer/phpmailer/language/phpmailer.lang-eo.php[0m[0K Voici la capture d'é....
3 déc. 2019 à 22:27
J'aimerais donner un exemple avant de poser ma question. u_string = u'\xcb\xa5\xb5' u_string Out[79]: 'Ë¥µ' asc_string = ascii(u_string) asc_string Out[81]: "'\\xcb\\xa5\\xb5'" Ici, j'obtiens enfin une chaîne ascii (asc_string) ne contenant que des caractères ascii. Ma question est, si je n'ai que ....
3 déc. 2019 à 04:17
Je convertis un fichier texte (words.txt) qui est essentiellement un dictionnaire dans ce format: good morning, Góðan daginn dans un fichier json (converted.json) dans ce format { "wordId": 1, "word": "good morning", "translation": "Góðan daginn" } La conversion d'un fichier texte en f....
J'ai besoin d'utiliser le pyparsing pour les caractères unicode. J'ai donc essayé un exemple simple de leur dépôt github avec le caractère français cédille et donne une erreur. Mon code from pyparsing import Word, alphas greet = Word(alphas) + "," + Word(alphas) + "!" hello = "Hello, cédille!" greet....
29 nov. 2019 à 17:22
J'ai un ensemble de données qui contient des commentaires de personnes en persan et en arabe. Certains commentaires contiennent des mots comme عاااالی qui n'est pas un vrai mot et le bon mot est en fait عالی. C'est comme utiliser woooooooow! au lieu de WoW!. Mon intention est de trouver ces mots et ....
29 nov. 2019 à 01:53
Le HTML est un texte d'affichage comme celui-ci. J'ai déjà vérifié et le méta charset est déjà utf-8. Je ne sais pas pourquoi ça se passe S'il vous plaît, aidez :) id,cityname,{{man1}},{{number1}},{{man2}},{{number2}},{{man3}},{{number3}},{{man4}},{{number4}} 78,à¤à¤¯à¤¾,vikasasash,9601860923,vikash....
28 nov. 2019 à 12:39
Dans mes données JSON, il y a des caractères Unicode spéciaux comme "\ u00E0", "\ u00FB" et ainsi de suite. Je voudrais remplacer tous ces caractères par les lettres normales. Par exemple, "\ u00E0" avec "à" et "\ u00FB" avec "û" . Il y a beaucoup de ces personnages, donc je trouverais une ....
20 nov. 2019 à 23:25
Je voudrais convertir une chaîne en une séquence d'échappement unicode, en python 3, que je pourrai utiliser plus tard. Par exemple: string = "Hello, World!\n" print(string.unicode_escape()) # shoud print \u0048\u0065\u006C\u006C\u006F\u002C\u0020... Notez que la fonction doit renvoyer une chaîne b....
20 nov. 2019 à 00:12
J'ai la liste suivante: text = ['\ued07', '\ueedb', '\ueedb', '\uecd0', '\uebf0', '\uf4ee', '\uebf0', '\uf013', '\uecd0', '\uec83', '\ue29d', '\ueedb', '\uecd0', '\uecd0', '\uec83', '\ued07', '\ueedb', '\uecd0', '\uec83', '\uec83', '\uea41', '\uea41', '\uebf0', '\uebf0', '\uecd0', '\ued07', '\uecd0'....
18 nov. 2019 à 16:06
Cela ne fonctionne pas sur Edge mais bien sur Chrome. ... patterns.fname = /^[\p{Lu}]{1}[\p{L}]{1,15}$/gu patterns.lname = /^[\p{Lu}]{1}[\-_0-9 \p{L}]{1,15}$/gu ... myinput.match(patterns.fname); myinput.match(patterns.lname); ....
16 nov. 2019 à 17:14
Je peux comprendre comment décoder la façon dont Facebook encode les emoji dans les archives de messager. Salut tout le monde, j'essaie de coder un utilitaire pratique pour explorer le fichier d'archive de messenger avec PYTHON. Le fichier du message est un JSON "mal encodé" et comme indiqué dans ce....
J'ai téléchargé mes données de messagerie Facebook (dans votre compte Facebook, accédez aux paramètres, puis à Vos informations Facebook , puis Téléchargez vos informations , puis créez un fichier avec au moins la case Messages cochée) pour faire des statistiques intéressantes Cependant, il y ....
24 avril 2018 à 21:10
Mon site Web prend en charge un certain nombre de langues indiennes. L'utilisateur peut changer la langue dynamiquement. Lorsque l'utilisateur entre une valeur de chaîne, je dois diviser la valeur de chaîne en ses caractères individuels. Donc, je cherche un moyen d'écrire une fonction commune qui fo....
11 oct. 2015 à 21:42
Selon ce test: # -*- coding: utf-8 -*- ENCODING = 'utf-8' # what is the difference between decode and unicode? test_cases = [ 'aaaaa', 'ááááá', 'ℕℤℚℝℂ', ] FORMAT = '%-10s %5d %-10s %-10s %5d %-10s %10s' for text in test_cases : decoded = text.decode(ENCODING) unicoded = unicode....
18 déc. 2013 à 14:50
Dis que tu as une chaîne s = "C:\Users\Eric\Desktop\beeline.txt" Que vous souhaitez déplacer vers Unicode sinon. return s if PY3 or type(s) is unicode else unicode(s, "unicode_escape") S'il y a une chance que la chaîne ait un \ U (c'est-à-dire un répertoire utilisateur) et vous obtiendrez probable....
13 nov. 2013 à 15:23
J'ai quelques problèmes pour essayer de coder une chaîne en UTF-8. J'ai essayé de nombreuses choses, notamment en utilisant string.encode('utf-8') et unicode(string), mais je reçois l'erreur: UnicodeDecodeError: le codec 'ascii' ne peut pas décoder l'octet 0xef en position 1: l'ordinal n'est pas dan....
12 mai 2012 à 11:39
J'ai lu sur la suppression du caractère «u» dans une liste, mais j'utilise le moteur d'application Google et cela ne semble pas fonctionner! def get(self): players = db.GqlQuery("SELECT * FROM Player") print players playerInfo = {} test = [] for player in players: emai....
19 mars 2012 à 19:36