Unicode est une norme pour l'encodage, la représentation et la gestion du texte avec l'intention de prendre en charge tous les caractères requis pour le texte écrit intégrant tous les systèmes d'écriture, symboles techniques et ponctuation.

unicode...

J'ai écrit un programme simple pour imprimer un emoji de sourire unicode. Malheureusement, quelque chose d'autre est imprimé. Quelqu'un sait-il quel est le problème avec ce code? Merci #include <iostream> #include <string> using namespace std; int main(int argc, char *argv[]) { string str = u8"....
5 juin 2020 à 21:04
J'essaie de supprimer tous les caractères autres que des lettres (à l'exception des espaces blancs) d'une chaîne contenant des accents en utilisant Python 3.7. J'ai essayé ce qui suit: import re text = "Андре́й Серге́евич Арша́вин (род. 29 мая 1981[4], Ленинград) — российский футболист, бывший капи....
5 mai 2020 à 00:06
Ici, j'ai un code simple: #include <iostream> #include <cstdint> int main() { const unsigned char utf8_string[] = u8"\xA0"; std::cout << std::hex << "Size: " << sizeof(utf8_string) << std::endl; for (int i=0; i < sizeof(utf8_string); i++) { std::cout ....
29 avril 2020 à 18:44
Existe-t-il une liste ou une bibliothèque contenant toutes les ponctuations que nous pourrions rencontrer fréquemment? J'utilise normalement string.punctuation, mais certains caractères de ponctuation n'y sont pas inclus, par exemple: >>> "'" in string.punctuation True >>> "’" in string.punctuation ....
2 avril 2020 à 06:31
Je dois vérifier, en java, si une chaîne est composée uniquement de valeurs Unicode [\ u0030- \ u0039] ou [\ u0660- \ u0669]. Quelle est la manière la plus efficace de procéder?....
9 mars 2020 à 11:45
Ce petit programme python: #!/usr/bin/env python # -*- coding: utf8 -*- import json import sys x = { "name":u"This doesn't work β" } json.dump(x, sys.stdout, ensure_ascii=False, encoding="utf8") print Génère cette sortie lorsqu'elle est exécutée sur un terminal: $ ./tester.py {"name": "This does....
25 févr. 2020 à 22:21
J'essaie d'analyser un JSON dans un script d'une page html. import requests from bs4 import BeautifulSoup import json headers = { "User-Agent": "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36 OPR/64.0.3417.47", "Accept": "text/html,a....
21 févr. 2020 à 21:44
J'ai joué avec JS et je n'arrive pas à comprendre comment JS décide quels éléments ajouter au tableau créé lors de l'utilisation de Array.from(). Par exemple, l'émoji 👍 suivant a un length de 2, car il est composé de deux points de code, mais, Array.from() traite ces deux points de code comme un, do....
4 févr. 2020 à 11:16
J'ai trouvé un site Web qui peut convertir n'importe quel texte en différents styles de police unicode obscurs, par exemple Small Caps pseudoalphabet. Je suis intéressé à faire la même chose dans le code Java. La capture d'écran HxD suivante montre les octets des deux versions de texte: Existe-t-i....
29 janv. 2020 à 17:27
J'ai un problème avec le remplacement des emoji en chaîne par chaîne avec unicode. Par exemple: J'ai de la ficelle: const str = "My string 😀 is with emoji 😀" J'ai besoin de convertir cette chaîne en const str = "My string EMOJI UNICODE is with emoji EMOJI UNICODE" Emoji unicode devrait ressembler à:....
26 janv. 2020 à 15:18
J'ai du mal à extraire des données à l'aide de la requête ci-dessous. Ce problème se produit sur toutes les valeurs de chaîne de cette colonne. Même si je copie la valeur réelle dans SSMS à partir de cette table et la colle dans l'instruction select (where string = 'MyStringVlaue'). Les fonctions LT....
23 janv. 2020 à 06:42
Je souhaite utiliser un éditeur en ligne qui prend en charge les polices Unicode et TT, car les polices TT sur https://fontvilla.com ne sont pris en charge que pour certains outils de mise en page et uniocde est pris en charge pour les éditeurs de navigateur. Comment puis-je le convertir en une véri....
22 janv. 2020 à 19:36
J'ai des problèmes pour afficher le symbole ₽ sur iOS 13.x.x. Cela semble fonctionner sur iOS12, mais lorsque j'utilise un appareil sur lequel 13 sont installés, le caractère unicode apparaît sous la forme d'un carré vide. https://www.fileformat.info/info/unicode/char/20bd/browsertest.htm Tout fonc....
20 janv. 2020 à 16:43
Comment obtenir la longueur correcte de std :: u8string? (en C ++ 20) J'ai essayé le code suivant qui imprime une valeur incorrecte de longueur qui peut retourner la valeur du nombre de points de code. Comment puis-je obtenir la valeur correcte à laquelle j'attendais 7 ce nombre de caractères? int m....
11 janv. 2020 à 07:46
Il est étonnamment difficile de centrer visuellement horizontalement un emoji dans Google Chrome, car il semble y avoir des espaces à droite de l'emoji où il ne devrait pas y en avoir. Un exemple: .avatar { width: 30px; padding: 10px; background-color: #eee; border-radius: 50%; ....
2 janv. 2020 à 07:19
Je suis nouveau sur python et j'ai du mal à encoder J'ai une liste de chaînes comme celle-ci: keys = ["u'part-00000-6edc0ee4-de74-4f82-9f8c-b4c965896224-c000.csv'", " u'part-00001-6edc0ee4-de74-4f82-9f8c-b4c965896224-c000.csv'"] Je fais ça pour encoder keys = [x.encode('UTF-8') for x in ke....
18 déc. 2019 à 03:17
J'ai une chaîne comme celle-ci: "\"title\":\"👺TEST title value 😁\",\"text\":\"💖 TEST text value.\"" ... et je veux remplacer chaque symbole emoji par leur valeur unicode comme ceci: "\"title\":\"U+1F47ATEST title value U+1F601\",\"text\":\"U+1F496 TEST text value.\"" ... Après avoir beaucoup cherc....
17 déc. 2019 à 17:51
J'ai une chaîne de littéraux UTF-8 '\ xe0 \ xa4 \ xb9 \ xe0 \ xa5 \ x80 \ xe0 \ xa4 \ xac \ xe0 \ xa5 \ x8b \ xe0 \ xa4 \ xb2' qui convertit en ही बोल en hindi. Je n'arrive pas à convertir string a en octets a = '\xe0\xa4\xb9\xe0\xa5\x80 \xe0\xa4\xac\xe0\xa5\x8b\xe0\xa4\xb2' #convert a to bytes #als....
14 déc. 2019 à 16:11
J'ai des données de type octets comme ceci: b"6D4B8BD5" Les données proviennent d'un caractère chinois utilisant un code d'échappement unicode. il peut être généré comme ceci: '测试'.encode('unicode-escape') Résultat: b'\\u6d4b\\u8bd5' Comment puis-je convertir b "6D4B8BD5" en b '\ u6d4b \ u8bd5' o....
13 déc. 2019 à 16:55
Impossible d'imprimer la valeur de la chaîne thaïlandaise dans la console Java public static void main(String [] args){ String engParam = "Beautiful"; String thaiParam = "สวย"; System.out.println("Output :" + engParam + ":::" + thaiParam);} La sortie montre comme: Output :Beautiful:::à?ªà?....
13 déc. 2019 à 15:08
J'ai des textes qui contiennent plusieurs langues. Je veux un nombre de mots qui enregistre uniquement les mots qui se produisent avec le jeu de caractères unicode grec en utilisant Python 3. Quelque chose comme: wordCount = 0 theText = open(file.txt, 'r') for word in theText.split(): if GreekUn....
Je dois supprimer certains signes diacritiques du texte hébreu. Si j'avais besoin de retirer le texte de TOUS les signes diacritiques, ce ne serait pas un tel problème. En unicode, la plage que je voudrais supprimer se situe entre \ u0591 et \ u05AF (ou 1425 - 1455 en décimal). tous les autres carac....
J'écris un script python pour récupérer l'image de l'url: url = `https://uploads0.wikiart.org/images/albrecht-durer/watermill-at-the-montaсa.jpg` urllib.request.urlretrieve(url, STYLE_IMAGE_UPLOAD + "wikiart" + "/" + url) Quand je cours j'ai le message UnicodeEncodeError: 'ascii' codec can't encode....
7 déc. 2019 à 18:37
Lecteurs respectés, J'ai récemment découvert que je peux utiliser des symboles Unicode à l'intérieur de python 3. En tant que chercheur, cela m'excite beaucoup car cela pourrait rendre mes équations plus lisibles. Pour un exemple, ceci est un morceau de mon code réécrit avec des caractères Unicode: ....
4 déc. 2019 à 15:29
J'essaie d'afficher le score d'un jeu de plateforme en haut de l'écran mais à chaque fois que je l'exécute, j'obtiens cette erreur: "Le texte doit être un Unicode ou des octets" J'ai déjà consulté le site et le code tout semble exactement comme ce que j'ai écrit mais je reçois toujours la même erreu....
4 déc. 2019 à 14:51