Unicode est une norme pour l'encodage, la représentation et la gestion du texte avec l'intention de prendre en charge tous les caractères requis pour le texte écrit intégrant tous les systèmes d'écriture, symboles techniques et ponctuation.

Plus à propos unicode...

Je voudrais convertir ceci: var result = mystring.replace(/[^a-zA-Z0-9]+/g, ' '); À une version Unicode fonctionnelle afin que je puisse indexer UNIQUEMENT des lettres et des chiffres. Je ne veux pas de [-_% & lt; & gt; ...] par exemple. Étant donné que JS ne prend pas en charge cela de manière nat....
1 déc. 2020 à 04:57
Prenez cette chaîne JSON encodée en base64 générée à partir de JavaScript à l'aide de JSON.stringify et btoa: btoa(JSON.stringify({"é": "è"})) "eyLpIjoi6CJ9" J'essaye de le décoder à partir de Python. Je fais: >>> import base64 >>> import json >>> json.loads(base64.b64decode("eyLpIjoi6CJ9")) Je re....
30 nov. 2020 à 13:33
Dis que j'ai une chaîne comme Line 1 Line 2 Je veux tourner cette chaîne de 90 degrés dans le sens des aiguilles d'une montre, de sorte qu'elle devienne LL ii nn ee 12 La rotation ne doit être effectuée qu'une seule fois, de sorte qu'elle «transforme les lignes en colonnes». L'exécuter deux fois ....
25 nov. 2020 à 20:13
J'ai des pandas dataframe contenant des emojis et je veux les classer en fonction de leurs Plans Unicode. emoji | unicode --------------- 😂 | 1F602 😊 | 1F60A Production attendue emoji | unicode | Plane ----------------------- 😂 | 1F602 | 1 😊 | 1F60A | 1 ⛹ | 26F9 | ....
23 nov. 2020 à 20:54
Le problème est donc que lors de l'utilisation de c #, le caractère est de 4 octets, donc "abc" est (65 0 66 0 67 0). En entrant cela dans une chaîne wstring en c ++ en l'envoyant dans une socket, j'obtiens la sortie suivante a. Comment puis-je convertir une telle chaîne en une chaîne C ++?....
23 nov. 2020 à 19:17
J'essaie de récupérer des données d'un site Web en bengali (en langue). Lorsque j'inspecte un élément sur ce site Web, tout est comme il se doit. Code: request = requests.get("https://corona.gov.bd/") soup = BeautifulSoup(request.content, "lxml") print(soup.prettify()) Une partie de la sortie: <str....
21 nov. 2020 à 15:54
J'ai une chaîne comme celle-ci: word = 'python' Sur la base de string.ascii_lowercase, j'aimerais créer un nouveau tableau qui ressemble à ceci: [15, 24, 19, 7, 14, 13] Ma solution à ce problème était de faire ce qui suit: alphabet = {char: i for i, char in enumerate(string.ascii_lowercase)} indic....
28 oct. 2020 à 13:42
J'ai un fichier au format utf-8 qui contient un caractère 'ů', quand je le lis en c ++ en utilisant ifstream et en le coutant, le résultat est '┼»'. Je peux le résoudre en ajoutant 'SetConsoleOutputCP( 65001 );', ensuite j'envoie le caractère en utilisant 'SendInput();' dans une autre fenêtre. Mai....
20 oct. 2020 à 12:43
Les IDE / éditeurs habituels pour MMT (par exemple, plugin IntelliJ + MMT ou jEdit) comportent une fonction de saisie semi-automatique pour certains caractères Unicode utiles. Par exemple, je peux taper jl e et obtenir immédiatement une suggestion jleftrightarrow qui, lors de la saisie semi-auto....
12 oct. 2020 à 11:24
J'ai écrit un programme simple pour imprimer un emoji de sourire unicode. Malheureusement, quelque chose d'autre est imprimé. Quelqu'un sait-il quel est le problème avec ce code? Merci #include <iostream> #include <string> using namespace std; int main(int argc, char *argv[]) { string str = u8"....
5 juin 2020 à 21:04
J'essaie de supprimer tous les caractères autres que des lettres (à l'exception des espaces blancs) d'une chaîne contenant des accents en utilisant Python 3.7. J'ai essayé ce qui suit: import re text = "Андре́й Серге́евич Арша́вин (род. 29 мая 1981[4], Ленинград) — российский футболист, бывший капи....
5 mai 2020 à 00:06
Ici, j'ai un code simple: #include <iostream> #include <cstdint> int main() { const unsigned char utf8_string[] = u8"\xA0"; std::cout << std::hex << "Size: " << sizeof(utf8_string) << std::endl; for (int i=0; i < sizeof(utf8_string); i++) { std::cout ....
29 avril 2020 à 18:44
C'est une suite de cette question. J'ai cette chaîne; s = 'A ligeira raposa marrom ataca o cão preguiçoso Быстрая коричневая лиса прыгает через ленивую собаку +=' Je souhaite conserver les lettres russes et supprimer le reste. Par conséquent, je voudrais obtenir toutes les lettres possibles de l'al....
13 avril 2020 à 12:52
Existe-t-il une liste ou une bibliothèque contenant toutes les ponctuations que nous pourrions rencontrer fréquemment? J'utilise normalement string.punctuation, mais certains caractères de ponctuation n'y sont pas inclus, par exemple: >>> "'" in string.punctuation True >>> "’" in string.punctuation ....
2 avril 2020 à 06:31
Je dois vérifier, en java, si une chaîne est composée uniquement de valeurs Unicode [\ u0030- \ u0039] ou [\ u0660- \ u0669]. Quelle est la manière la plus efficace de procéder?....
9 mars 2020 à 11:45
Ce petit programme python: #!/usr/bin/env python # -*- coding: utf8 -*- import json import sys x = { "name":u"This doesn't work β" } json.dump(x, sys.stdout, ensure_ascii=False, encoding="utf8") print Génère cette sortie lorsqu'elle est exécutée sur un terminal: $ ./tester.py {"name": "This does....
25 févr. 2020 à 22:21
J'essaie d'analyser un JSON dans un script d'une page html. import requests from bs4 import BeautifulSoup import json headers = { "User-Agent": "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36 OPR/64.0.3417.47", "Accept": "text/html,a....
21 févr. 2020 à 21:44
J'ai joué avec JS et je n'arrive pas à comprendre comment JS décide quels éléments ajouter au tableau créé lors de l'utilisation de Array.from(). Par exemple, l'émoji 👍 suivant a un length de 2, car il est composé de deux points de code, mais, Array.from() traite ces deux points de code comme un, do....
4 févr. 2020 à 11:16
J'ai trouvé un site Web qui peut convertir n'importe quel texte en différents styles de police unicode obscurs, par exemple Small Caps pseudoalphabet. Je suis intéressé à faire la même chose dans le code Java. La capture d'écran HxD suivante montre les octets des deux versions de texte: Existe-t-i....
29 janv. 2020 à 17:27
J'ai un problème avec le remplacement des emoji en chaîne par chaîne avec unicode. Par exemple: J'ai de la ficelle: const str = "My string 😀 is with emoji 😀" J'ai besoin de convertir cette chaîne en const str = "My string EMOJI UNICODE is with emoji EMOJI UNICODE" Emoji unicode devrait ressembler à:....
26 janv. 2020 à 15:18
J'ai du mal à extraire des données à l'aide de la requête ci-dessous. Ce problème se produit sur toutes les valeurs de chaîne de cette colonne. Même si je copie la valeur réelle dans SSMS à partir de cette table et la colle dans l'instruction select (where string = 'MyStringVlaue'). Les fonctions LT....
23 janv. 2020 à 06:42
Je souhaite utiliser un éditeur en ligne qui prend en charge les polices Unicode et TT, car les polices TT sur https://fontvilla.com ne sont pris en charge que pour certains outils de mise en page et uniocde est pris en charge pour les éditeurs de navigateur. Comment puis-je le convertir en une véri....
22 janv. 2020 à 19:36
J'ai des problèmes pour afficher le symbole ₽ sur iOS 13.x.x. Cela semble fonctionner sur iOS12, mais lorsque j'utilise un appareil sur lequel 13 sont installés, le caractère unicode apparaît sous la forme d'un carré vide. https://www.fileformat.info/info/unicode/char/20bd/browsertest.htm Tout fonc....
20 janv. 2020 à 16:43
Comment obtenir la longueur correcte de std :: u8string? (en C ++ 20) J'ai essayé le code suivant qui imprime une valeur incorrecte de longueur qui peut retourner la valeur du nombre de points de code. Comment puis-je obtenir la valeur correcte à laquelle j'attendais 7 ce nombre de caractères? int m....
11 janv. 2020 à 07:46
Il est étonnamment difficile de centrer visuellement horizontalement un emoji dans Google Chrome, car il semble y avoir des espaces à droite de l'emoji où il ne devrait pas y en avoir. Un exemple: .avatar { width: 30px; padding: 10px; background-color: #eee; border-radius: 50%; ....
2 janv. 2020 à 07:19