Le traitement du langage naturel (PNL) est un sous-domaine de l'intelligence artificielle qui implique la transformation ou l'extraction d'informations utiles à partir de données en langage naturel. Les méthodes comprennent l'apprentissage automatique et les approches basées sur des règles.

nlp...

Je souhaite trouver la fréquence (en pourcentage) d'un ensemble de mots, comme dans n_grams apparaît dans une phrase. example_txt= ["order intake is strong for Q4"] def find_ngrams(text): text = re.findall('[A-z]+', text) content = [w for w in text if w.lower() in n_grams] # you can calcula....
8 avril 2020 à 13:04
J'ai deux fichiers, file1.py qui ont une taille de modèle ML de 1 Go et file2.py qui appelle la méthode get_vec() de file1 et reçoit des vecteurs en retour. ML model est chargé à chaque fois que la méthode file1 get_vec () est appelée. C'est là qu'il faut beaucoup de temps (environ 10 secondes) pour....
5 avril 2020 à 23:49
J'ai une tâche. Je dois écrire un programme composé de plusieurs fonctions pour analyser le texte (compter les mots, les signes, les lignes, pas les signes blancs etc.) C'est mon programme: #include <stdio.h> #include <stdlib.h> int allSigns(char text[]) { int i; for (i = 0; text[i] != '\0....
3 avril 2020 à 12:14
J'ai deux listes: 1.Liste des symboles IPA - M 2.Liste des mots simples - N Maintenant, je dois créer une troisième liste X = [N, M] où pour chaque symbole IPA trouvé dans un seul mot, je dois attribuer 1 à la nouvelle liste et 0. Par exemple, si M = ['ɓ', 'u' , 'l', 'i', 'r', 't', 'ə', 'w', 'a', 'b....
30 mars 2020 à 10:18
J'essaye d'extraire: Abbey Grove Abbey Grove Vue sur Abbey Road Abbey Road Terrasse de l'abbaye Abbey Wood Road Abbey Grove De 23a, Abbey Grove 43a Abbey Grove Block 509a Abbey Road View 511 Abbey Road Flat 8a, Abbey Terrace 14 Abbey Wood Road 100 Abbey Grove Dans Google Bigquery. Le problèm....
6 janv. 2020 à 13:16
Je suis nouveau à la PNL et j'essaie les étapes de prétraitement de base tout en apprenant. J'essaie de séparer les ponctuations au début et à la fin des mots pour les intégrations. En faisant cela, je ne veux pas endommager des mots comme can't, I'm, etc. parce que je les traite séparément. s = 'Th....
5 janv. 2020 à 17:55
Je sais que les mots vides NLTk ont beaucoup de langues mais que se passe-t-il si je veux créer mon propre ensemble de mots vides et que je veux les utiliser dans les mots vides NLTK? import nltk from nltk.corpus import stopwords stops=set(stopwords.words('My own set')) words=["Don't", 'hesitate','t....
23 déc. 2019 à 11:06
J'utilise la PNL pour classer mes données, j'ai formé mes données et maintenant je veux connaître le score d'une seule valeur d'entrée. Mes données contiennent des vêtements et des articles de mode, et elles devraient renvoyer une catégorie à laquelle elles appartiennent. Je veux vérifier le score d....
20 déc. 2019 à 12:54
J'ai un jeu de données hkscs que j'essaie de lire en python 3. Ci-dessous le code encoding = 'big5hkscs' lines = [] num_errors = 0 for line in open('file.txt'): try: lines.append(line.decode(encoding)) except UnicodeDecodeError as e: num_errors += 1 Cela me renvoie une erreu....
20 déc. 2019 à 03:47
J'ai une séquence de données que je souhaite construire à partir de celui-ci. Un extrait d'un aspect de séquence est le suivant. 8c b0 00 f0 05 fc 04 46 00 f0 fe fb 40 f2 00 05 c2 f2 00 05 28 78 00 J'utilise actuellement la fonction ngrams() de ntlk pour construire 4 grammes à partir de ces données ....
18 déc. 2019 à 07:22
Je travaille avec une sorte de situation unique. J'ai des mots dans Language1 que j'ai définis en anglais. J'ai ensuite pris chaque mot anglais, pris son vecteur de mots à partir d'un modèle w2v GoogleNews pré-formé, et fait la moyenne des vecteurs pour chaque définition. Le résultat, un exemple ave....
16 déc. 2019 à 21:43
J'ai essayé d'utiliser le script NLP de python avec mon application C ++ basée sur l'interface graphique QT. Fondamentalement, dans l'application, j'essaie d'accéder au script NLP via la ligne de commande: QString path = "D:/DS Project/Treegramming"; QString command("py"); QStringList params = QStr....
16 déc. 2019 à 19:23
J'ai le code ci-dessous qui essaie de trouver des mots similaires entre les deux listes. À cette fin, j'utilise la fonction .similarity de spacy. import en_vectors_web_lg nlp = en_vectors_web_lg.load() listx =['HSBC', 'JP Morgan',......] #500 words lists listy = ['Currency','Blockchain'.......] #100....
15 déc. 2019 à 15:42
En python, je construis des ngrammes avec gensim et je passe les mots en espace pour la lemmatisation. Je trouve que l'espionnage ne fonctionne pas très bien car il conserve de nombreux mots comme des pluriels qui ne devraient pas l'être. Il semble que cela se produit principalement lorsqu'il s'agit....
14 déc. 2019 à 03:17
Je fais ce qui suit: import spicy nlp = spacy.load("en") doc = nlp('Hello Stack Over Flow, my name is Steve') doc.vector: In [1]: doc = nlp('Hello Stack Over Flow, my name is Steve') In [2]: doc.vector Out[2]: array([ 1.67874452e-02, 1.43885329e-01, -1.64147541e-01, -3.52525562e-02, 1....
14 déc. 2019 à 02:09
J'utilise Spacy ainsi qu'un peu de code personnalisé pour faire du traitement en langage naturel pour le travail. Nous voulons faire quelque chose où nous pouvons trouver un endroit où un document a été écrit en utilisant les emplacements situés dans le document et nous sommes curieux de savoir s'il....
13 déc. 2019 à 20:42
J'ai essayé de supprimer des mots d'un document qui sont considérés comme des entités nommées par spacy, donc en gros, en supprimant «Suède» et «Nokia» de l'exemple de chaîne. Je n'ai pas pu trouver un moyen de contourner le problème que les entités sont stockées en tant que durée. Ainsi, lorsque vo....
13 déc. 2019 à 01:14
J'ai un tas de requêtes d'utilisateurs. Il contient certaines requêtes qui contiennent également des caractères indésirables, par exemple. I work in Google asdasb asnlkasn Je n'ai besoin que de I work in Google import nltk import spacy import truecase words = set(nltk.corpus.words.words()) nlp = spa....
12 déc. 2019 à 12:30
Je veux créer plusieurs phrases à partir d'une phrase donnée en mélangeant des mots en python. par exemple. dis que j'ai une phrase "réinitialisation du mot de passe réussie" Maintenant, j'ai besoin de générer différentes combinaisons de phrases à partir de celle ci-dessus. production: reset passwor....
12 déc. 2019 à 08:31
Mon objectif ici est le résumé du texte, je ne sais pas si je le fais correctement, mais voici le plan. J'ai une trame de données appelée train_data. Chaque cellule de chaque ligne contient des messages. Maintenant, je cherche à parcourir chaque cellule ou chaque message dans la colonne dataframe po....
12 déc. 2019 à 06:34
J'essaie d'exécuter du code simple pour lemmatiser la chaîne, mais il y a une erreur concernant l'itération. J'ai trouvé quelques solutions concernant la réinstallation de web.py, mais cela n'a pas fonctionné pour moi. code python from gensim.utils import lemmatize lemmatize("gone") l'erreur est --....
11 déc. 2019 à 11:17
Désolé si c'est une question simple, je suis nouveau en python. J'ai une chaîne (tableau de mots) et 2 dimensions de mots que je vais les remplacer un par un comme quelque chose comme suit: str="Jim is a good person" # and will convert to: parts=['Jim','is','a','good','person'] et un tableau à 2 di....
11 déc. 2019 à 01:40
Je suis récemment entré dans la PNL, Python et publie sur Stackoverflow en même temps, alors soyez patient avec moi si je peux sembler ignorant :). J'utilise SnowballStemmer dans le NLTK de Python afin d'endiguer les mots pour l'analyse textuelle. Alors que la lemmatisation semble sous-estimer mes j....
10 déc. 2019 à 14:56
Prenez la phrase suivante: I'm going to change the light bulb La signification de change signifie replace, comme dans quelqu'un va remplacer l'ampoule. Cela pourrait facilement être résolu en utilisant une API de dictionnaire ou quelque chose de similaire. Cependant, les phrases suivantes I need to....
J'ai trouvé l'image jointe à https://www.kdnuggets.com/2018/08/topic-modeling-lsa-plsa-lda-lda2vec.html . Il montre la visualisation des résultats de la modélisation des sujets. Quel outil est utilisé pour créer une telle visualisation? Des conseils sur la façon de le créer? visualisation de modéli....
10 déc. 2019 à 06:59