Lors de l'exécution d'un script Python à l'aide de NLTK, j'ai obtenu ceci:

Traceback (most recent call last):
  File "cpicklesave.py", line 56, in <module>
    pos = nltk.pos_tag(words)
  File "/usr/lib/python2.7/site-packages/nltk/tag/__init__.py", line 110, in pos_tag
    tagger = PerceptronTagger()
  File "/usr/lib/python2.7/site-packages/nltk/tag/perceptron.py", line 140, in __init__
    AP_MODEL_LOC = str(find('taggers/averaged_perceptron_tagger/'+PICKLE))
  File "/usr/lib/python2.7/site-packages/nltk/data.py", line 641, in find
    raise LookupError(resource_not_found)
LookupError:
**********************************************************************
  Resource u'taggers/averaged_perceptron_tagger/averaged_perceptro
  n_tagger.pickle' not found.  Please use the NLTK Downloader to
  obtain the resource:  >>> nltk.download()
  Searched in:
    - '/root/nltk_data'
    - '/usr/share/nltk_data'
    - '/usr/local/share/nltk_data'
    - '/usr/lib/nltk_data'
    - '/usr/local/lib/nltk_data'
**********************************************************************

Quelqu'un peut-il expliquer le problème?

28
Shiv Shankar 8 mars 2016 à 10:29

7 réponses

Meilleure réponse

Utilisation

>>> nltk.download()

Pour installer le module manquant (le Perceptron Tagger ).

(consultez également les réponses à Échec du chargement de english.pickle avec nltk.data. charge)

37
Community 23 mai 2017 à 12:34

Parfois même en écrivant nltk.download('module_name'), il n'est pas téléchargé. À ces moments, vous pouvez ouvrir python en mode interactif, puis télécharger en utilisant nltk.download('module_name').

0
Lucky Sunda 13 sept. 2019 à 03:05

TL; DR

import nltk
nltk.download('averaged_perceptron_tagger')

Ou pour télécharger tous les packages + données + documents:

import nltk
nltk.download('all')

Voir Comment télécharger des données NLTK?

19
Community 23 mai 2017 à 12:26

Problème: erreur de recherche lors de l'extraction du vecteur de comptage de scikit learn. Ci-dessous, un extrait de code.

from sklearn.feature_extraction.text import CountVectorizer
bow_transformer = CountVectorizer(analyzer=text_process).fit(X)

Solution: essayez d'exécuter le code ci-dessous, puis essayez d'installer les mots vides de la boîte à outils de traitement du langage naturel des corpus !!

import nltk
nltk.download()
1
Rayudu Yarlagadda 20 févr. 2018 à 13:03

Vous pouvez télécharger le module manquant NLTK juste en

import nltk
nltk.download()

Cela montrera l'écran de téléchargement NLTK. S'il affiche une erreur d'échec de vérification du certificat SSL. Ensuite, cela devrait fonctionner en désactivant la vérification SSL avec le code ci-dessous!

import nltk
import ssl

try:
    _create_unverified_https_context = ssl._create_unverified_context
except AttributeError:
    pass
else:
    ssl._create_default_https_context = _create_unverified_https_context

nltk.download()
1
ishwardgret 25 avril 2019 à 06:04

Installez toutes les ressources nltk sur une seule ligne:

python3 -c "import nltk; nltk.download('all')"

Les données seront enregistrées dans ~ / nltk_data

4
Lucas Azevedo 28 mars 2019 à 16:36

La première réponse a indiqué que le module manquant est «le Perceptron Tagger», en fait son nom dans nltk.download est «averaged_perceptron_tagger»

Vous pouvez l'utiliser pour corriger l'erreur

nltk.download('averaged_perceptron_tagger')

30
Posuer 11 mai 2017 à 23:40