Existe-t-il un outil qui offre une fonctionnalité de reconnaissance de la langue?

Comme si je saisis une phrase en anglais, cela suggérera que la chaîne peut être en anglais.

Je pense que j'ai besoin de l'un des trucs suivants.

  1. Bibliothèque de reconnaissance du langage Python.
  2. Service Web qui fournit une telle fonctionnalité.

Tout le monde peut aider?

0
xiaohan2012 11 oct. 2011 à 17:38

3 réponses

Meilleure réponse

J'ai utilisé le module GuessLanguage assez largement. Il détecte plus de 100 langues et fonctionne très bien pour les LONGS morceaux de texte. L'anglais est très bon. Autres langues, je ne suis pas sûr. Si vous voulez traiter des phrases courtes à la fois ou des tweets, c'est assez mauvais car il a été conçu pour détecter les articles complets.

Mon entreprise (analyse des médias sociaux) est également à la recherche d'un package de remplacement et explore NLTK en option .

2
JiminyCricket 11 oct. 2011 à 14:04

Avez-vous essayé nltk? Voir cette question SO pour plus d'informations.

Il existe également un service Web de xerox qui prétend faire ce que vous voulez.

1
Community 23 mai 2017 à 12:27
7726957