Je doute de l'implémentation d'une fonctionnalité dans mon application python. J'utilise le SDK python de Twilio pour la gestion et la réponse aux appels. Lorsqu'un appel Twilio est passé, je souhaite une fonctionnalité dans laquelle le discours de l'appelant est directement diffusé vers l'API Google Voice pour la transciption de texte pendant l'appel lui-même . Et puis je dois traiter le texte transcrit pour fournir instantanément des réponses appropriées à l'utilisateur.

Je connais la fonctionnalité Enregistrer de twilio qui nous aide à enregistrer la voix de l'appelant et à les enregistrer en tant qu'enregistrements. Une façon serait d'accéder au fichier d'enregistrement une fois qu'il est disponible, puis de transmettre le fichier enregistré à l'API Google. Mais je pense que cette méthode serait plus lente car j'ai besoin que la voix de l'appelant soit diffusée instantanément vers l'API vocale Google.

0
Karthick Mohanraj 12 avril 2018 à 10:26

3 réponses

Meilleure réponse

Évangéliste développeur Twilio ici.

Vous pouvez réellement le faire dans Twilio ces jours-ci. Utilisation du <Gather> verbe TwiML avec le input attribut défini sur" speech " Twilio lira votre audio via l'API Google Voice pour la transcrire en direct.

Vous pouvez obtenir les résultats de la transcription en définissant le action attribuez à une URL dans votre application. Lorsque Twilio et Google ont détecté et transcrit le discours, Twilio crée un webhook vers l'URL avec le texte transcrit envoyé en tant que paramètre SpeechResult dans le corps de la demande.

Cependant, vous ne pouvez pas obtenir l'audio brut de l'appel, c'est donc le meilleur moyen de réaliser ce que vous essayez de construire.

1
philnash 16 avril 2018 à 02:30
<?xml version="1.0" encoding="UTF-8"?>
<Response>
    <Record timeout="10" transcribe="true" />
</Response>

Code Python: Version du SDK: 6.x `de twilio.twiml.voice_response import Record, VoiceResponse

response = VoiceResponse () response.record (timeout = 10, transcribe = True)

print (réponse)

Il est déjà intégré à Twilio. Pourquoi utiliser Google Voice API pour transcrire, vous pouvez simplement rediriger en utilisant n'importe quoi pour envoyer cela sous forme d'e-mail à partir d'un compte de service spécifique et créer une étiquette ou un filtre pour ces e-mails pour les cataloguer ou les séparer dans leur propre dossier.

Il se peut que je manque complètement ce que vous faites, mais vous pouvez utiliser la fonction d'enregistrement dans une réponse juste après la numérotation et définir la transcription sur true. https://www.twilio.com/docs/voice/twiml/record

0
855 700 HACK 14 avril 2018 à 06:02

Solution 1:

De nouvelles mises à jour sur TwiML vous aideront pour cette solution. Les nouveaux flux de commandes Flux TwiML appellent l'audio vers un serveur Websocket.

Cela simplifie le transfert de l'audio de votre système téléphonique professionnel vers une plateforme d'intelligence artificielle qui peut transcrire ces données en temps réel avec la synthèse vocale de Google Cloud à l'aide des flux multimédias de Twilio.

Parcourez la documentation sur le lien ci-dessous

Intégration Twilio de Google Speech to text

Solution 2:

Même la meilleure solution que j'ai trouvée est que Twilio fournit des fonctionnalités complémentaires qui offrent un meilleur support pour l'analyse des données entrantes.

Vous pouvez utiliser le module complémentaire de synthèse vocale IBM-Watson pour mieux comprendre la voix de votre Twilio téléphone.

Veuillez consulter la documentation officielle ci-dessous par twilio:

IBM Watson Speech to text Intégration Twilio

0
Abhijit Manepatil 26 déc. 2019 à 09:17