D'après la documentation, il est indiqué de créer un modèle de transformateur comme celui-ci:

transformer_model = nn.Transformer(nhead=16, num_encoder_layers=12)
src = torch.rand((10, 32, 512))
tgt = torch.rand((20, 32, 512)) # What is tgt??
out = transformer_model(src, tgt) 

Que veut dire tgt? Le tgt devrait-il être le même que le src?

0
Dylan Kerler 13 mars 2021 à 02:17

1 réponse

Meilleure réponse

La structure du transformateur est composée de deux composants, le codeur et le décodeur. Le src est l'entrée du codeur et le tgt est l'entrée du décodeur.

Par exemple, pour une tâche de traduction automatique qui traduit une phrase anglaise en français, le src est les identifiants de séquence anglais et tgt est les identifiants de séquence français.

1
emily 13 mars 2021 à 03:30