J'ai deux vecteurs de forme (batch, dim), que j'essaie de soustraire l'un de l'autre. Actuellement, j'utilise une boucle simple pour soustraire une entrée spécifique dans un vecteur (c'est-à-dire error) basée sur le deuxième vecteur (c'est-à-dire label), de 1:

per_ts_loss=0
for i, idx in enumerate(np.argmax(label, axis=1)):
    error[i, idx] -=1
    per_ts_loss += error[i, idx]

Comment puis-je vectoriser cela?

Pour un exemple, erreur et étiquette peuvent ressembler à ceci:

error :
array([[ 0.5488135   0.71518937  0.60276338  0.54488318  0.4236548 ]
       [ 0.64589411  0.43758721  0.891773    0.96366276  0.38344152]])
label:
    array([[0, 0, 0, 1, 0 ],
           [0, 1, 0, 0, 0]])

Pour cet exemple, l'exécution du code ci-dessous entraîne les résultats suivants:

for i, idx in enumerate(np.argmax(label,axis=1)):
    error[i,idx] -=1
    ls_loss += error[i,idx]

Résultat :

error: 
 [[ 0.5488135   0.71518937  0.60276338  0.54488318  0.4236548 ]
 [ 0.64589411  0.43758721  0.891773    0.96366276  0.38344152]]
label: 
 [[ 0.  0.  0.  1.  0.]
 [ 0.  1.  0.  0.  0.]]

error(indexes 3 and 1 are changed): 
[[ 0.5488135   0.71518937  0.60276338 -0.45511682  0.4236548 ]
 [ 0.64589411 -0.56241279  0.891773    0.96366276  0.38344152]]
per_ts_loss: 
 -1.01752960574

Voici le code lui-même : https://ideone.com/e1k8ra

Je suis coincé sur la façon d'utiliser le résultat de np.argmax, car le résultat est un nouveau vecteur d'index, et il ne peut tout simplement pas être utilisé comme:

 error[:, np.argmax(label, axis=1)] -=1

Je suis donc coincé ici!

0
Rika 17 mars 2019 à 14:11

2 réponses

Meilleure réponse

Remplacer:

error[:, np.argmax(label, axis=1)] -=1

Avec:

error[np.arange(error.shape[0]), np.argmax(label, axis=1)] -=1

Et bien sûr

loss = error[np.arange(error.shape[0]), np.argmax(label, axis=1)].sum()

Dans votre exemple, vous modifiez et additionnez error[0,3] et error[1,1], ou en bref error[[0,1],[3,1]].

1
hpaulj 17 mars 2019 à 16:40

Peut être ça:

import numpy as np


error = np.array([[0.32783139, 0.29204386, 0.0572163 , 0.96162543, 0.8343454 ],
       [0.67308787, 0.27715222, 0.11738748, 0.091061  , 0.51806117]])

label= np.array([[0, 0, 0, 1, 0 ],
           [0, 1, 0, 0, 0]])



def f(error, label):
    per_ts_loss=0
    t=np.zeros(error.shape)
    argma=np.argmax(label, axis=1)
    t[[i for i in range(error.shape[0])],argma]=-1
    print(t)
    error+=t
    per_ts_loss += error[[i for i in range(error.shape[0])],argma]


f(error, label)

Production:

[[ 0.  0.  0. -1.  0.]
 [ 0. -1.  0.  0.  0.]]
0
Thomas G. 17 mars 2019 à 11:53