Je veux remplir NaN et Empty Value avec une autre valeur de colonne, dans ce cas la colonne barcode_y remplie par la colonne barcode_x

Voici mes données

    id      barcode_x     barcode_y A   B
0   7068    38927887      38927895  0   12
1   7068    38927895      38927895  0   1
2   7068    39111141      38927895  0   4
3   7116    73094237                18  309
4   7154    37645215      37645215  0   9
5   7342    86972909           NaN  7   25

Voici ce dont j'ai besoin

    id      barcode_x     barcode_y A   B
0   7068    38927887      38927895  0   12
1   7068    38927895      38927895  0   1
2   7068    39111141      38927895  0   4
3   7116    73094237      73094237  18  309
4   7154    37645215      37645215  0   9
5   7342    86972909      86972909  7   25

Comment suppose que je fais ça?

2
Nabih Bawazir 23 mai 2018 à 20:06

5 réponses

Meilleure réponse

Utilisation de mask

x, y = df['barcode_x'], df['barcode_y']
y.mask(y.eq('') | y.isna(), x)

0    38927895
1    38927895
2    38927895
3    73094237
4    37645215
5    86972909
Name: barcode_y, dtype: object
4
piRSquared 23 mai 2018 à 17:28

Je recommande le masquage pour accomplir ce que vous voulez:

df['barcode_y'][df['barcode_y'].isna()] = df['barcode_x'][df['barcode_y'].isna()]

Cela fonctionnera universellement, sans dépendre du tri des colonnes, par exemple si barcode_y est avant ou après barcode_x.

0
Scotty1- 23 mai 2018 à 17:17

Vous pouvez convertir des valeurs vides avec NaN, puis utiliser .fillna().

df['barcode_y'].replace(r'\s+', np.nan, regex=True).replace('',np.nan).fillna(df['barcode_x']).astype(int)

Production:

0    38927895
1    38927895
2    38927895
3    73094237
4    37645215
5    86972909
Name: barcode_y, dtype: int32
1
harvpan 23 mai 2018 à 17:30

J'utiliserais combine_first dans ce cas ... surtout si barcode_y n'est pas dtype object

df.barcode_y.combine_first(df.barcode_x)

Si barcode_y est dtype object, je pense que vous pouvez suivre cette étape supplémentaire comme ci-dessous:

>>> df
   barcode_x barcode_y
0          1         0
1        123      None
2        543
>>> df.barcode_y = df.barcode_y.combine_first(df.barcode_x)
>>> df
   barcode_x barcode_y
0          1         0
1        123       123
2        543
>>> df.loc[df.barcode_y.str.strip()=='', 'barcode_y'] = df.loc[df.barcode_y.str.strip()=='', 'barcode_x']
>>> df
   barcode_x  barcode_y
0          1          0
1        123        123
2        543        543
0
Orenshi 23 mai 2018 à 17:21

Essayez ça,

def fillValues(x):    
   x = x['barcode_x'] if np.isnan(x['barcode_y']) else x['barcode_y']
   return x

df["barcode_y"] = df.apply(lambda x : fillValues(x),axis=1)
print(df)
-1
Narendra Prasath 23 mai 2018 à 17:25