J'ai calculé le cdf pour un ensemble de données dans pandas df et je souhaite déterminer le centile respectif à partir du graphique cdf. code pour cdf :
def cdf(x):
df_1=pmf(x)
df1 = pd.DataFrame()
df1['pmf'] = df_1['pmf'].sort_index()
df1['x'] = df_1['x']
df1['cdf'] = np.cumsum(df1['pmf'])
return df1
Voici le cdf df généré :
Maintenant, je veux écrire une logique simple pour récupérer les données "x" correspondant à un cdf pour déterminer le centile. Appréciez toute aide à cet égard.
1 réponse
Vous pouvez le faire comme ci-dessous (utilisez le nom df à la place de df ci-dessous):
df.loc[df['cdf'] == 0.999083, 'x']
Production:
12.375
Questions connexes
Questions liées
De nouvelles questions
python-3.x
Pour les questions sur la programmation Python qui sont spécifiques à la version 3+ du langage. Utilisez la balise [python] plus générique sur toutes les questions Python et ajoutez celle-ci uniquement si votre question est spécifique à la version. Utilisez les balises [python-2.x] pour les questions Python 2.