Pandas est une bibliothèque Python pour la manipulation et l'analyse de données, par ex. cadres de données, séries chronologiques multidimensionnelles et ensembles de données transversales que l'on trouve couramment dans les statistiques, les résultats des sciences expérimentales, l'économétrie ou la finance. Pandas est l'une des principales bibliothèques de science des données en Python.

Plus à propos pandas...

Je souhaite diviser les données suivantes en deux colonnes, latitude et longitude et mettez-les dans un fichier de données. 0 (45.349586099999996, -75.81031967988278) 1 (-37.77922725, 175.2010323246593) 2 (-42.9945669, 170.7100413) 3 (-39.2711067, ....
J'aimerais savoir comment conserver les lignes dans un fichier de données Pandas dans lequel plus de 3 de ses colonnes ont des valeurs supérieures à 0.8 voici un exemple: companyInfo = pd.DataFrame() companyInfo['col1'] = [0,0,0,0,0] companyInfo['col2'] = [0,0.9,0,0,0] companyInfo['col3'] = [0,0,0.8....
3 juin 2021 à 01:50
J'aimerais utiliser la méthode .Query .Query pour filtrer une colonne dans un fichier de données par une variable mais elle ne fonctionnera pas avec une variable, seule une chaîne. Quelqu'un sait comment le faire fonctionner avec une variable? Merci. import pandas as pd var="A" source = {'COL1'....
3 juin 2021 à 01:40
J'utilise le code suivant import pandas as pd pd.to_datetime(sf['date'][1:4], format('%m-%d-%Y')) Le dataframe est comme suit: sf['date'][1:4] 1 6-1-2021 2 6-11-2021 3 6-12-2021 4 8-1-2021 Name: date, dtype: object J'obtiens l'erreur suivante: File "C:\Program Files\Python38\lib\site-p....
3 juin 2021 à 01:16
J'ai remarqué cela aujourd'hui et je voulais demander parce que je suis un peu confus à ce sujet. Disons que nous avons deux df df = pd.DataFrame(np.random.randint(0,9,size=(5,3)),columns = list('ABC')) A B C 0 3 1 6 1 2 4 0 2 8 8 0 3 8 6 7 4 4 5 0 df2 = pd.Dat....
3 juin 2021 à 01:13
Comment puis-je produire toutes les lignes dans un fichier de données avec des valeurs proches des chiffres que je sais? import pandas as pd data = {'A':[1, 2, 3, 4, 5, 6, 7, 8, 9, 10], 'B':[11, 12, 13, 14, 15, 16, 17, 18, 19, 20]} df = pd.DataFrame(data, columns=['A', 'B']) Donc une fonc....
3 juin 2021 à 00:50
J'ai donc un ensemble de données originaux: original_data_set Que j'ai lu dans un fichier CSV, puis séparément selon le champ: Comme si, loan_df = re_df.loc[re_df.field == 'loan_amount'] home_df = re_df.loc[re_df.field == 'home_value'] Quels rendements Loans Accueil_Vals Je souhaite diviser dans l....
3 juin 2021 à 00:49
J'ai un cadre de données DF: year ID category 1 1 0 2 1 1 3 1 1 4 1 0 1 2 0 2 2 0 3 2 1 4 2 0 Je souhaite créer une nouvelle colonne telle que: pour une «année» particulière si ....
3 juin 2021 à 00:14
J'ai une colonne de cadre de données qui ressemble à ceci: df['out_column'] 0 Out 0: 0.024 Out 1: 0.005 1 Out 0: 0.024 Out 1: 0.009 2 Out 0: 0.024 Out 1: 0.009 3 Out 0: 0.024 Out 1: 0.01 4 Out 0: 0.024 Out 1: 0.011 5 Out 0: 0.017 Out 1:....
2 juin 2021 à 23:08
J'ai deux tableaux. Ci-dessous est un aperçu de chaque: [0.25 0.5 0.75 ... 0. 0. 0.25] [0.51725357 0.51725357 0.51725357 ... 0.56406901 0.51725357 0.51725357] Vous remarquerez peut-être que la deuxième matrice a des valeurs qui se répètent souvent. Ce que je voudrais faire est de créer deux no....
2 juin 2021 à 22:40
J'ai le dataframe suivant Charge_type Amount Quantity Credit 2.5 3 Credit 3.24 2 Debit 5.98 6 J'ai besoin de la sortie suivante si CHARGE_TYPE est un «crédit», puis multipliez «Montant» * -1 et «Quantité» * -1 pour obtenir le résultat suivant: Charge_type Amount Quanti....
2 juin 2021 à 22:19
J'ai un dataframe Pandas contenant plusieurs colonnes, y compris "Texte", "Start", "Tend", et je souhaite créer une nouvelle colonne qui extrait une sous-chaîne de "Texte" basé sur le "START" et "Tend". text start tend subtext 'Sample text' 2 8 ....
2 juin 2021 à 22:17
Lorsque je construis un modèle d'apprentissage profond pour la génération de commentaires de code source automatique. J'ai eu l'erreur ci-dessus. J'ai utilisé le modèle de transformateur pour la création du modèle.Can quelqu'un me donne une solution....
J'ai un fichier Excel et j'ai créé des listes de ses colonnes. Le problème est que les rangées des colonnes ne sont pas égales. Par conséquent, j'ai plusieurs valeurs «Nan» aux extrémités des listes. J'ai essayé de les supprimer de la méthode Drowna (), mais il y a toujours les valeurs «Nan». Voici ....
2 juin 2021 à 22:09
Je crée un jeu de données de chats WhatsApp exportés. Pour manipuler les données, j'ai besoin de diviser chaque ligne de la connexion de la discussion dans date, time, sender, sender et message (colonnes). import pandas as pd import re column_names = ["date", "time", "sender", "message"] data = pd.....
2 juin 2021 à 21:34
J'ai une table avec quatre colonnes: CustomerID, la récence, la fréquence et les revenus. Je dois normaliser (échelle) la concentration de colonnes, la fréquence et les revenus et enregistrer la colonne CustomerID. J'ai utilisé ce code: from sklearn.preprocessing import normalize, StandardScaler d....
2 juin 2021 à 02:17
J'ai un Dataframe qui ressemble à ceci et je voudrais calculer le pourcentage de la colonne de colonne comparant à la colonne. Dans cet exemple dans colonnes, j'ai 3 valeurs identiques aux valeurs de la colonne columnA columnB 0 A None 1 H H <--- 2 A A ....
2 juin 2021 à 01:41
J'ai un simple dataframe dans les pandas 0 2020-12-03 12:00:00 122.219985 122.798140 121.821258 122.703443 9204466 1 2020-12-03 13:00:00 122.708427 122.838013 122.349572 122.494111 6596303 2 2020-12-03 14:00:00 122.489226 122.638649 122.205033 122.269826 5510204 3 2020-12-0....
1 juin 2021 à 20:28
Je veux la sortie suivante de My Pandas Dataframe DF: {1622564509268542720: '36.15', 1622564509311439360: '37.83', 1622564509312406784: '38.20', 1622564509357944832: '40.40', 1622564509358921984: '33.46', 1622564509404489472: '38.37', 1622564509405471232: '37.15'} Lorsque je tape df.head(3).to_dict....
1 juin 2021 à 20:06
J'ai un pandas dataframe df dont le nom de la colonne et les DTYPES sont spécifiés dans un autre fichier (lire comme data_dict). Donc, pour obtenir les données correctement, j'utilise le code ci-dessous: col_list = data_dict['name'].tolist() dtype_list = data_dict['type'].tolist() dtype_dict = {col_....
1 juin 2021 à 18:17
Quel est le moyen le plus efficace de filtrer un fichier Dataframe Pandas basé sur une différence entre deux colonnes de date? Par exemple, basé sur le Dataframe suivant: CADASTRO RESPOSTA EVAL 0 2021-06-01 2021-06-13 y 1 2021-06-01 2021-06-13 y 2 2021-06-01 2021-06-18 y 3....
1 juin 2021 à 17:42
Je suis le plus intéressé par la façon dont cela se fait d'une bonne et d'excellente qualité de pandas. Dans cet exemple de données Tim de Osaka a deux fruit's. import pandas as pd data = {'name': ['Susan', 'Tim', 'Tim', 'Anna'], 'fruit': ['Apple', 'Apple', 'Banana', 'Banana'], 'tow....
1 juin 2021 à 17:31
Job_title a trop de valeurs différentes pour que cela soit utile, donc j'essaie de créer une catégorie «autre» pour toutes les valeurs de Job_title survenues moins de 5 fois. J'ai réussi à afficher ceux qui se produisent moins de 5 fois par le code ci-dessous: df[df.groupby('job_title')['job_title']....
1 juin 2021 à 17:29
J'ai le df suivant: time_series date sales store_0090_item_85261507 1/2020 1,0 store_0090_item_85261501 2/2020 0,0 store_0090_item_85261500 3/2020 6,0 Être 'date' = semaine / année. Donc, j'ai essayé d'utiliser le code suivant: df['date'] = df['date'].apply(lamb....
1 juin 2021 à 17:28
J'ai les données suivantes !pip install yfinance import yfinance as yf import numpy as np import pandas as pd from pandas_datareader import data df=yf.download('BTC-USD',start='2017-01-01',end='2021-05-31',interval='1d') #I calculated simple moving average as follow df['SlowSMA']=df['Close'].ew....
1 juin 2021 à 16:17