Un bloc de données est une structure de données tabulaire. Habituellement, il contient des données où les lignes sont des observations et les colonnes sont des variables de différents types. Alors que "data frame" ou "dataframe" est le terme utilisé pour ce concept dans plusieurs langues (R, Apache Spark, deedle, Maple, la bibliothèque pandas en Python et la bibliothèque DataFrames en Julia), "table" est le terme utilisé dans MATLAB et SQL.

Plus à propos dataframe...

Supposons que j'ai la séquence suivante: AAAAAAAAAAAAGCCAGGTGCGGTGGCTCATGCCTGTAAGCCCAGCACTTTGGGAGGCCAAGGCAGGCGGATCACTAGAGGTCAG à partir de la position A (qui est en gras dans la séquence) Je veux le diviser .......
17 mars 2021 à 01:19
Comment séparer les dates dans la colonne Date ci-dessous. Les caractères de séparation sont Y, X ou ""? xx = {'Code': ["001", "002", "003"], 'Date': [".......
17 mars 2021 à 01:16
Si ios_score> 0,5 et android_score <0,5, regroupez-les comme "utilisateur iOS" dans la colonne de sortie. si ios_score <0.5 et android_score> 0.5, regroupez-les comme "utilisateur Android" dans .......
17 mars 2021 à 00:03
Désolé si mon anglais est mauvais (en essayant d'expliquer). J'ai deux trames de données différentes. Disons que mon df1 est, a b d 0 1 2 5 1 2 3 9 2 3 4 1 3 1 2 5 4 2 3 9 5 3 4 1 .......
16 mars 2021 à 23:17
J'essaye d'ajouter 10, 5, 890, 50, Terminer pour la Date, Haut, Bas, Volume, Symbole à la fin du fichier input.csv. Il formatera le contenu du fichier csv de manière permanente donc j'utilise data.to_csv (url, .......
16 mars 2021 à 22:39
Considérez les données suivantes nommées mat. Mon objectif est de compter les valeurs uniques de v1 pour chaque id et de les stocker dans la variable n. Et puis, je veux supprimer la trame de données de la liste si n <= .......
16 mars 2021 à 22:13
J'ai du mal à essayer de détecter les chevauchements entre start_datetime et end_datetime dans mon ensemble de données. Actuellement, mon ensemble de données ressemble à ce qui suit, mais j'essaie d'accéder au code brut pour produire .......
J'ai un tableau de 7 colonnes, la première colonne est id, puis 3 colonnes de types de légumes et les 3 dernières colonnes sont des types de fruits. Les valeurs indiquent si une personne a ce légume / fruit. Y a-t-il .......
16 mars 2021 à 21:15
J'ai une base de données qui va de 2016 à 2019, montre les chiffres de production d'une marchandise au quotidien. J'ai défini l'heure comme index et l'ai convertie au format date_time. Temps #.......
16 mars 2021 à 21:07
import pandas as pd import re regexdf_data = { 'STag': ['Title_1', 'Abs_1', 'Abs_3', 'Abs_4'], 'E1': ['pacnes', 'acne|dfe|sac', 'pI', 'kera'], 'E1_CUI': ['C3477', 'C2166', 'C9871', 'C2567'] } df3 = pd.DataFrame(regexdf_data) df3 E1 E1_CUI STag 0 pacnes C347....
16 mars 2021 à 20:44
J'ai la base de données suivante: Event_Type Roster_Designation 4 Assist Male 5 Goal Female 12 Assist Female 13 Goal .......
16 mars 2021 à 20:31
Je pense que je sais ce que je veux. Ma sortie doit avoir des "équipes" comme clés de dict, pour chaque clé de dict, il y aura un dict imbriqué, dans chaque dict imbriqué, la clé sera un nom de joueur, les valeurs pour chaque clé de dict imbriquée seront une liste d'objectifs par partie . Je veux....
16 mars 2021 à 18:25
Ci-dessous un extrait de mon Pandas DataFrame: case_id start_time end_time nom_segment durée 0 0.0 02/06/2016 02/06/2016 A_Create Application | .......
16 mars 2021 à 18:05
Je suis assez nouveau dans l'utilisation de Pandas. J'ai été chargé d'apporter des modifications à un script existant sans documentation. J'ai du mal à déchiffrer ce qui se passe dans la deuxième ligne: lookuptable .......
16 mars 2021 à 18:05
Fondamentalement, j'ai 2 trames de données avec cette structure de base: Col1 Col2 Col3 Col4 aaa 12 xxx 32b tfe 21 xxx 14f eed 12 xxx 54b wes 95 xxx 54r rtf 44 xxx 99q fvg 87 xxx 55h Donc, certaines des valeurs de .......
16 mars 2021 à 17:43
Étant donné une trame de données assez volumineuse, je cherche à prétraiter les entrées en les standardisant à l'aide du module de prétraitement sklearn. Cependant, cette erreur apparaît: "ValueError: impossible de convertir .......
16 mars 2021 à 17:43
Je voulais créer un dataframe en développant l'objet de liste enfant avec les objets parents. Évidemment, essayer pd.DataFrame (lst) ne fonctionne pas car il crée une trame de données avec seulement trois colonnes et conserve .......
16 mars 2021 à 16:56
Le but est de créer un tracé comme celui-ci Dummy df: columns = ['number_of_words', 'occurrences'] data = [[1, 2312252], [2,1000000], [3,800000], [4, 400000], [5, 100000], .......
16 mars 2021 à 16:17
Après avoir concaténé quatre tableaux multindexés avec des données annuelles en kg / ha, je me retrouve avec une base de données contenant 22617 lignes et 144 colonnes. Ce que je veux faire, c'est trouver le maximum de chaque indice / année .......
16 mars 2021 à 16:03
J'ai du mal à appliquer une logique à l'ensemble de mon ensemble de données. Je suis capable d'appliquer la logique sur un petit "groupe" mais pas sur tous les groupes (attention, les groupes sont constitués par primaryFilter et .......
16 mars 2021 à 15:25
J'ai des listes comme celle-ci, l1 = [1,2,3,4,5] l2 = [2,3,4,5,6] l3 = [3,4,5,6,7] Maintenant je veux créer une trame de données de ces trois listes où chaque élément d'une liste va dans des colonnes spécifiques, donc les données .......
16 mars 2021 à 14:34
Je veux calculer le non. d'écart de jours lorsque la colonne «indicateur» est égale à «X» pour les mêmes identifiants. Le dataframe que j'ai: ID Date flag 1 1-1-2020 X 1 10-1-2020 null 1 .......
16 mars 2021 à 14:23
J'ai ces 3 variables (liste de liste, sauf pour la distance): unique_pitch_result = [[0, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64], # len est dynamique [0, 48, 49, 50, 52, 53, 54, 55, 56, 57, 58], .......
16 mars 2021 à 13:39
Bonjour, je voudrais demander s'il est possible d'accéder à plus d'une colonne dans une fonction lambda à l'intérieur d'un pandas-dataframe ou s'il existe une alternative !? Par exemple, mon dataframe cherche .......
16 mars 2021 à 13:31
J'ai le dataframe suivant: import pandas as pd idx = pd.IndexSlice data = {'Col1': [4, 5, 6, 7, 8], 'Col2': [1, 2, 3, 4, 5], 'Col3': [10, 9, 8, 7, 6], 'Col4': [5, 8, 9, 3, 10], 'Col5': [7, .......
16 mars 2021 à 13:25