Demandez-vous si votre question serait meilleure sur https://stats.stackexchange.com. La statistique est l'étude mathématique de l'utilisation de la probabilité pour déduire les caractéristiques d'une population à partir d'un nombre limité d'échantillons ou d'observations.

statistics...

Je ne peux pas comprendre quelle est la différence entre les méthodes suivantes: prod() cumprod() Et quand est-ce que je les utilise....
5 mai 2020 à 16:55
Je veux trouver deux différences de type d'éléments consécutifs d'un tableau. L'un d'eux étant: diff1 = [x1-x0, x2-x1, x3-x2, ...] Ceci, je suis capable de réaliser en utilisant la fonction np.diff () de la bibliothèque numpy. Cependant, l'autre type de différence que je souhaite est: diff2 = [x0-x1....
20 janv. 2020 à 08:44
Je voulais modéliser l'échantillonnage de Thompson, mais le code suivant donne une erreur de domaine dans les arguments. Je recherche à ce sujet et trouve que quelqu'un le dit parce que les paramètres de la bêta sont négatifs, mais ici les paramètres doivent être positifs, je n'ai aucune idée de com....
21 déc. 2019 à 17:02
J'ai travaillé sur un problème de traitement d'image et j'ai prétraité un tas d'images pour trouver les lignes horizontales les plus saillantes dans ces images. Sur la base de ces données, je veux classer si l'image a un bon angle de perspective ou un mauvais angle. Les points de données sont des an....
18 déc. 2019 à 06:24
J'essaie d'écrire un code qui donne le mode des données. Et je ne devrais pas utiliser les fonctions disponibles sous le module de statistiques mais je peux utiliser des fonctions intégrées telles que max, min, sum, etc. list1 = [1,2,3,4,5,4,3,2,1,2,3,3,4,2,1,3,2,1,3,5] time=0 freq1=0 freq2=0 freq3=....
Mon problème est que j'ai 4 files d'attente. Les agents sont créés dans une source et se déplacent vers une file d'attente, puis ils attendent jusqu'à ce qu'une condition soit vraie pour passer au délai. Je veux obtenir la moyenne, l'intervalle de confiance, min, max, etc. du temps d'attente dans la....
16 déc. 2019 à 13:26
J'ai une trame de données (players_all) avec des statistiques jeu par jeu sur chaque joueur NBA, à peu près du formulaire ci-dessous Name Date Pts Ast 0 Anthony Davis 10/22 25 5 1 Anthony Davis 10/25 21 2 2 Anthony Davis 10/27 29 3 Je voudrais créer un résumé de....
13 déc. 2019 à 06:54
J'ai une trame de données Pandas et je veux utiliser la méthode Describe () pour calculer des valeurs statistiques comme la moyenne, l'écart-type et autres, pour chaque colonne. Un exemple montrant la structure du cadre: X Axis (float array) Y Axis (complex array) Val (float) Class 0....
13 déc. 2019 à 02:56
Étant donné une distribution adaptée à un ensemble de données en utilisant scipy.stats avec quelque chose de similaire à: data = fetch_data(file) x = np.linspace(0, 100, 1000) param = scipy.stats.norm.fit(data) fit_pdf = scipy.stats.norm.pdf(x, param[0], param[1]) Quelle est la meilleure façon de ....
11 déc. 2019 à 22:12
Comment créer un plan d'expériences avec des variables aléatoires continues et discrètes avec OpenTURNS? Je comprends que nous pouvons faire: X0 = ot.Normal() X1 = ot.Normal() distribution = ot.ComposedDistribution([X0,X1]) Mais cela ne crée qu'une distribution conjointe continue, à partir de laqu....
11 déc. 2019 à 19:07
Je veux générer moi-même une fonction de distribution bornée. Mais je vois un comportement étrange dans la limite supérieure. Voici mon code: import matplotlib.pyplot as plt from scipy.stats import rv_continuous def gaus(x, mu, sig): return exp(-0.5*((x-mu)/sig)**2)/(sig*sqrt(2*pi)) class gaus....
11 déc. 2019 à 04:47
J'essaie de calculer dans quelle mesure chaque attribut d'une observation a contribué à la probabilité finale donnée par la régression logistique. J'ai formé la régression logistique sklearn pythons sur mon ensemble de données. Maintenant, je l'utilise pour faire des prédictions sur un ensemble de d....
Je calcule l'entropie d'une trame de données "défaut des clients de carte de crédit". Je l'ai pris dans le référentiel UCI Machine Learning. https://archive.ics.uci.edu/ml/datasets/default+of+credit+card+clients Fichier CSV disponible ici - https://www.kaggle.com/uciml/default-of-credit-card-client....
9 déc. 2019 à 18:49
J'ai une liste de disons 50 dataframes 'list1', chaque dataframe a des colonnes 'Speed' et 'Value', comme ceci; Speed Value 1 12 2 17 3 19 4 21 5 25 J'essaie d'obtenir l'écart-type de la «valeur» pour chaque vitesse, sur toutes les trames de données. L'objectif final....
3 déc. 2019 à 20:15
Salut! J'ai trouvé un graphique bimodal comme celui-ci sur lequel je veux trouver le min, le max, le mode, la médiane et l'écart-type de la distribution. Mais je ne m'intéresse qu'à une partie de cet histogramme complet. Je veux trouver ces valeurs uniquement pour le côté gauche de celui-ci (c'est-....
29 nov. 2019 à 17:10
Voici les valeurs de sortie pour le tri à bulles: n = [10000, 20000, 30000, 40000, 50000, 60000, 70000, 80000, 90000, 100000] t = [9.368115451001358, 37.69119230900105, 85.12908719999905, 152.00092839799981, 242.2243322070026, 353.44638952199966, 487.97764714200093, 669.483528703, 873.3610439340009....
En utilisant les 20newsgroups du scikit, apprenez la reproductibilité. Lorsque je forme un modèle svm, puis effectue un nettoyage des données en supprimant les en-têtes, les pieds de page et les guillemets, la précision diminue. N'est-il pas censé être amélioré par le nettoyage des données? Quel est....
Je suis vraiment un débutant en programmation et je veux extraire seulement 3 des lignes que j'obtiens en exécutant ce code pour cette api. C'est de nhl.com: import requests import lxml.html from pprint import pprint from sys import exit import json import csv url = "https://api.nhle.com/stats/rest....
26 nov. 2019 à 07:40
J'essaie d'empiler un groupe de colonnes afin d'adapter un estimateur de densité de noyau à afin de comprendre comment la probabilité d'observer un intervalle change par rapport à un changement de temps et de prix. Mon DataFrame actuel est le suivant (pas des valeurs exactes, juste un exemple): date....
Pour tester si une différence statistique se produit entre les (grands) échantillons, je veux calculer la moyenne et le sd à partir d'une série value_counts: Dans [0]: counts.value_counts () 0 783 1 1128 2 744 3 366 4 119 5 38 6 10 7 3 Je sais que calcule....
25 nov. 2019 à 13:41
Mon application (dans NodeJS) collecte des statistiques sur les utilisateurs. La dernière étape de ce processus consiste à envoyer ces statistiques utilisateur collectées à l'aide de REST. Parce que cette étape est finale, chaque fois qu'il y a une erreur pendant le processus de candidature, aucune ....
25 nov. 2019 à 12:10
Merci à tous ceux qui ont regardé en premier. Mes codes sont: import numpy as np from scipy.stats import kstest data=[31001, 38502, 40842, 40852, 43007, 47228, 48320, 50500, 54545, 57437, 60126, 65556, 71215, 78460, 81299, 96851, 106472, 108398, 118495, 130832, 141678, 155703, 180689, 218032, 222238....
J'ai une table qui est comme book_id original_title tag_id tag_name 1 The Hunger Games 11305 fantasy 1 The Hunger Games 26771 scifi 1 The Hunger Games 26138 romance 10000 The First World War 14467 historical 10000 The First World War 21689 nonfiction et je veu....
J'ai besoin de mettre en œuvre 100 répétitions du dessin 5 variable aléatoire de Bernoulli (5 cartes) avec un biais de 0,2 en python et de tracer la distribution. jusqu'à présent, ma mise en œuvre est for i in range(5): b= bernoulli.rvs(p=0.2,size=100) cependant, Bernoulli.rvs génère 100 ré....
20 nov. 2019 à 04:14
Je fais une analyse pour savoir s'il y a une différence significative entre la température en juin et décembre à Hawaï. J'identifie d'abord la température moyenne en juin à toutes les stations sur toutes les années disponibles dans l'ensemble de données. J'ai fait de même pour la température de déce....
19 nov. 2019 à 23:27