Questions de mise en œuvre sur les algorithmes d'apprentissage automatique. Les questions générales sur l'apprentissage automatique doivent être publiées dans leurs communautés spécifiques.

Plus à propos machine-learning...

J'ai un doute sur la comparaison des algorithmes de classification. Je fais un projet concernant le réglage d'hyperparamètres et la comparaison de modèles de classification pour un ensemble de données. L'objectif est de trouver le modèle le mieux adapté avec les meilleurs hyperparamètres pour mon e....
Lorsque j'utilise sklearn MinMaxScaler (), j'ai remarqué un comportement intéressant qui est montré dans le code suivant. >>> from sklearn.preprocessing import MinMaxScaler >>> data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]] >>> scaler = MinMaxScaler(feature_range=(0, 1)) >>> scaler.fit(data) MinMaxSc....
6 déc. 2020 à 15:16
J'ai les données suivantes: overall reviewTime reviewerID \ 0 4 08 24, 2010 u04428712 1 5 10 31, 2009 u06946603 2 4 10 13, 2015 u92735614 3 5 06 28, 2017 u35112935 4 4 10 12, 2015 u07141505 r....
J'ai formé un réseau de neurones pour reconnaître les différences entre un papier avec écriture et un papier avec des dessins, mes images sont toutes de taille (3508, 2480) et j'utilise un CNN pour la tâche, le problème est que cela prend des siècles pour m'entraîner, j'ai 30000 données appartenant ....
J'ai fait un simple CNN pour reconnaître trois types de poissons. J'essaie d'utiliser CNN pour classer l'image qui n'était pas incluse dans les ensembles de formation ou de validation. L'image est grunts-saltwater.jpg et est sur Gdrive. Voici le code pour prédire sur le modèle CNN existant: grunts_u....
Je porte un modèle de keras sur torch et j'ai du mal à reproduire le comportement exact de keras / tensorflow 'categorical_crossentropy' après une couche softmax. J'ai quelques solutions de contournement pour ce problème, donc je suis seulement intéressé à comprendre ce que exactement tensorflow c....
3 déc. 2020 à 20:51
Je viens de former un modèle de régression linéaire, obtenant mon interception et mon coefficient pour les prix des maisons en fonction du «nombre_chambres» et du «prix». Mais je ne sais pas trop comment tracer mon modèle de régression à l'aide d'un nuage de points avec une ligne de meilleur ajustem....
J'entraîne donc un modèle de classification d'image et cette erreur apparaît. Il ne semble pas y avoir de réponse à cette erreur. Quelqu'un peut-il s'il vous plaît m'expliquer ce qui ne va pas avec mon code. J'utilise tf.data. Y a-t-il des problèmes avec les étiquettes, que puis-je faire pour résoud....
28 nov. 2020 à 10:56
J'ai besoin d'écrire une fonction pour obtenir un ajustement de courbe d'un ensemble de données. Le code ci-dessous est ce que j'ai. Il tente d'utiliser la descente de gradient pour trouver les coefficients polynomiaux qui correspondent le mieux aux données. //solves for y using the form y = a + bx ....
28 nov. 2020 à 01:45
Je veux créer la base de données car toutes mes données sont au format CSV. ayant 160 colonnes et 15 lignes. comme la colonne le sont davantage, écrire le nom manuellement est très difficile, je veux le faire comme obtenir les noms de colonne à partir du fichier csv et le stocker dans une variable, ....
lr = 0.1 n_iterations = 1000 m = 5 theta = np.array([[1000],[989],[123],[3455]]) for iterations in n_iterations: gradients = 2/m * X_b.T.dot(X_b.dot(theta) - y) theta = theta - lr * gradients theta Après avoir exécuté le code, il indique qu'une erreur «int» n'est pas itérable. Plus d....
23 nov. 2020 à 11:25
Le regroupement (par exemple: K-means, algorithme EM, etc.) est utilisé pour la classification non supervisée en formant des groupes dans les ensembles de données en utilisant une mesure de distance entre les points de données Ma question est la suivante: à part le clustering, que puis-je utiliser p....
Je travaille avec un ensemble de données d'environ 32 000 000 lignes: RangeIndex: 32084542 entries, 0 to 32084541 df.head() time device kpi value 0 2020-10-22 00:04:03+00:00 1-xxxx chassis.routing-engine.0.cpu-idle 100....
J'essaie de gérer multi label dataset déséquilibré en utilisant cross validation mais scikit learn cross_val_score renvoie nan list of values lors de l'exécution du classificateur. Voici le code: import pandas as pd import numpy as np data = pd.DataFrame.from_dict(dict, orient = 'index') # save the ....
J'ai essayé tmux pour maintenir mon application Streamlit en cours d'exécution sur mon instance AWS EC2 mais cela ne fonctionne pas, je suis nouveau sur AWS et Linux, n'importe qui ??....
Habituellement, nous pouvons définir un rappel pour qu'un modèle arrête l'époque si la précision atteint un certain niveau. Je travaille sur l'ajustement des paramètres. Le val_acc est très instable comme indiqué sur l'image . def LSTM_model(X_train, y_train, X_test, y_test, num_classes, batch_size=....
16 nov. 2020 à 05:35
J'ai une question sur l'ordre dans lequel l'objet GridSearchCV de sklearn gère ses combinaisons d'hyperparamètres. Plus précisément, j'ai effectué une recherche de grille en utilisant sklearn avec des paramètres: param1 = [val1, val2, val3, val4, val5] param2 = [num1, num2] L'attribut mean_test_sco....
L'inclusion des données d'entraînement dans SHAP TreeExplainer donne différents expected_value dans scikit-learn GBT Regressor. Exemple reproductible (exécuté dans Google Colab): from sklearn.datasets import make_regression from sklearn.model_selection import train_test_split from sklearn.ensemble....
13 nov. 2020 à 16:30
Je travaille sur un problème de classification de texte multi-classes qui nécessite les 3 premières étiquettes prédites avec la probabilité correspondante. Je peux utiliser sklearn predict_proba(), mais j'ai du mal à formater les sorties comme dans le tableau A . Mon code est ci-dessous: cv = Strat....
10 nov. 2020 à 19:50
** J'essaie d'enregistrer le modèle pour l'utiliser dans l'application Web mais j'obtiens cette erreur ** X = [] sentences = list(review_df['text']) for sen in sentences: X.append(clean_text(sen)) y = review_df['Label'] y = np.array(list(map(lambda x: 1 if x=="fake" else 0, y))) Classification #Te....
J'essaie de faire une analyse basique des sentiments des tweets à l'aide de word2vec et tfidf-score sur un ensemble de données composé de 1,6M de tweets, mais mon Gforce-Nvidia de 6 Go ne parvient pas à le faire. comme il s'agit de mon premier projet de pratique relatif à l'apprentissage automatique....
Je souhaite implémenter la métrique f1_score pour tf.keras. from tensorflow.keras.models import Model, Sequential from tensorflow.keras.layers import Dense from tensorflow.keras.optimizers import Adam from tensorflow.keras.losses import binary_crossentropy from tensorflow.keras.metrics import Accura....
22 oct. 2020 à 05:40
J'utilisais beaucoup Tensorflow avant, mais je suis passé à Pytorch parce que c'était juste beaucoup plus facile à déboguer. La bonne chose que j'ai trouvée avec PyTorch est que je dois écrire ma propre boucle d'entraînement, pour pouvoir parcourir le code et trouver des erreurs. Je peux lancer pd....
J'ai 2 fonctions sont la fonction de train et la fonction logreg, la fonction principale est le train qui exécute la fonction logreg à l'intérieur. Lorsque j'exécute la fonction de train, cela me donne une erreur, NameError: name 'clf_hyper' is not defined Je pense que je n'obtiens pas la variable ....
19 oct. 2020 à 11:18
Si j'entraîne un modèle de légende d'image, arrêtez de renommer quelques jetons: Dois-je entraîner le modèle à partir de zéro? Ou puis-je recharger le modèle et continuer la formation de la dernière époque avec le vocabulaire mis à jour? L'une ou l'autre approche aura-t-elle un effet différent sur l....
2 juin 2020 à 16:30