J'essaie de créer un tracé de surface de la fonction d'erreur en régression linéaire. je fais comme ça :

class LinearRegression:
def __init__(self):
    self.data = pd.read_csv("data.csv")

def computeCost(self):
    j = 0.5 * (
        (self.data.hypothesis - self.data.y)**2).sum() / self.data.y.size
    return j

def regress(self, theta0, theta1):
    self.data["hypothesis"] = theta1 * self.data.x + theta0

def plotCostFunction3D(self):
    fig = plt.figure()
    ax = fig.add_subplot(111, projection='3d')

    theta0_vals = np.linspace(-100, 100, 200)
    theta1_vals = np.linspace(-100, 100, 200)
    costs = []

    for theta0 in theta0_vals:
        for theta1 in theta1_vals:
            self.regress(theta0, theta1)
            costs.append(self.computeCost())

    ax.plot_surface(
        theta0_vals,
        theta1_vals,
        np.array(costs),
    )


if __name__ == "__main__":
    regression = LinearRegression()

    regression.plotCostFunction3D()

    plt.show()

J'obtiens l'erreur suivante:

ValueError: Argument Z must be 2-dimensional.

Je sais que je dois utiliser np.meshgrid pour theta0_vals et theta1_vals, mais je ne sais pas comment calculer les coûts à partir de ces résultats. Comment pourrais-je m'y prendre ?

2
K G 4 oct. 2020 à 03:25

1 réponse

Meilleure réponse

L'erreur est causée par l'appel de méthode ax.plot_surface(theta0_vals, theta1_vals, np.array(costs)), car Axes3D.plot_surface(X, Y, Z) s'attend à ce que ses arguments soient des tableaux à deux dimensions.

Ainsi, comme vous le notez, np.meshgrid() doit être utilisé pour calculer la grille couverte par theta0_vals et theta1_vals. Concernant Z, vous avez déjà calculé le coût à chaque point de la grille en utilisant les boucles for imbriquées, il vous suffit donc de transformer la liste unidimensionnelle costs en une liste bidimensionnelle tableau correspondant à la grille XY. Cela peut être fait avec np.reshape().

    def plotCostFunction3D(self):
        fig = plt.figure()
        ax = fig.add_subplot(111, projection='3d')

        theta0_vals = np.linspace(-100, 100, 200)
        theta1_vals = np.linspace(-100, 100, 200)
        costs = []

        for theta0 in theta0_vals:
            for theta1 in theta1_vals:
                self.regress(theta0, theta1)
                costs.append(self.computeCost())
         
        X, Y = np.meshgrid(theta0_vals, theta1_vals)
        Z = np.reshape(costs, (200, 200))
        
        ax.plot_surface(X, Y, Z)

Pour de meilleures performances, il serait bien d'éviter les boucles imbriquées for. Vous pouvez stocker les points de grille X-Y dans une trame de données, puis calculer la colonne Z avec df.apply().

1
Arne 5 oct. 2020 à 08:42