Question concernant la correction de TP de KMeans

Modérateur : Crucianu

Répondre
Min
Messages : 9
Inscription : 25 mars 2015 15:31

Question concernant la correction de TP de KMeans

Message par Min » 20 mai 2015 11:12

Bonjour,

La correction pour la dernière question est la suivante:
Les variables ne sont pas de variances comparables ; sans normalisation, les variables de variance très élevée auront un impact déterminant sur les résultats de la classification automatique. Il est donc envisageable de normaliser d’abord les variables.
Est-ce que vous parlez de l'ACP normé et centré? (withMean = true, withStd = true) Voici un example de code:

Code : Tout sélectionner

// Obtenir un RDD avec les colonnes centrées (moyenne=0) et réduites (variance=1)
scala> val centRed = new StandardScaler(withMean = true, withStd = true).fit(lignes.values)
scala> val lignesCR = centRed.transform(lignes.values)

// Obtenir la RowMatrix à partir du RDD lignesCR
scala> val matLignes: RowMatrix = new RowMatrix(lignesCR)

// Calculer les 3 premières composantes principales
scala> val matCompPrincipales = matLignes.computePrincipalComponents(3)

Crucianu
Messages : 17
Inscription : 21 janv. 2015 18:35

Re: Question concernant la correction de TP de KMeans

Message par Crucianu » 20 mai 2015 15:53

Oui, tout à fait.

Répondre

Qui est en ligne ?

Utilisateurs parcourant ce forum : Aucun utilisateur inscrit et 1 invité