Bonjour,
Je n'arrive pas à finir la classif des tweets dans le TP de RCP 216. J'utilise Kmeans. J'ai dû transformer le RDD(string) en RDD vecteur par la formule suivante:
val parsedData = sent2vec.map(s => Vectors.dense(s.split(',').map(_.toDouble)))
J'ai utilisé Kmeans:
val clustering = KMeans.train(parsedData, nbClusters, nbIterations)
et afficher le résultat:
clustering.clusterCenters.foreach(clusterCenter => {
w2vModel.findSynonyms(clusterCenter,5).foreach(synonym => print(" %s (%5.3f),"
.format(synonym._1, synonym._2)))
println()
})
mais j'obtiens le résultat suivant:
<console>:44: error: not found: value clustering
clustering.clusterCenters.foreach(clusterCenter => {
^
Savez-vous pourquoi ?
Merci pour votre aide.
Cordialement
Patrick Buchmann
Classification des tweets
Modérateur : Crucianu