首页 > 解决方案 > 有没有绘制 PCA 和 kmeans 的方法?

问题描述

我开发了这个函数来构建我的术语文档矩阵:

  vec = CountVectorizer(analyzer = "word",token_pattern=r'\b[a-zàâçéèêëîïôûùüÿñæœ]{3,}\b',binary=True) 
  X = vec.fit_transform(chunk_df['text']).T
  term-document = pd.DataFrame(X.toarray(), index = vec.get_feature_names())

例如,我将在此矩阵上应用 kmeans:

  kmeans = KMeans(n_clusters=2, random_state=0).fit(X)

在这一步,我想应用 PCA 并绘制单词,我想可视化单词的分区(每组单词将包含在同一个集群中)并且我还想根据单词的大小来可视化单词(出现的名词语料库中的这个词),请帮忙

标签: pythonpython-3.xcluster-analysispcahierarchical-clustering

解决方案


推荐阅读