python - 有没有绘制 PCA 和 kmeans 的方法?
问题描述
我开发了这个函数来构建我的术语文档矩阵:
vec = CountVectorizer(analyzer = "word",token_pattern=r'\b[a-zàâçéèêëîïôûùüÿñæœ]{3,}\b',binary=True)
X = vec.fit_transform(chunk_df['text']).T
term-document = pd.DataFrame(X.toarray(), index = vec.get_feature_names())
例如,我将在此矩阵上应用 kmeans:
kmeans = KMeans(n_clusters=2, random_state=0).fit(X)
在这一步,我想应用 PCA 并绘制单词,我想可视化单词的分区(每组单词将包含在同一个集群中)并且我还想根据单词的大小来可视化单词(出现的名词语料库中的这个词),请帮忙
解决方案
推荐阅读
- javascript - 传递一个对象方法并在函数之外调用这些方法。随机密码生成器
- regex - 正则表达式可选地提取两个字符之间的字符
- google-bigquery - 从 Pubsub 在 BigQuery 中编写查询
- kotlin - 在挂起的函数中调用协程构建器(启动、异步)时出现模棱两可的 coroutineContext
- neo4j - 使用 neo4j 连接字符串存储用户名和密码
- sql - 完全匹配 sql 表中的标签/标签列表
- windows - 从 Ansible 中的注册变量创建字典/列表
- ansys - 我的非线性分析 apdl 代码有什么问题?
- apache-kafka - Apache Flink Stream join 使用 DataStream API 不输出任何东西
- javascript - 无法读取未定义的属性“执行” - 不和谐