python - 在散点图中可视化文本类
问题描述
我正在寻找方法来调查我的火车数据“可建模性”,并检查这些类在词汇方面是否有很好的区分......等等。
我有点尴尬,但我想知道是否可以在 Torch 中为文本分类模型做散点图?或任何其他调查数据质量的方法。
解决方案
您可以使用降维(PCA、t-SNE 或 UMAP)+ 色调来检查您的数据。我建议使用散景以交互方式查看您的数据,即使在这里我将向您展示 seaborn。
import numpy as np
import seaborn as sns
import umap
from sklearn.datasets import load_digits
digits = load_digits()
embedding = umap.UMAP().fit_transform(digits.data) # 2D embedding
sns.scatterplot(x=embedding[:,0], y=embedding[:,1], hue=digits.target)
推荐阅读
- python - Django:获取从一个视图启动的子进程(运行/完成)的状态并将其显示到另一个视图
- postgresql - 无法通过 Apache Tomcat 连接到 Postgres DB?
- binary-decision-diagram - 在 CUDD 中传递布尔表达式时出错(在 BuDDy 中工作)
- amazon-web-services - 将来自应用程序的日志存储在 Kubernetes 中
- git - git log --graph 表格格式
- mysql - 无法连接到 XAMPP 上的 FTP 服务器 (Mac)
- node.js - 在流星启动期间访问 mongodb 可能吗?
- php - 如何在 Laravel-6 中包含 php 文件?
- java - E/AndroidRuntime: FATAL EXCEPTION: android studio 中的主要错误
- python - PySpark:如何在 PySpark 转换中指定 dropna 轴?