python - 机器学习使用数据库标签来理解记录是关于什么的
问题描述
我的数据库中有几张表:projects
, citations
, citation_sources
, tags
. 这些就是它们之间的关系。
projects
有多个citations
并且citations
属于projects
。每个都
citation
属于citation_sources
并citation_sources
有多个citations
.citation_sources
有多个tags
和一个tag
属于citation_source
使用这种结构,我可以查询tags
属于citations
特定project
.
我想在 python 中使用机器学习来筛选标签以找出项目的内容。我怎样才能做到这一点?我听说过 K 均值,但我不确定如何实现它。
解决方案
sklearn模块提供了一种实现 K-Means 的简单方法。如果您知道大约有多少个“类别”标签,您可以将集群的数量定义为“类别”的数量。
推荐阅读
- javascript - ZXCVBN 密码检查器属性仅部分工作
- python - 使用 pandas 将数据集列设置为变量时出现 KeyError
- javascript - 使用 Javascript 将文件附加到 PDF
- python - 用所有可能的短语近似值在字符串中搜索单词/短语
- python - 为什么循环跳过if语句
- assembly - gdb 找不到汇编符号
- sql - sqlite:转换 REAL 类型的值
- python - pandas DataFrame 文档生成
- c - 如果 --jobs 大于 1,`re` 配方并不总是重新编译库
- c# - C# 中的 TimerTrigger 未触发