data-mining - 词关联挖掘如何泛化n-gram语言模型
问题描述
我正在研究文本挖掘(阅读书...)作者说词关联挖掘实际上是n-gram语言模型的推广,你能告诉我词关联挖掘是如何推广n-gram语言模型的吗?对于我来说,词关联挖掘是寻找有症状的关系(寻找共现)词,n-gram 语言模型是比较查询中的所有 n 词以建议或返回相关文档。
解决方案
关联规则挖掘将尝试覆盖任意长度的频繁并发。
如果将此(不仅仅是两个术语相关性)应用于文本,您确实会发现没有固定 n 的 n-gram。
推荐阅读
- php - 使用 XAMPP 服务器在 ubuntu 16.04 LTS 上安装 Phalcon
- ffmpeg - Audacity 中的 ffmpeg 输出
- windows - PostgreSQL安装总是卡在最后一步
- powershell - 如何使用 folder.copyHere() 方法在 PowerShell 中使用 Windows.Forms.OpenDialog 中的多选进行复制?
- android - Picasso 2.71828 加载 uri 问题
- php - SimpleXML 按索引删除多个节点
- javascript - 等待高程服务请求回调
- java - 如何在 JList 中显示 File[] 数组
- android - Android NDK - 如何解析 K&R 风格的函数声明
- javascript - 为什么 Array(3) 创建的数组没有索引 0、1、2?