首页 > 解决方案 > 如何将一列文本转换为 n-gram 到 one-hot 编码?

问题描述

我有这个数据框:

ID 另一个标题
1 这是文字
2 这是文字

我想使用 python 将其转换为如下所示的数据框:

ID 这个 这里 文本
1 1 1 0 1
2 0 1 1 1

我看过nltk,但似乎找不到一个直接的解决方案,我相信人们以前做过这个,我可以暴力破解它,但我的实际数据框很大。任何帮助,将不胜感激。

标签: pythonscikit-learnnltkone-hot-encodingn-gram

解决方案


推荐阅读