python - 如何将一列文本转换为 n-gram 到 one-hot 编码?
问题描述
我有这个数据框:
ID | 另一个标题 |
---|---|
1 | 这是文字 |
2 | 这是文字 |
我想使用 python 将其转换为如下所示的数据框:
ID | 这个 | 是 | 这里 | 文本 |
---|---|---|---|---|
1 | 1 | 1 | 0 | 1 |
2 | 0 | 1 | 1 | 1 |
我看过nltk,但似乎找不到一个直接的解决方案,我相信人们以前做过这个,我可以暴力破解它,但我的实际数据框很大。任何帮助,将不胜感激。
解决方案
推荐阅读
- swift - 不要在 TableViewController 中显示我的 Botton Bar
- android - 如何键绑定我的音量增大/减小按钮以单击按钮?
- android - PendingIntent.getBroadcast 在奥利奥中不起作用
- type-conversion - 从 python 如何将 sys.settrace 回调中收到的帧对象传递给需要 void * 的 c++ 函数
- angularjs - 在子状态之间导航时清除父控制器数据:AngularJS
- python - NLTK 可用于停用词的语言
- windows - 如何在 powershell 中执行数学运算,或者更准确地说,从 .CSV 文件
- spring-integration - Spring Cloud Stream:如何为一组绑定指定单个消息处理程序?
- aurelia - 如何在 Aurelia-Dragula 中设置容器特定选项?
- symfony - 提交后如何仅获取更改的实体?