r - 使用 R,如何获得两个字符串的“差异”?
问题描述
基本 R 函数diff
计算一阶差分,用于滞后数据比较。
我正在寻找diff
R 中可访问的 GNU 函数: https ://www.computerhope.com/unix/udiff.htm
此功能对版本控制很有用,但在自然语言处理中也很有用,可识别两个相似文本元素之间的更改或编辑。这也是git等的底层引擎。
理想情况下,该功能将是gnudiff(text1,text2)
并且如果绑定到quanteda
或另一个库,那将是很棒的。
如何获得diff
两个文本元素的?
解决方案
尝试使用diffObj()
library(diffobj)
diffObj(text1, text2)
推荐阅读
- docker - 无法从 ubuntu 18.04 主机将卷挂载到 docker-machine
- x11 - Yocto“无法运行 qemu:无法初始化 SDL(x11 不 > 可用)”
- regex - 用于在冒号之间提取字符的正则表达式
- jira - 无法在 xwiki 中集成 Jira
- python - 当我使用想要不同的值时得到一个数字而不是字段名
- hash - 为什么在使用 decl_storage 时 `blake2_256` 不能防止 StorageDoubleMap 中的“第一个密钥对”被破坏?
- r - 读取特定的栅格文件并在 R 中创建平均栅格
- salesforce - Salesforce JOIN 查询问题
- node.js - 使用 websocket-stream 通过 Firebase Node.js 将文件上传到云存储?
- sql - 是否有任何方法可以直接从 sql 中的 Select 语句创建 JSON(字符串数组)?