首页 > 解决方案 > 使用 R,如何获得两个字符串的“差异”?

问题描述

基本 R 函数diff计算一阶差分,用于滞后数据比较。

我正在寻找diffR 中可访问的 GNU 函数: https ://www.computerhope.com/unix/udiff.htm

此功能对版本控制很有用,但在自然语言处理中也很有用,可识别两个相似文本元素之间的更改或编辑。这也是git等的底层引擎。

理想情况下,该功能将是gnudiff(text1,text2)并且如果绑定到quanteda或另一个库,那将是很棒的。

如何获得diff两个文本元素的?

标签: rnlpdiffgit-diff

解决方案


尝试使用diffObj()

library(diffobj)
diffObj(text1, text2)

推荐阅读