首页 > 解决方案 > 替换字符串中的提及

问题描述

我写了一个算法,它获取表单的条目列表(word,(lower,upper))作为输入,并且应该替换范围内的文本中的(lower,upper)提及word
示例:
文本:“高斯是一位德国数学家。” 1. ("He",(0,3)), 2. ("physicist",(18,29))
结果:“他是德国物理学家。”
不幸的是,我在我的算法中没有发现错误。

private static String substituteByOffset(String text, List<Pair<String, Pair<Integer, Integer>>> mentions) {
    int offset = 0;
    for (Pair<String, Pair<Integer, Integer>> entry : mentions) {
        String subst = entry.first;
        Pair<Integer, Integer> offsets = entry.second;
        Integer lower = offsets.first;
        Integer upper = offsets.second;
        text = text.substring(0, lower + offset) + subst + text.substring(upper + offset, text.length());
        offset = subst.length() - (upper - lower);
    }
    return text;
}

标签: javastring

解决方案


substring(int beginIndex, int endIndex) 返回一个新字符串,它是该字符串的子字符串。子字符串从指定的 beginIndex 开始并延伸到索引 endIndex - 1 处的字符。因此子字符串的长度是 endIndex-beginIndex。

因此:

"Gauß was a german mathematican.".substring(0,3) : "Gau"
"Gauß was a german mathematican.".substring(0,4) : "Gauß"

尝试使用这些输入1. ("He",(0,3)), 2. ("physicist",(18,29))结果如下:

“他ß是德国物理学家n。”

下面的输入将给出正确的结果:

String text = "Gauß was a german mathematican.";
List<Pair<String, Pair<Integer, Integer>>> mentions = Arrays.asList(
        new Pair("He", new Pair<Integer, Integer>(0,4)), 
        new Pair("physicist", new Pair<Integer, Integer>(18,30)));

substituteByOffset(text, mentions); // prints "He was a german physicist."

推荐阅读