首页 > 解决方案 > C - 奇怪的字符出现在字符串中

问题描述

我正在尝试用 C 编写一个简单的凯撒密码。我正在创建一个加密函数,它接收一个字符串(char *,要加密的文本)和一个整数(密钥)。

在函数中,我为将接收移位字符的空字符串分配内存。然后,我遍历初始字符串中的每个字符并询问它是否是字母字符 (Az)。如果是,它会根据键移动。如果不是,它只是重复当前字符。问题是:当字符如 !, ?, . 甚至空格出现在末尾,它会添加一些“?” 给它。我已经放了 printf 语句,我的猜测是正在发生未定义的行为,但我自己无法弄清楚。我希望有一个人可以帮助我。下面,是我写的代码和奇怪的结果。

char* encrypt(char* entry, int key) {
    int i = 0;
    key = key % 26;
    char * tmp = (char *)malloc(strlen(entry));
    if (!tmp) {
        printf("Error during allocation.\n");
        return entry;
    }
    //memset(tmp, 0, 1); // Tried with and without it.
    char t;
    while ((t = *(entry + i))) {
        printf("Current letter: %c\n",*(entry+i));
        if ((t >= 65 && t <= 90) || (t >= 97 && t <= 122)) { //is letter 
            *(tmp + i) = t + key > 90 ? t + key - 26 : t + key;
        }
        else { //isnt letter
            printf("No letter char appeared. Code = %d\n",t); 
            *(tmp+i) = t;
        }
        printf("tmp letter: %c\n",*(tmp+i));
        printf("current tmp: %s\n----------------\n",tmp);
        i++;
    }
    printf("final tmp = %s\n",tmp);
    entry = tmp;
    free(tmp);
    return entry;
}

调用函数: encrypt("HELLO!你好吗?!", 13);

预期(最终)结果:URYYB!UBJ NER LBH?!实际上(最终)结果:URYYB!UBJ NER LBH?!? (有时它会添加更多“?”)

调试 printf 语句:

Current letter: H
tmp letter: U
current tmp: U
----------------
Current letter: E
tmp letter: R
current tmp: UR
----------------
...
----------------
Current letter: !
No letter char appeared. Code = 33
tmp letter: !
current tmp: URYYB!
----------------
Current letter:  
No letter char appeared. Code = 32
tmp letter:  
current tmp: URYYB! ? // <<< It added a strange character to the string
----------------
Current letter: H
tmp letter: U
current tmp: URYYB! U // <<< '?' strange character gone
----------------
Current letter: O
tmp letter: B
current tmp: URYYB! UB
----------------
Current letter: W
tmp letter: J
current tmp: URYYB! UBJ // (I)
----------------
Current letter:  
No letter char appeared. Code = 32
tmp letter:  
current tmp: URYYB! UBJ // This time, space didn't raise a strange char after (I)
----------------
...
----------------
Current letter:  
No letter char appeared. Code = 32
tmp letter:  
current tmp: URYYB! UBJ NER ? // Missed me? I'm back
----------------
Current letter: Y
tmp letter: L
current tmp: URYYB! UBJ NER L // ...And gone again
----------------
Current letter: O
tmp letter: B
current tmp: URYYB! UBJ NER LB
----------------
Current letter: U
tmp letter: H
current tmp: URYYB! UBJ NER LBH???
----------------
Current letter: ?
No letter char appeared. Code = 63
tmp letter: ?
current tmp: URYYB! UBJ NER LBH???
----------------
Current letter: !
No letter char appeared. Code = 33
tmp letter: !
current tmp: URYYB! UBJ NER LBH?!?
----------------
final tmp = URYYB! UBJ NER LBH?!?

有人对这种情况有解释吗?我的系统上的 GCC 信息:

gcc -v
Configured with: --prefix=/Library/Developer/CommandLineTools/usr --with-gxx-include-dir=/usr/include/c++/4.2.1
Apple LLVM version 9.1.0 (clang-902.0.39.1)
Target: x86_64-apple-darwin17.5.0
Thread model: posix
InstalledDir: /Library/Developer/CommandLineTools/usr/bin

标签: cgcc

解决方案


tldr; 您正在从从未初始化的内存中打印字符串。尝试使用calloc而不是malloc.

我认为您的示例中发生的事情是您缺少零字节来终止您的字符串。为了了解发生了什么,您必须考虑以下两件事:

  1. C 字符串以零字节 ( \0) 结束。处理 C 字符串的函数总是期望字符串末尾有一个零字节。如果没有这样的终止符,他们只会假设你的字符串还没有结束。
  2. malloc不初始化分配的内存。这意味着printf("%s", malloc(10));可能会打印或不打印某些内容。这取决于大量因素,因此通常称为“未定义行为”。

所以回到你的情况:你分配tmp但从不用零初始化它。但这对于您的打印语句起作用是必需的。所以使用类似calloc(1, strlen(entry)+1). (请注意+1. 字符串终止符 ( ) 需要多一个字节\0

为了让您了解发生了什么,我建议您在-linememset(tmp, 'X', strlen(entry));之后添加一个。malloc然后尝试理解输出。


旁注:以下内容不会将字符串从tmpto复制到entry.

entry = tmp;
free(tmp);
return entry;

你基本上只是返回tmp这里,它指向一个空闲的内存块,并将导致函数外的无效内存访问。您要使用的是memcpy.


推荐阅读