首页 > 解决方案 > valgrind 使用 std::string 报告无效读取

问题描述

我正在研究在树莓派 3 上运行的代码。我的日志记录类出现以下错误。

==1297== Invalid read of size 8
==1297==    at 0x4865D1C: ??? (in /usr/lib/arm-linux-gnueabihf/libarmmem.so)
==1297==  Address 0x4c8d45c is 100 bytes inside a block of size 107 alloc'd
==1297==    at 0x4847DA4: operator new(unsigned int) (vg_replace_malloc.c:328)
==1297==    by 0x49C3D9B: std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> >::reserve(unsigned int) (in /usr/lib/arm-linux-gnueabihf/libstdc++.so.6.0.22)
==1297==    by 0x4AE65: std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> > std::operator+<char, std::char_traits<char>, std::allocator<char> >(char const*, std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> > const&) (basic_string.tcc:1155)
==1297==    by 0xF82B5: Log::Book::addField(std::unique_ptr<Log::Entry, std::default_delete<Log::Entry> >&, unsigned int, std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> > const&) (LogBook.cpp:149)
==1297==    by 0xF7CCB: Log::Book::record(std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> >, int, unsigned int, std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> >, std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> >, std::chrono::time_point<std::chrono::_V2::system_clock, std::chrono::duration<long long, std::ratio<1ll, 1000000000ll> > >) (LogBook.cpp:87)

GCC 版本:gcc 版本 6.3.0 20170516 (Raspbian 6.3.0-18+rpi1+deb9u1)
valgrind 版本:valgrind-3.13.0
我似乎找不到问题,因为函数 Log::Book::record()通过传值获得它的价值。我也可以说,调用函数时并不总是显示此错误。在错误显示在哪一行和不显示在哪一行的意义上,它是确定性的。任何人都可以指导我这个问题是什么以及解决方案吗?下面的代码片段带有对指示行的注释。

/** log message */
void Book::record(std::string file, const int line, const unsigned int level, Identifier id, const std::string message,
                  const std::chrono::high_resolution_clock::time_point timeStamp)
{
    if (!(fileLevels & level) && !(consoleLevels & level)) { return; }

    auto now = Time::keeper->now();
    auto duration = std::chrono::duration_cast<std::chrono::milliseconds>(timeStamp - Time::globalEpoch);

    //generate message
    auto entry = std::make_unique<Entry>(level);

    // Time since startup
    addField(entry, 0, std::to_string(duration.count()));

    //UTC Time
    addField(entry, 1, now.dateTime());

    // File
    std::string stringFile;
    if (!file.empty())
    {
        stringFile = URL{file}.lastPathComponent();
    }
    addField(entry, 2, stringFile);

    //Line number
    addField(entry, 3, std::to_string(line));

    //ID
    addField(entry, 4, id);

    //Message
    std::string stringMessage;
    if(!message.empty())
    {
        addField(entry, 5, message); //this is line LogBook.cpp:87
    }
    else
    {
        addField(entry, 5, " empty message.");
    }
    *entry << ";";

    //queue message
    this->append(std::move(entry));
}
void Book::addField(std::unique_ptr<Entry> &entry, unsigned int index, const std::string &text)
{
    std::string textOutput;

    if ((spacings.at(index) != 0) && (text.length() > (spacings.at(index) - 1)))
    {
        spacings.at(index) = (uint8_t) (text.length() + 2);
    }

    entry->setWidth(spacings.at(index));

    if(entry->empty())
        textOutput = text;
    else
        textOutput = ";" + text;   //This is line LogBook.cpp:149

    if(!textOutput.empty())
        (*entry) << textOutput;
}

调用此函数并发生此问题的代码。

auto node = child(items, "item", index);
auto enabled = boolValue(node, "enabled", false);
auto file = pathValue(node, key::path);
auto name = stringValue(node, "name", "");
auto type = stringValue(node, "type");

CLOG(CLOG::WARNING, "Yard item " + name + " not enabled, path:" + file.path());

更新 1: 我使用带有选项的 cmake 进行编译。并添加了额外的选项。这些都没有解决问题。

add_compile_options(-ggdb)
add_compile_options(-O1)

#Extra disable vectorization
add_compile_options(-fno-tree-vectorize)
add_compile_options(-fno-tree-loop-vectorize)
add_compile_options(-fno-tree-slp-vectorize)

更新 2:
我找到了另一个使用字符串连接并且 valgrind 报告相同错误的地方


更新 3:
稍后会有一些有趣的发现。共享库 libarmmem.so 中发生错误。这会被动态加载,因此总是在不同的地址上。错误发生时使用 gdb 和 valgrind 组合来中断。
gdb 使用起始地址加载共享库。

(gdb) info sharedlibrary
From        To          Syms Read   Shared Object Library
0x0483246c  0x04832750  Yes         /usr/local/lib/valgrind/vgpreload_core-arm-linux.so
0x04846e60  0x04850c10  Yes         /usr/local/lib/valgrind/vgpreload_memcheck-arm-linux.so
0x04863588  0x048672fc  Yes (*)     /usr/lib/arm-linux-gnueabihf/libarmmem.so
...

valgrind 报告的错误。

==9442== Invalid read of size 8
==9442==    at 0x4865D34: ??? (in /usr/lib/arm-linux-gnueabi/libarmmem.so)

我们从 libarmmem.so 的 readelf 中得知 .text 部分从 588 开始,而 memcpy 位于 710。此断点的反汇编显示我们位于地址 0x04863710 的 memcpy 中。如果我们检查以下范围:0x04863588 - 0x04863710 = 188. 188 + 588(.text 的起始地址) = 710。
反汇编表明它发生在装配线上。vldmia 是加载向量浮点寄存器的指令。

0x04865d34 <+9764>: vldmia  r1!, {d9}

还没有解决办法。

标签: c++c++11gccvalgrind

解决方案


很可能 libarmem.so 中的代码已经被向量化,以至于它意识到只有在读取完整的 8 字节块后才有终止字符。这不会触发处理器异常(因为算法确保指针对齐并因此保持在同一页面中),但会导致 Valgrind 等工具报告误报。

随着时间的推移,这样的问题越来越严重,使得 Valgrind 在实践中的用处越来越小。请参阅Valgrind vs Optimizing Compilers进行深入讨论,或查看diff 中的这个错误以获取真实示例(或我的 Debian 禁止列表以获取更多示例)。


推荐阅读