首页 > 解决方案 > 如何用符合 C++ 核心准则的代码替换 C 样式的字符串解析?

问题描述

以这两个代码片段为例:

//...
file_string = strstr(file_string, "\nv ");
while (file_string = strstr(file_string, "v ")) {
    vec::vec3<float> buffer = { 0.0f };
    file_string += strlen("v ");
    file_string = std::from_chars(file_string, file_string_end, buffer.x).ptr;
    file_string++;
    file_string = std::from_chars(file_string, file_string_end, buffer.y).ptr;
    file_string++;
    file_string = std::from_chars(file_string, file_string_end, buffer.z).ptr;
    file_string++;
    vcoords.push_back(std::move(buffer));
}
//...
//...
while (file_string = strstr(file_string, "v ")) {
    size++;
    file_string++;
}
vcoords.reserve(size);
//...

对于此类数据

(...)
v 1.000000 1.000000 -1.000000
v 1.000000 -1.000000 -1.000000
v 1.000000 1.000000 1.000000
v 1.000000 -1.000000 1.000000
v -1.000000 1.000000 -1.000000
(...)

他们工作并且他们工作得足够快。它们还会生成警告,例如:

C26481: Don't use pointer arithmetic.

C26486: Don't pass a pointer that may be invalid to a function. Parameter 0 'file_string' in call to 'strstr' may be invalid (lifetime.3).

如何将 strstr/pointer 算术组合替换为可以相当快地完成其工作并且不会产生此类警告的东西?我尝试解决与std::string-to-float转换相关的类似问题,但他们要么使用了std::stringstream,这非常慢,要么假设所讨论的字符串只包含一个值。

标签: c++parsingwavefront

解决方案


启用核心指南检查器后编辑更改

我在使用std::from_chars. 有趣的事实:它还不适用于 gcc 或 clang 的浮点值!那......可能保证在功能成熟之前不要使用它。

关闭指南检查器的事情:

  • gsl::at是指针算术的作弊码。没有警告
  • 寿命检查器有点愚蠢。它不知道被 a 包裹的字符串文字string_view仍然具有无限的生命周期,但如果您使用字符串视图文字 (""sv),它不会标记。
  • 仍然string::find用于搜索,然后将位置添加到string::data()
  • 我之前推荐过索引而不是指针运算,但分析也不喜欢那样。
using namespace std::literals;
const std::string file_string = "\n"
    "v 1.000000 1.000000 -1.000000\n"
    "v 1.000000 -1.000000 -1.000000\n"
    "v 1.000000 1.000000 1.000000\n";
const auto tag = "v "sv;
const char* file_string_end = &gsl::at(file_string, file_string.size());

std::vector<vec::vec3<float>> vcoords;
std::string::size_type pos = 0;
while ((pos = file_string.find(tag, pos)) != std::string::npos) {
    vec::vec3<float> buffer = { 0.0f };
    auto [x_ptr, x_ec] = std::from_chars(
        &gsl::at(file_string, pos + tag.size()), 
        file_string_end, 
        buffer.x);
    if (x_ec != std::errc()) {
        throw std::runtime_error("bad x");
    }
    std::string_view x_view(x_ptr);
    auto [y_ptr, y_ec] = std::from_chars(
        &gsl::at(x_view, 1), 
        file_string_end, 
        buffer.y);
    if (y_ec != std::errc()) {
        throw std::runtime_error("bad y");
    }
    std::string_view y_view(y_ptr);
    auto [z_ptr, z_ec] = std::from_chars(
        &gsl::at(y_view, 1), 
        file_string_end, 
        buffer.z);
    if (z_ec != std::errc()) {
        throw std::runtime_error("bad z");
    }
    vcoords.push_back(buffer);
}

https://godbolt.org/z/F9j7FA


推荐阅读