为啥我的两个元组包含字符串，以相同的方式创建，不相等？

Posted 2023-02-18

技术标签:

【中文标题】为啥我的两个元组包含字符串，以相同的方式创建，不相等？【英文标题】：Why are my two tuples containing strings, created the same way, not equal?为什么我的两个元组包含字符串，以相同的方式创建，不相等？ 【发布时间】：2020-12-22 17:41:49 【问题描述】：

我正在使用 Microsoft Visual C++ 编译以下程序，作为 C++20 程序：

#include <iostream>
#include <tuple>

int main()

    auto t1 = std::make_tuple("one", "two", "three");
    auto t2 = std::make_tuple("one", "two", "three");
    
    std::cout << "(t1 == t2) is " << std::boolalpha << (t1 == t2) << "\n";
    std::cout << "(t1 != t2) is " << std::boolalpha << (t1 != t2) << "\n";

    return 0;

当我运行它时，我看到以下输出：

(t1 == t2) is false
(t1 != t2) is true

元组是相同的，为什么会出现错误的比较结果？我该如何解决这个问题？

【问题讨论】：

【参考方案1】：

auto 并不总是你的朋友。我认为在没有样板的情况下可靠地获得“正确”行为的正确方法是显式使用您知道具有值相等性的类型。然后你也可以省略make_tuple 并简单地使用initialiser-list 构造函数：

#include <string>
#include <tuple>
#include <iostream>

typedef std::tuple<std::string, std::string, std::string> StrTriple;

int main() 
  
  StrTriple t1"one", "two", "three";
  StrTriple t2"one", "two", "three";

  std::cout << "(t1 == t2) is " << std::boolalpha << (t1 == t2) << "\n";
  std::cout << "(t1 != t2) is " << std::boolalpha << (t1 != t2) << "\n";

    return 0;

毫无疑问，有些人会争辩说std::string 的内存管理会产生不必要的开销。 string_view 可能更可取，但是在实际应用程序中，字符串可能需要在某个地方动态分配。

【讨论】：

std::tuple 确实具有价值平等。不幸的是，比较的值并不是您想要比较的值...... @Deduplicator std::tuple 不是类型，所以说它具有值相等是没有意义的。 tuple<string,string,string> 有，tuple<char*,char*,char*> 没有——这两者都是类型，而std::tuple 本身只是一个类型构造函数。好的，更明确一点：std::tuple 如果所有参数都具有值相等性，则具有值相等性。只是您实际上并不想比较参数的值，而是它们指向的字符串的值。【参考方案2】：

您正在比较指向字符缓冲区的指针，而不是字符串。

有时编译器会将两个不同的"one"s 转入同一个缓冲区，有时则不会。

在你的情况下，它不是。可能是调试版本。

添加#include <string_view>，然后

using namespace std::literals;

auto t1 = std::make_tuple("one"sv, "two"sv, "three"sv);
auto t2 = std::make_tuple("one"sv, "two"sv, "three"sv);

你会得到你所期望的。（在c++17 之前的编译器中，使用<string> 和""s 而不是<string_view> 和""sv）。

【讨论】：

我不禁想到这里故事的寓意是“如果您不知道自己分配的是什么类型，请不要使用auto。” @chep 相反，"" 是 C 遗留字符串，真的很烦人。两个文本相同的文字在实现中定义为相等的事实是荒谬的。 @Yakk-AdamNevraumont 如果在同一个 TU 中，您可以提出强制合并它们的理由，但超出此范围很容易变得昂贵。走另一条路会导致臃肿。 @Deduplicator 不，问题是"" 是一个数组文字，而数组文字上的== 衰减为指针并比较指针，这在C++ 中都是遗留的C 垃圾。合并字符串是一条红鲱鱼； "hello" 的地址应该与7 的地址一样重要。 Decay-to-pointer 在 C 中发明时是一种 hack，不比较 == 的数组文字是一个缺失的特性；当他们知道后果时，没有人会用一种语言写出来。为了向后兼容，我们坚持使用它。 @Yakk 并不是说我们在这里有 == 和两个字符串文字，但是是的，将两个参数衰减到二元运算符有点多。如果数组是一流的就好了，是的，std::array 只是一个粗略的创可贴。这也会将 array decay 更改为只是另一个标准转换，可能强制用于非模板 vararg。【参考方案3】：

这个问题与 C++20 无关，而是来自于字符串字面量的实现方式。答案例如在这里：

Why do (only) some compilers use the same address for identical string literals?

简而言之，您的程序属于“~~undefined~~ 未指定行为”类别，因为它假定相同的 C 样式字符串文字具有相同的地址。这是因为像"a" == "a" 这样的表达式比较的是地址，而不是内容。如果您使用 std::string 文字，例如 "one"s、"one"sv 等，您的代码可以变得安全且可预测，请参阅 https://en.cppreference.com/w/cpp/string/basic_string/operator%22%22s

【讨论】：

我怀疑 OP 打算比较字符串地址...【参考方案4】：

"one" 的类型是什么？这不是字符串，而是字符串文字。

你的问题基本上归结为这段代码：

char const* a = "one";
char const* b = "one";

std::cout << "(a == b) is " << std::boolalpha << (a == b) << "\n";
std::cout << "(a != b) is " << std::boolalpha << (a != b) << "\n";

最有可能输出相同的结果。

这是因为字符串文字会衰减为char const*。比较两个指针会比较它们在内存中的位置。现在这是您的编译器是否将字符串文字折叠成一个的问题。如果字符串文字被折叠，那么它们将相等，如果它们不是，它们将不相等。这可能因优化级别不同而有所不同。

那么你如何修正你的比较呢？

最好使用std::string_view，因为您似乎不需要拥有或更改其内容：

using namespace std::literals;

// ... 

auto t1 = std::make_tuple("one"sv, "two"sv, "three"sv);
auto t2 = std::make_tuple("one"sv, "two"sv, "three"sv);

std::string_view 类是指针和大小的薄包装，并定义了一个检查值相等性的比较运算符。

【讨论】：

我很惊讶地看到，即使使用gcc -fno-merge-constants 编译，我也得到了“(a == b) 为真”，（与元组相同）。猜猜这个标志更像是一个建议而不是一个要求。

以上是关于为啥我的两个元组包含字符串，以相同的方式创建，不相等？的主要内容，如果未能解决你的问题，请参考以下文章