首页 > 解决方案 > F# 在非确定性浮点计算上是否受到相同的 C# 警告?

问题描述

C# 浮点代码的结果可能导致不同的结果。

这个问题不是0.1 + 0.2 != 0.3关于浮点机器数的原因和固有的不精确性。

这与具有相同目标体系结构(例如 x64)的相同 C# 代码可能会根据所使用的实际机器/处理器导致不同结果的事实相关联。

这个问题与这个问题直接相关:浮点数学在 C# 中是否一致?是真的吗?,其中讨论了 C# 问题。

作为参考, C# 规范中的这一段明确说明了这种风险:

浮点运算可以以比运算结果类型更高的精度执行。例如,某些硬件架构支持“扩展”或“长双精度”浮点类型,其范围和精度比双精度类型更大,并使用这种精度更高的类型隐式执行所有浮点运算。只有在性能成本过高的情况下,才能使此类硬件架构以较低的精度执行浮点运算,而不是要求实现同时丧失性能和精度,C# 允许将更高精度的类型用于所有浮点运算. 除了提供更精确的结果之外,这很少有任何可衡量的影响

实际上,我们实际上在仅使用 的算法中经历了一个1e-14数量级的差异double,并且我们担心这种差异会传播到使用此结果的其他迭代算法,等等,使得我们的结果对于不同的质量/法律要求不能始终如一地重现我们在我们的领域(医学影像研究)。

C# 和 F# 共享相同的 IL 和公共运行时,但是,据我了解,它可能更多是由编译器驱动的,这对于 F# 和 C# 是不同的。

我觉得不够了解问题的根源是否是双方共同的,或者如果 F# 有希望,我们是否应该跳入 F# 来帮助我们解决这个问题。

TL;博士

C# 语言规范中明确描述了这种不一致问题。我们没有在 F# 规范中找到等效项(但我们可能没有在正确的位置进行搜索)。

F# 在这方面是否有更多的一致性?

即如果我们切换到F#,我们是否保证在跨架构的浮点计算中获得更一致的结果?

标签: c#f#floating-pointlanguage-lawyernon-deterministic

解决方案


简而言之; C# 和 F# 共享相同的运行时,因此以相同的方式进行浮点数计算,因此当涉及到浮点数计算时,您将在 F# 中看到与 C# 中相同的行为。

问题0.1 + 0.2 != 0.3跨越大多数语言,因为它来自二进制浮点数的 IEEE 标准,其中double是一个示例。在二进制浮点数中,0.1、0.2 等无法精确表示。这是某些语言支持十六进制浮点文字的原因之一,例如0x1.2p3可以精确表示为二进制浮点数(0x1.2p3等于9十进制数字系统中的 btw)。

许多内部依赖的软件,double如 Microsoft Excel 和 Google Sheet,采用各种作弊手段使数字看起来不错,但通常在数字上并不可靠(我不是专家,我只是读了一点 Kahan)。

在 .NET 和许多其他语言中,通常有一种decimal数据类型是十进制浮点数,确保0.1 + 0.2 = 0.3为真。但是,它不能保证1/3 + 1/3 = 2/3as1/3不能在十进制数系统中精确表示。由于没有硬件支持decimal它们往往速度较慢,此外 .NETdecimal不符合 IEEE 标准,这可能是也可能不是问题。

如果你有分数并且你有很多可用的时钟周期,你可以BigInteger在 F# 中使用“大理性”来实现。然而,分数迅速增长得非常大,它不能代表评论中提到的第 12 个根,因为根的结果通常是无理数(即不能表示为有理数)。

我想您可以象征性地保留整个计算并尝试尽可能长时间地保留精确值,然后非常仔细地计算最终数字。可能很难做到正确,而且很可能很慢。

我读过一点 Kahan (他共同设计了 8087 和 IEEE 浮点数标准),根据其中一篇论文,我读到了一种实用的方法来检测浮点数引起的舍入误差是计算三次。

一次是正常的舍入规则,然后是总是向下舍入,最后是总是向上舍入。如果最后数字相当接近,则计算可能是合理的。

根据 Kahan 的说法,像“棺材”之类的可爱想法(对于每个浮点运算产生一个范围而不是给出最小值/最大值的单个值)只是不起作用,因为它们过于悲观,你最终会得到无限大的范围。这当然符合我在执行此操作的 C++ boost 库中的经验,而且速度也慢。

因此,当我过去使用 ERP 软件时,我从读到的 Kahan 建议我们应该使用小数来消除类似的“愚蠢”错误,0.1 + 0.2 != 0.3但意识到还有其他错误来源,但消除它们超出了我们的计算范围,存储和能力水平。

希望这可以帮助

PS。这是一个复杂的话题,我曾经在某个时候更改框架时遇到过回归错误。我深入研究了它,发现错误来自旧框架中的抖动使用旧式 x86 FPU 指令,而在新抖动中它依赖于 SSE/AVX 指令。切换到 SSE/AVX 有很多好处,但丢失的一件事是旧式 FPU 指令在内部使用 80 位浮点数,并且只有当浮点数离开 FPU 时,它们才四舍五入为 64 位,而 SSE/AVX 使用 64 位在内部,这意味着框架之间的结果不同。


推荐阅读