硬核 | BTC出块时间出现差异:理论与实际对比

金色财经 子木 · 2/23/2021, 6:45:23 PM分享

BTC出块时间出现差异:理论与实际对比

BTC区块时间戳历史分布情况究竟有多符合预期?

本周,我收到了一些消息提醒,这些提醒都是关于一个时不时会出现的问题:

“BTC区块链两个小时都不能挖到一个块的情况多久会出现一次呢?昨晚,我偶然发现了在区块670637和638之间出现了这个状况。”d4okPyHVTMqyel7ZNFz3lV7ORcKF4kZTBJWNmSPK.pngAeCryecn0KCIXXCnpVi0fcedmv3jaNsOS2uz51oi.png

这让我陷入了思考,我不禁想到在过去12年中,BTC区块时间戳历史分布情况究竟有多符合预期?

我之前也对BTC时间戳机制进行过讨论,有充分理由认为BTC的安全性很高,其时间戳背后的博弈论机制也非常完美。ylfEMl6vBQmnO0vcdKs1z1en2nRvPPaneIRM944Y.png

幸运的是,你如果有一个节点的话,就能很轻松地循环访问所有BTC区块头,查看它们的时间戳。为此,我写了个脚本,我的笔记本电脑只用了5分钟就查看了所有的时间戳。

请注意,为了方便测量数据,BTC区块链中第100个区块之前都被我排除了,因为BTC诞生之初,矿工数量很少,发生了一些很特殊的状况。

结果表明,有190个区块在前一个区块出块后106分钟才被挖出,占迄今挖出的67万个区块中的0.0028%,非常接近0.0025%的预期值!这个结果很容易通过计算得出,但只能代表某个特定时间段内出块时间的差值分布情况。

深层次分析

如果要对这个问题进行深入思考,Felix Weiss已经解决了这个问题,他提供了一种方法,能够确定在前一个区块挖出后的特定时间段内应该挖出的区块数量。Z4xQt0K3XT9ZJKxugT8el4rjm9e4ASaoBmxmplyK.png

这个数量能够通过计算指数分布的累积分布函数得出。

但就出块时间的差值而言,怎样才能其整个历史分布状况与预期分布进行对比呢?为了解决这个问题,我们需要利用指数分布的概率密度函数,这个函数可以通过f(x;λ) = λe^-(λx)进行建模。针对出块时间问题,x等于上个区块出块后的某个时间点,λ作为率参数,等于1/600(即目标出块时间),概率密度函数用线性方式表示如下图:xmkg3qGW6FovrlR6ef1Cgfcf1g53qQNPvnwDaSm7.png

我在写这篇文章的同时也绘制出了670000区块之后所有区块的预期分布状况,与上图的形状很相似。buu7fAAzjtebaa3jm2odLz6WCDaajYN0q5Yg8pkC.png

于是我收集了脚本的数据,并将其放入了以下这个表格中:ozi1vOLsmEA8E0hOJL2qqID2eDOeFH2ksD2vFHnA.png

显而易见的是,下图的x轴用对数表示更加合理,否则数据会过于分散,而观察不到一些有趣的现象。

不同挖矿时期

出块时间的预期分布是基于哈希率恒定不变的假设。但根据BTC的发展历史,其哈希率不可能是恒定不变的。Jgd2NwRnH4htXShwvSj9FkW091cXgYzVKUNLCMG2.png

所以我选取了三个时期进行分析。

1. CPU时代:哈希率相对平稳。

2. GPU时代:哈希率加速上升。

ASIC时代:哈希率增速相对较缓

CPU时代

MfALTfr8pP00YevnUhdiJLmvGsWDxcPqYx8P7bX2.png

在CPU时代,对于出块时间少于10分钟的区块,实际数量比预期少,为什么会出现这种情况呢?我将在下文进行解释。

GPU时代

QNNcAOMJJARV3VWICvD4xvLUIvCZxiNPTSf5Txm7.png

请注意,在GPU时代,情况截然相反,实际数量比预期要多,最可能是因为哈希率加速上升。

ASIC时代

CmxiY5c0dNgUAPIu9ClqUIle3ohNPgFB4utIIWG9.png

在早期ASIC时代,BTC哈希率有大幅上升,我特地选取了距离当今较近的时间段,这样数据不会受到很大影响。我们能从上图看出,BTC出块数量仍然多于预期,但是不能够与GPU时代相比。

整个挖矿时代

如果将670000个区块的数据全部绘制成一张图表会是怎么样的呢?根据下图,实际出块时间与预期是非常吻合的,除了图中左边的部分。

KpH8s9LXbCmWstrkWWzSkQpshYmNYeqTXg3wf8b7.png

根据上图,我们能得知,父区块挖出后29秒内出块的数量远低于预期,对此有没有合理的解释呢?EmSeXCYGLyvSOdOelTCwDPY4Lbc4W5ogkRTBCyG3.png

深入研究

在这个时间戳范围内的预期出块数量为30497。

另一方面,实际出块数量是22441。

那么为什么出块数量会相差8056?mykAVQppXEsGB9qMhCVz1KocMVXhFpqaWVP5IzLv.png

我们发现,14296个区块的增量是负数,其中有3549个属于-29到0的区间范围内,那么剩下还有大约6000个区块,下文将会对这6000个区块进行详细分析。

通过绘制负增量的时间戳分布情况,我们能得出,下图基本上是正增量分布情况的镜像。pjrhRNwUlCHXxdj9R3K3UFbmX9Hgx8Jqgo0K2g6S.png

这是因为BTC协议允许负时间戳增量的存在,但这不是根本原因,我们要考虑到实际挖矿的工作过程:

1. 矿池会为下一个区块生成区块元。

2. 矿工向矿池发出工作请求,开始对区块元进行哈希计算。

3. 矿工将完成的工作返回给矿池,形成工作量证明。

所以问题就变成了:区块元的产生频率是多少?时间戳多久更新一次?ZlzyIRPtxcEG2MPzN4HUpYyHKNiRVF04zGP0yQ3e.png

但是,我认为背后的答案更加复杂,因为矿工也有可能更新时间戳,这就牵涉到了研究特定ASIC应用的硬件或者固件。

上文提到,还剩下大约6000个时间戳增量是负的区块,对这些区块有合理的解释吗?我认为理论上是能够解释的,原因可能是时钟漂移或挖矿软件没有得到很好的适配。如果你了解BTC挖矿历史的话,早期矿工没有组成矿池,都是单独挖矿。所以矿工配置不能达到企业级别,这些业余矿工无法保证矿机数据与权威渠道定期同步。早期矿池都是由业余挖矿爱好者而不是全职专业人士运营。我认为,如果我的理论合理,那么随着挖矿产业逐渐成熟,矿池软件得到改进,时钟漂移出现的频率也在下降。所以我运行了另外一个脚本,按照时间绘制了时间戳增量为负的区块分布情况图。vmqKI7zaXTjev5MBtMZFuVzUwd9Tu9Gx6zSAmiMW.png

根据上图,我们能看出,不仅时间戳增量为负的区块数量在减少,时钟漂移问题也逐渐得到改善,值得特别注意的是,自2017年底后,只有少数区块的时间戳增量为负。

总结

BTC大部分运行机制都基于数学原理。通过分析实际出块时间的分布情况,我们能发现,在过去12年中,10分钟出块时间这个机制运行非常良好,只出现过很少的极端情况,背后的原因也很容易找到。挖矿也形成了产业化,挖矿软件得到逐步改善,出块时间分布状况越来越符合预期。

这就是数学的力量!

本文内容来自于:Cypherpunk Cogitations

声明:蜂鸟财经转载此文出于传递更多信息之目的,内容仅供读者参考。若存在侵权行为,请联系我们删除。

相关文章推荐