基于Stern-Brocot tree的有理数集二分算法及其优化
0. 写在前面
本文中用 Stern-Brocot tree 做有理数二分的 idea 来自q神,后来我独立证明了其时间复杂度为 ,遂作此文,并作为算法课期末小论文提交(大概2020年的时候)。不知道竞赛圈中有没有类似的内容,或许本文是首创?在阅读之前,可以先看一下我以往创作的相关文章和视频:
- 超实用!Stern-Brocot tree总结奉上
- 【算法】什么是Stern-Brocot tree?香不香,味道还可以吗?
- 【算法】这个算法明明使用二分却过分暴力!继续品尝Stern–Brocot tree
- 【算法】震惊!Stern–Brocot tree竟与辗转相除有关?
另外本文可能有一些意识流的地方,写得并不严谨,请见谅。
1. 引言
二分法是算法研究中的一个极其重要的基础算法,或者说是一种重要的指导思想。比如,在有序数组中查找某一特定元素的位置或者判定其是否出现,或者数值分析中的求某一段单调函数的零点,又或者是在问题满足某种单调性时用二分枚举去代替暴力枚举,这样就将最优性问题转换成判定性问题,进而二分出最终答案。实际上,这类可以用二分算法解决的问题通常有一个相似的模型,然而对于解类型的不同,算法框架又稍有区别。一般来说,最常见的是在整数区间或实数区间上二分。然而对于某些问题,需要考虑的是在有理数集上二分,并将答案表示成最简分数的形式。这种情况下,二分更难实现,比如已知当前区间,如何求解当前区间的“中点”,从而对区间进行“二分”?借助数学工具Stern-Brocot tree可以完成这一任务。
Stern-Brocot tree是由德国数学家Moritz Stern和法国钟表匠Achille Brocot分别独立发现的。Stern-Brocot tree是一种展示所有正有理数的无限完全二叉树,其中树上节点与正有理数一一对应。它巧妙地将数论与数据结构联系在一起,构造过程十分优雅,且拥有众多神奇的性质。不仅如此,其与法里序列、连分数以及欧几里得算法等内容有着广泛而密切的联系。
本文第二节归纳总结了二分问题的共同点和算法的基本框架,并依据解类型的不同阐述了其中的区别。最后引出本文所讨论的问题——在有理数集中二分。
本文第三节重点介绍了Stern-Brocot tree的构造、性质以及相关证明。
本文第四节引入了Stern-Brocot tree中独特的数系,并将构造过程中的线性变换用矩阵乘积的形式来表示。最后从矩阵形式入手,解释了其与求最大公约数的欧几里得算法的联系。
本文第五节具体描述了在Stern-Brocot tree上实现对有理数集二分的算法,并逐步给出了优化。
2. 二分算法
考虑某问题在区间 中寻找答案 。假设已知该问题在区间 上有性质,在上不具有性质 ,且验证区间上任意一个点是否具有性质 十分容易或者时间复杂度在可接受范围内,那么答案 就可利用二分法求解。
这里说的性质 是一种形象的说法,也可以理解为我们能通过简单的计算或是另外的算法来较快地询问二分中点与答案的大小关系。而区间能根据是否含有性质 分成前后两段通常是由某种单调性决定的。
2.1. 整数集上的二分
当只考虑区间中的整点时,即二分的对象为一段连续的整数时,情况最简单。假设在 点处具有性质 ,则伪代码如下所示:
\begin{algorithm} \caption{BinarySearchForInteger} \begin{algorithmic} \PROCEDURE{BinarySearchForInteger}{$L,R$} \WHILE{$L\lt R$} \STATE $mid \gets \lceil (L+R)/2 \rceil$ \IF{\Call{HasProperty}{$mid$}} \STATE $L \gets mid$ \ELSE \STATE $R \gets mid-1$ \ENDIF \ENDWHILE \RETURN $L$ \ENDPROCEDURE \end{algorithmic} \end{algorithm}
若在 点处不具有性质 ,则在取整及加减一稍有区别,情况类似。
假设每次验证的时间为 ,由于搜索的区间长度 每次会减少一半,所以二分的时间复杂度 。举个例子,在有序数组 中二分查找某元素 的位置,这里假设数组元素严格单调递增,且 一定存在。那么初始区间即 ,代表下标。上述所说的性质 在这里即为“该位置的数组元素小于等于 ”。
2.2. 实数集上的二分
然而对于一些数值分析或是计算几何之类的问题来说,需要的答案 往往是浮点数类型,是一定精度内的近似解,比如要求精确到小数点后六位,或者要求绝对误差限或相对误差限不超过一个设定好的且足够小的 值。这样循环终止条件可以根据不同的精度需求自行设定。若初始区间长度为 ,则时间复杂度为 ,所需精度越高, 就需要设定的越小,时间代价就越大。
由于是浮点数,代码实现时则无需考虑 点处是否也具有性质 。
\begin{algorithm} \caption{BinarySearchForReal} \begin{algorithmic} \Procedure{BinarySearchForReal}{$L,R$} \While{$R-L>eps$} \State $mid \gets (L+R)/2$ \If{\Call{HasProperty}{$mid$}} \State $L \gets mid$ \Else \State $R \gets mid$ \EndIf \EndWhile \Return $L$ \EndProcedure \end{algorithmic} \end{algorithm}
例如,求解 在区间 上的零点,性质 则为“”。
2.3. 有理数集上的二分
对于有理数的情况我们也可以抽象出类似的问题。考虑在有理数集 上确定未知数 。已知在 上有性质 ,在 上不具有性质 ,且可以用 的时间询问任一有理数 是否具有性质 ,换句话说,可以很快判断出 是否小于等于答案 。目标就是用尽量少的询问次数确定 。
这样定义问题的好处是规定了分子分母的上界,那么只需考虑 个不同的有理数。定义这样的有理数集 也相当于规定了求解的精度要求, 越大代表精度越高。可以看到,有理数集上的二分问题比之前讨论过的整数集、实数集上的二分要难。
一个典型应用是在直角坐标系第一象限上二分斜率大小。将斜率表示成最简分数的形式避免了浮点数计算带来的精度损失,从而方便处理一些整点相关的问题。该问题模型也可以用来做无理数的最佳有理逼近。
3. Stern-Brocot tree
在解决有理数集上二分问题之前,先介绍一下Stern-Brocot tree。在本节中将给出Stern-Brocot tree的构造过程以及相关性质的证明。
3.1. Stern-Brocot tree的构造
首先定义两个分数的中位分数:
定义 1(中位分数). 两个分数 和 的中位分数为 。
后面会看到在有理数集上二分时,我们会使用中位分数来作为每次二分的“中点”。
有了中位分数的概念就可以开始构造Stern-Brocot tree了。我们先来构造树上每层的分数序列,构造从两个分数 出发,作为第 层。第一个数是 ,而第二个数实际上并不是严格意义上的分数,这里将其看成无穷大即可。
每次将相邻两分数的中位分数插在它们的中间,一层一层无限地计算下去,那么前几层就会得到:
可以看到,第一次产生 个新值,第二次产生 个,第三次产生4个,再接下来会新得到8个值,以此类推。不难发现,一个在某层中新产生的分数会在下一层的计算中产生左右两个新的分数,那么让为根,每层中的新值分别向下一层与其相邻的左右两个点连边,并作为其的两个孩子节点,这样就构造出了如图一所示的Stern-Brocot tree(实线连接的树)。假设某分数由和构造得到,那么可以发现,在树中是节点从下往上看第一个小于其值的祖先节点,即它左上方最近的祖先。类似地,是右上方最近的祖先。
事实上,Stern-Brocot tree不仅是一个无限完全二叉树,其也满足二叉搜索树的性质:每个点的权值大于等于左子树中任意一点的权值,并且小于等于右子树任意一点的权值。当然,等于的情况在这里并不会出现。若只考虑这个无限大的树的前 层,对其做中序遍历,并将 和 分别添加在序列的头尾,那么就得到了我们之前构造的第 层序列。
3.2. Stern-Brocot tree的性质
为了说明Stern-Brocot tree能展示所有的正有理数且树上节点与正有理数一一对应,主要需证明以下三条性质:有序性、不可约性、所有正有理数的存在性。
3.2.1. 有序性
定理1. 若 且 ,则 。
这条性质是说两分数的中位分数的大小严格介于它们中间,经过简单的移项通分即可证明,此处略去。因为第 层的分数是升序排列的,因此每次将相邻两分数的中位分数写在中间不会破坏每层的有序性。
3.2.2. 不可约性
定理2. 若和是构造过程中任意一层的相邻分数,那么就有。
证明. 初始第 层是正确的,。当插入中位分数后,序列变成了
需要检验的新情形是
根据 不难证明其正确性。
得到该性质之后,结合裴蜀定理,即关于未知数 和 的线性不定方程 有整数解,当且仅当 是 的倍数,可以推出 ,即构造出的任意分数都是最简分数。
3.2.3. 所有正有理数的存在性
根据有序性可以得知,一个分数在树中不会出现超过一次。更进一步,可以证明:
定理3. 任何满足 的正有理数 都能通过有限步构造得到。
证明. 一开始我们有
每次比较 和 ,分为三种情况,并不断进行下去:
-
,则构造出了 ;
-
,则令 ,;
-
,则令 ,
那么就有
(1)乘上 ,(2)乘上 ,然后两式相加得到
根据定理 2 化简可得
因为每一步中 里至少有一个变量会变大,所以(3)式不会一直成立。也就是说,一定能在有限步内构造出 。
这样所有正有理数都会在树中出现且仅出现一次。实际上,这个证明过程本质就是在Stern-Brocot tree这个二叉搜索树上去二分地定位一个正有理数的位置,后文还会涉及到类似内容。
4. 准备工作
上一节证明了树上节点与正有理数是一一对应的,本节将引入Stern-Brocot tree独特的数系来具体阐明这个一一对应的关系。之后用矩阵的形式描述从根节点往下移动的过程中分子分母的变化。本节最后将揭示Stern-Brocot tree与求两个数最大公约数的欧几里得算法的联系,为第 节给出的优化提供理论基础。
4.1. 数系的引入
在上一小节中,我们已经知道了所有正有理数都会在树中的某个位置恰好出现一次。考虑用 L 或 R 表示从根走到某节点的路径时每次往左孩子还是右孩子走,那么这样一个由 L 和 R 组成的有限长度的字符串就唯一确定了树上的一个位置,也就唯一表示了一个正有理数。例如 LRL,表示从根 往左走到 ,然后往右走走到 ,再往左到 ,所以 LRL 表示分数 。特殊的,根节点 对应一个空字符串,用字符 表示。
定义2. 若 是由 L 和 R 组成的字符串, 为Stern-Brocot tree上与 对应的分数,则定义
定理4. 若 ,则字符串 的长度不会超过 。
根据定理 3 证明中的(3)式即可证明。特殊地,当 为 或 的形式时, 长度为 ,此时达到最长。这个性质说明直接按照定理 3 证明中的二分方法去定位 的话,时间复杂度是线性的,需要发掘Stern-Brocot tree更多更加本质的特点,从而达到优化。
4.2 矩阵表示
在 3.2.3 小节证明的二分过程中,我们维护了四个变量 并做了一些线性的变换,本节中用 矩阵来描述同样的过程。
定义3. 假设某分数 由 和 构造得到,其中 是它左上方最近的祖先, 是它右上方最近的祖先,且 ,定义矩阵:
注意,这里将祖先分数的分子放在了分母的下方,好处是根节点可以表示成一个单位矩阵,即
根的左右孩子 和 分别表示为
考虑证明 3.2.2 二分的后两种情况,即走到 的左右孩子
不难发现
一般地,下述定理成立
定理5. 设 是两个由 L 和 R 组成的字符串,则
因此我们可以将 LR 字符串代表的路径写成一系列 和 矩阵连乘的结果。
4.3. 欧几里德算法
考虑简化上述二分方法,若已知分数 ,对应的矩阵表示为,那么有 和 。假设 ,那么对应在树上的路径第一步必为 R,设剩余路径为 ,则有 。
即
解得
因此
同理,若 ,设 ,则有 。这样假设我们已知 ,想求出它在树上的位置,即对应的字符串序列,那么每次可以分两种情况:当 时,输出一个 R,并令 减去 ;当 时,输出一个 L,并令 减去 。反复执行上述流程,直到 结束,此时输出的字符串就是答案。实际上,这个过程就是对 和 做辗转相减,因为 和 互质,所以最终一定有 。
这样,我们自然可以将其优化成辗转相除法。如下所示,代码作用即输出 的路径表示,只是这次对于同一段连续的 L 或连续的 R,只输出一个字符和其连续出现的次数。
\begin{algorithm} \caption{Locate} \begin{algorithmic} \Procedure{Locate}{$x,y$} \While{$x\ne y$} \If{$x\le y$} \State $step \gets \lfloor (y-1)/x \rfloor $ \State $y \gets y-step\times x$ \State \PRINT $\text{'L'},step$ \Else \State $step \gets \lfloor (x-1)/y \rfloor $ \State $x \gets x-step\times y$ \State \PRINT $\text{'R'},step$ \EndIf \EndWhile \EndProcedure \end{algorithmic} \end{algorithm}
其中,第 4 行和第 8 行中的减一是为了避免最后一次while循环将 或 减小至0,所以除了最后一次除法外,在树上定位 的过程与求 和 最大公约数的欧几里德算法步骤完全相同。根据拉梅定理, 和 辗转相除的步数不超过 十进制位数的 倍。由此可以得出该算法的时间复杂度为 。
5. Stern-Brocot tree上的二分算法及其优化
有了之前的准备工作,在这一节中将解决 2.3 小节中提出的有理数集上的二分问题。需要注意的是,该问题与 4.3 小节中的定位问题是不同的。主要区别在于有理数集上的二分问题中 是未知的,需要通过二分地询问从而逐步确定,而 4.3 小节所讨论的是已知一有理数 去找它在树中的位置。
一个直接的方法是将所有可能的 个有理数列出来,排序后利用整数区间上二分的模型,虽然二分的复杂度是 ,但是预处理的过程就已经需要 的时间和空间了。[2]提出了一种 的算法,先用指数搜索的技巧确定答案的整数部分,然后用一种本质为连分数展开的递归方法确定小数部分。本文提出的方法时间复杂度同样为 ,并且也使用了指数搜索,不同的是本文提出的方法是非递归的,且没有分别计算整数与小数部分,而是在一个大的二分查找框架中确定答案,思路是寻求Stern-Brocot tree与欧几里德算法的联系。
5.1. 朴素的二分方法
考虑每次在树上从根出发一步一步地走,询问当前分数 是否小于等于答案。若是,则更新答案为当前分数,并走到右孩子上;若否,则直接走到左孩子上。当 或 时,算法停止,此时答案记录的分数即为我们想要的结果。根据定理4可知,这种方法的时间复杂度是 。
5.2. 二分优化
根据 4.3 节可得出以下结论:
定理 6. 设 ,若字符串中连续相同的字符为一段,则字符串 的段数是 的。换句话说,从根节点到 的路径拐弯的次数是 的。
那么考虑将朴素二分过程的一步一步走改成一段一段走,对于每一段,再次二分步长从而走到下一个“拐点”上。因为每次的步长未知,所以二分的上界设为 。这样,因为有 段,对于每段又需要分别做一次 的二分,所以该方法的时间复杂度为 。
5.3. 进一步优化
直觉上来说,该方法还有进一步优化的空间。思考一下树上路径的特点,如果段数少,则每一段步长就可能会很长,比如形如 这样的分数,;如果段数多,则每一段步长就会很短,比如斐波那契数列相邻两项之比,。因此,在之前优化中二分上限如果不是每次跑满 ,而是 的话(假设 是第 段的长度),时间复杂度就可能降下来。
这里要用到指数搜索,即先倍增后二分的技巧。一开始先倍增的跳,跳 步,步, 步, 步…直到 步时判断出已经跳过了拐点,之后即可确定,那么再在区间 上二分步长即可,显然最多只需询问 次,第 次倍增后二分的时间复杂度就是 。伪代码如下:
\begin{algorithm} \caption{BinarySearchForRational} \begin{algorithmic} \Procedure{BinarySearchForRational}{} \State $a,b,c,d \gets 0,1,1,0$ \While{$a+c\le N \textbf{ and } b+d\le N$} \If{\Call{HasP}{$a+c,b+d$}} \State $step \gets 1$ \While{$a+step\times c\le N \textbf{ and } b+step\times d\le N \textbf{ and } $\Call{HasP}{$a + step \times c, b + step \times d$}} \State $step \gets step\times 2$ \EndWhile \State $ L,R \gets \lfloor step/2\rfloor ,step - 1$ \While{$L\lt R$} \State $mid \gets \lceil (L + R) / 2\rceil$ \If{\Call{HasP}{$a + mid \times c, b + mid \times d$}} \State $L \gets mid$ \Else \State $R \gets mid-1$ \EndIf \EndWhile \State $a,b \gets a+L\times c,b+L\times d$ \State $ansx,ansy= a,b$ \Else \State $step \gets 1$ \While{$step\times a+ c\le N \textbf{ and } step\times b+ d\le N \textbf{ and } \textbf{ not } $\Call{HasP}{$step \times a + c, step \times b + d$}} \State $step \gets step\times 2$ \EndWhile \State $ L,R \gets \lfloor step/2\rfloor +1 ,step$ \While{$L \lt R$} \State $mid \gets \lfloor (L + R) / 2\rfloor$ \If{\Call{HasP}{$mid \times a + c, mid \times b + d$}} \State $R \gets mid$ \Else \State $L \gets mid+1$ \EndIf \EndWhile \State $c,d \gets (L-1)\times a+c,(L-1)\times b+d$ \EndIf \EndWhile \Return $ansx,ansy$ \EndProcedure \end{algorithmic} \end{algorithm}
后面考虑如何证明总的时间复杂度为 。
设 ,不妨设 , 由辗转相除得到一系列式子:
其中 表示 和 做辗转相除的除法次数,也是 Stern-Brocot tree 上,根节点到 的路径段数。根据 4.3 小节可知,,即第 段路径的长度等于辗转相除中每次得到的商,除了最后一段是 。
由于询问只能查询当前有理数是否小于等于答案,因此在树上二分查找的过程中遇到最终答案并记录后也不会立刻停止算法,而是会再往右走一步,之后一直向左走,直到分子或分母超过 。到节点 之后,从右侧不断往左逼近 的步数不超过 。因此,方法三的总询问次数可以分到达 之前与之后这两段计算:
所以最终本文实现了在 时间内通过询问某个数是否小于等于答案的方式在有理数集 上确定未知数 。该方法用非递归方法实现,借助Stern-Brocot tree的结构来实现对有理数的二分,二分时每次通过指数搜索快速走到路径拐点,并结合欧几里得算法证明了该算法是对数时间的。根据信息论理论,该复杂度达到了理论下界。至此,问题解决。
参考文献
[1] Graham R L, Knuth D E, Patashnik O, et al. Concrete mathematics: a foundation for computer science[J]. Computers in Physics, 1989, 3(5): 106-107.
[2] Kwek S, Mehlhorn K. Optimal search for rationals[J]. Information Processing Letters, 2003, 86(1): 23-26.
[3] Bentley J L, Yao A C C. An almost optimal algorithm for unbounded searching[J]. Information processing letters, 1976, 5(SLAC-PUB-1679).
相关题目
Probe Droids – Kattis, Kattis
题目描述
在一个 的网格上,每个格点有一个机器人。最左下角的点没有机器人,而是一个初始面向 轴正方向的炮塔,坐标记为 。如果一个机器人在它的视线上,则摧毁该机器人。否则,炮塔会逆时针旋转直到可以看到机器人。重复这个操作,直到所有机器人都被摧毁。现在有 次询问,每次询问第 个被摧毁的机器人的坐标。
思路
二分斜率后,转化为计数问题,求 下方有多少个点(将左下角视为原点),并与 比较,从而判断斜率的大小。二分斜率的方法即用本文描述的有理数二分方法,之后的计数问题套用类欧几里得算法。总时间复杂度。
参考代码
1 | def f(a, b, c, n): |