当前位置: 首页 > news >正文

【leetcode】最长公共子路径问题

滚动hash

滚动哈希(rolling hash)也叫 Rabin-Karp 字符串哈希算法,它是将某个字符串看成某个进制下的整数,并将其对应的十进制整数作为hash值。

滚动hash算法的推导

假设有一个长度为n的数组a[0],a[1],a[2],…a[n-1],数组中的最大值为ma, 我们选取进制k满足k>ma,将数组a看成是n位k进制整数,那么其对应的10进制整数为:

∑ i = 0 n − 1 a [ i ] ∗ k n − 1 − i \sum_{i=0}^{n-1} a[i] * k^{n-1-i} i=0n1a[i]kn1i

这样一来,在子数组长度固定的前提下,给定进制 k,子数组与其十进制值满足「一一对应」的关系,即不会有两个不同的子数组,它们的十进制值相同。因此滚动哈希得到的哈希值是可以表示原子数组的。

滚动哈希的一大优势在于,如果我们需要求出一个数组中长度为 len 的所有子数组的哈希值,需要的时间仅为线性,即如果我们已经计算出数组中以 j 开始的子数组的哈希值:

h a s h ( j ) = ∑ i = 0 l e n − 1 a [ j + i ] ∗ k l e n − 1 − i hash(j) = \sum_{i=0}^{len-1} a[j+i] * k^{len-1-i} hash(j)=i=0len1a[j+i]klen1i

那么要计算以 j+1 开始的子数组的哈希值,我们通过公式推导:

h a s h ( j + 1 ) = ∑ i = 0 l e n − 1 a [ j + 1 + i ] ∗ k l e n − 1 − i = ∑ i = 1 l e n a [ j + i ] ∗ k l e n − i = k ( ∑ i = 1 l e n a [ j + i ] ∗ k l e n − 1 − i ) = k ( h a s h ( j ) − a [ j ] ∗ k l e n − 1 + a [ j + l e n ] ∗ k − 1 ) = k ∗ h a s h ( j ) − a [ j ] ∗ k l e n + a [ j + l e n ] \begin{aligned} hash(j+1) &= \sum_{i=0}^{len-1} a[j+1+i] * k^{len-1-i} \\ &= \sum_{i=1}^{len} a[j+i]*k^{len-i} \\ &= k(\sum_{i=1}^{len} a[j+i]*k^{len-1-i}) \\ &= k(hash(j) - a[j]*k^{len-1} + a[j+len]*k^{-1}) \\ &= k*hash(j) - a[j]*k^{len} + a[j+len] \end{aligned} hash(j+1)=i=0len1a[j+1+i]klen1i=i=1lena[j+i]kleni=k(i=1lena[j+i]klen1i)=k(hash(j)a[j]klen1+a[j+len]k1)=khash(j)a[j]klen+a[j+len]

就可以在 ϕ ( 1 ) \phi(1) ϕ(1)的时间内得到该值。

利用滚动hash算法计算最长公共子路径的代码示例如下:

请添加图片描述

上述代码的执行效率较低,以下代码通过二分法优化,可以有效降低代码的时间复杂度:

def longest_common_subpath_2(n: int, paths: List[List[int]]) -> int:mod = (10 ** 9 + 7) * (10 ** 9 + 9)base = 10 ** 6 + 3# get min len of pathsmin_len = len(min(paths, key=lambda x: len(x)))def check(x: int) -> bool:k = pow(base, x, mod)hash_values = defaultdict(int)for path in paths:cnt = Counter()hash_value = 0for i in range(x):hash_value = (hash_value * base + path[i]) % modcnt[hash_value] += 1hash_values[hash_value] += 1for i in range(x, len(path)):hash_value = (hash_value * base + path[i] - path[i - x] * k) % modif hash_value not in cnt:cnt[hash_value] += 1hash_values[hash_value] += 1return max(hash_values.values(), default=0) == len(paths)l, r, ans = 1, min_len, 0while l <= r:mid = (l + r) >> 1if check(mid):ans = midl = mid + 1else:r = mid - 1return ans

相关文章:

  • TypeScript概述
  • 2025年特种设备作业人员考试题库及答案(流动式起重机Q2)
  • 2.2.2goweb内置的 HTTP 处理程序2
  • gem5教程 第七章 如何在 gem 5 中运行我自己的程序
  • 深入理解网络原理:TCP协议详解
  • 测试用例介绍
  • 微分与积分(前言)
  • 【CodeSprint】第二章-2.1 简单模拟
  • C++ STL编程 vector的插入、删除、扩容机制、随机访问和内存交换
  • 智能Python开发工具PyCharm v2025.1——AI层级功能重磅升级
  • 【学习笔记】机器学习(Machine Learning) | 第六周|过拟合问题
  • 机器学习day3 - KNN的api调用
  • vue报错:Loading chunk * failed,vue-router懒加载出错问题。
  • 马克·雷伯特:用算法让机器人飞奔的人
  • 十一、引用与拷贝函数(References the Copy-Constructor)
  • 节流和防抖
  • 盒子模型
  • 在idea开发中遇到的20个bug
  • WINCC短信报警解决方案
  • 优先队列和单调队列(双端队列实现的)
  • 太好玩了!坐进大卫·霍克尼的敞篷车进入他画笔下的四季
  • 习近平:在庆祝中华全国总工会成立100周年暨全国劳动模范和先进工作者表彰大会上的讲话
  • 公交公司须关注新出行需求:“单车巴士”能否常态化
  • 李在明当选韩国共同民主党总统候选人
  • 别让心脏“饿肚子”,心肌缺血全解析
  • 阿曼外交大臣:伊美下一轮谈判暂定5月3日举行