当前位置: 首页 > news >正文

python 取出字串中的所有词

import os
def fun(data, block, dic, user_dic):
    n = len(data)
    for i in range(n):
        for size in range(block, 1, -1):  # 从最长的块开始,直到长度为2
            if i + size <= n:
                same_word = data[i:i+size]
                if same_word in dic:
                    user_dic.add(same_word)
                    

if __name__ == "__main__":
    ss = set(['天安门','我爱','天安'])
    block = max(len(word) for word in ss)
    a = '我爱北京天安门,天安门上太阳升'
    user_dic = set()
    fun(a, block, ss, user_dic)
    print(user_dic)

相关文章:

  • C++:迭代器失效问题
  • 东田数码科技前端面经
  • 利用 Python 爬虫按关键字搜索 1688 商品详情:实战指南
  • (leetcode)力扣100 1.两数之和(两种方法:O(nlogn)/O(n))
  • Go 语言中的 `select` 语句详解
  • 30、不是说字符串是不可变的吗,string s=“abc“;s=“123“不就是变了吗?
  • 【C++】C++11新特性(一)
  • nextjs整合快速整合市面上各种AI进行prompt连调测试
  • 【Java二分查找】
  • Linux(Centos版本)中安装Docker
  • 在CentOS 8上在线安装Docker
  • 1到12月和1到31日英文表达
  • R中实现数值求导的包numDeriv
  • Web服务器技术选型指南:主流方案、核心对比与策略选择
  • 有效的字母异位词
  • 在线教育系统开发常见问题及解决方案:源码部署到运营维护
  • HarmonyOS NEXT:多设备的自由流转
  • 使用cmd来创建数据库和数据库表-简洁步骤
  • 乐企数电发票分布式发票号码生成重复的问题修复思路分享
  • 光敏材料与智能传感技术的能源系统创新研究
  • 上海通报5起违反中央八项规定精神问题
  • 仲裁法修订草案二审稿拟增加规定规制虚假仲裁
  • 2025厦门体育产业采风活动圆满举行
  • 民航局答澎湃:督促各单位进一步完善航班大面积延误和大面积备降应急处置预案
  • 地下管道密布成难题,道路修整如何破局?
  • 饶权已任国家文物局局长