正则表达式和excel文件保存(python)
正则表达式
import re
data = """
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8" />
<title>测试页面</title>
</head>
<body>
<h1>《人工智能的发展趋势分析报告》</h1>
<ul id='list1'>
<li class="msg" title="1111">红豆生南国,春来发几枝</li>
<li class="msg" title="2222">红豆生南国,春来发几枝</li>
<li class="msg" title="3333">红豆生南国,春来发几枝</li>
<li class="msg" title="4444">红豆生南国,春来发几枝</li>
</ul>
<ul>
<li>1</li>
<li>2</li>
<li>3</li>
<li>4</li>
</ul>
</body>
</html>
"""
#re.DOTALL 用.这个符号代替所有的字符
#re.VERBOSE 正则表达式 多行
ret = re.findall(r"""
<ul.+?'list1'.+?title="2222">(.+?)</li>
""",data,flags=re.DOTALL|re.VERBOSE)
print(ret)
excel文件保存
import xlwt # 导入excel模块
list = [
["姓名", "年龄", "分数"],
["张三", 20, 100],
["李四", 20, 100],
["王五", 20, 100]
]
# 工作簿--->工作表--->单元格
# 1.创建工作簿
workbook = xlwt.Workbook()
# 2.在工作簿里面添加工作表
sheet = workbook.add_sheet("成绩单")
# 3.在工作表中添加单元格
for row in range(len(list)): # 0,1,2,3
for col,value in enumerate(list[row]):
print(row, col, value)
sheet.write(row, col, value)
# 4.保存工作簿
workbook.save("成绩.xlsx")