当前位置: 首页 > news >正文

赶集网(Python)

代码:

import requests

import re

import xlwt

base_url = "https://xa.58.com/zufang/pn{}"

header = {

    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/122.0.0.0 Safari/537.36 Edg/122.0.0.0"

}

def get_data(url):

    try:

        resp = requests.get(url, headers=header)

        if resp.status_code == 200:

            print("请求成功!")

            parse_data(resp.text)

        else:

            print("请求失败!")

    except requests.RequestException as e:

        print(f"请求错误: {e}")
 

def parse_data(data):

    houses = re.findall(r'<li.+?house-cell.+?<a[^>]*?>(.*?)</ a>.+?room">(.*?)</p >.+?class="strongbox">(.*?)</b>', data,

                        re.DOTALL)

    house_list = []

    for h in houses:

        sublist = [h[0].strip(), h[1].strip(), h[2].strip()]

        house_list.append(sublist)

    print(house_list)

    save_data(house_list)

def save_data(house_list):

    workbook = xlwt.Workbook()

    sheet = workbook.add_sheet("赶集网1")

    for row, data in enumerate(house_list):

        for col, value in enumerate(data):

            sheet.write(row, col, value)

    workbook.save("赶集网1.xls")  # 修改为.xls
 

if __name__ == '__main__':

    for i in range(1, 6):

        print(f"开始请求第{i}页数据")

        get_data(base_url.format(i))

相关文章:

  • C++ 指针从入门到精通实战:全面掌握指针的概念与应用
  • 第六讲 | vector的使用及其模拟实现
  • 绿算轻舟系列FPGA加速卡:驱动数字化转型的核心动力
  • 敏感数据触发后怎么保障安全?
  • Windows10 微软五笔 造词造句
  • 矩阵求导 Ref 0
  • 跨境电商中的几种支付方式——T/T、L/C、D/P、D/A、O/A
  • 【新能源汽车压力采集与数据处理技术方案:从传感器到智能分析的硬核实战指南】
  • The first day of vue
  • openGauss新特性 | 自动参数化执行计划缓存
  • 三层架构与分层解耦:深入理解IOC与DI设计模式
  • 微信小程序实现table样式,自带合并行合并列
  • 网络中的基本概念
  • 虚幻引擎 Anim To Tex| RVT | RT
  • CTF web入门之文件上传
  • 【STL】set
  • 判断一棵树是不是另一棵树的子树
  • 容器实战高手课笔记 ----来源《极客时间》
  • 【C到Java的深度跃迁:从指针到对象,从过程到生态】第一模块·认知转型篇 —— 第二章 开发环境全景搭建:从gcc到JVM的范式迁移
  • 聊聊价值投资
  • 上海通报5起违反中央八项规定精神问题
  • 第五届全国医院人文管理路演在昆山举办:患者体验才是温度计
  • 扎克伯格怕“错过风口”?Meta AI数字伴侣被允许与未成年人讨论不当话题
  • 经济日报:多平台告别“仅退款”,规则调整有何影响
  • 广州一人均500元的日料店回收食材给下一桌?市场监管部门介入调查
  • 新版国家卫生监督抽查计划发布,首次明确打击网络“医托”