当前位置: 首页 > news >正文

【Python爬虫】使用python脚本拉取汽车网站品牌数据

示例代码说明:

在汽车之家网站拉取当月排行榜中汽车品牌、销量和价格信息,存为csv文档输出,使用正则表达式获取网页内容

import re
import pandas as pd
import requests

# 汽车之家车型列表页URL
url = 'https://cars.app.autohome.com.cn/carext/recrank/all/getrecranklistpageresult2?from=28&pm=2&pluginversion=11.65.0&model=1&channel=0&pageindex=1&pagesize=650&typeid=1&subranktypeid=1&levelid=0&price=0-9000&date=2025-02'
# 读取内容
urltext = requests.get(url).text
#汽车品牌
seriesnamedata = re.findall('"seriesname":"(.*?)"', urltext)
#汽车销量
righttextonedata = re.findall('"righttextone":"(.*?)"', urltext)
#去除销量列表中的空字符串
righttextonedataupdate=list(filter(None, righttextonedata))
#汽车价格
priceinfodata = re.findall('"priceinfo":"(.*?)"', urltext)
print('************************************---------------------------------***********************************')
# 转换为DataFrame并保存
if seriesnamedata:    
    df1 = pd.DataFrame({"品牌": seriesnamedata})
    df2 = pd.DataFrame({"销量": righttextonedataupdate})
    df3 = pd.DataFrame({"价格": priceinfodata})
    combined_df = pd.concat([df1, df2, df3], axis=1)
    combined_df.to_csv("autohome_brands.csv", index=False, encoding="utf_8_sig")
    print(f"成功提取 {len(combined_df)} 个品牌")
else:
    print("未找到品牌数据")

结果示例:

相关文章:

  • 1.NextJS基础
  • skynet网络包库(lua-netpack.c)的作用解析
  • 关于大数据的基础知识(四)——大数据的意义与趋势
  • AQS是什么,使用应注意什么
  • 【CXX-Qt】4.5 Traits
  • 【AndroidRTC-11】如何理解webrtc的Source、TrackSink
  • QML指示控件:ScrollBar与ScrollIndicator
  • 【江协科技STM32】Unix时间戳(学习笔记)
  • java 设置操作系统编码、jvm平台编码和日志文件编码都为UTF-8的操作方式
  • AI Agent开发大全第八课-Stable Diffusion 3的本地安装全步骤
  • FreeRTOS学习(九):中断管理
  • Android Compose框架的值动画(animateTo、animateDpAsState)(二十二)
  • 【MySQL】~/.my.cnf文件
  • 深入探讨MySQL数据库备份与恢复:策略与实践
  • EasyUI数据表格中嵌入下拉框
  • 【c++】【STL】unordered_set 底层实现总结
  • Spring Boot整合SSE实现消息推送:跨域问题解决与前后端联调实战
  • Siri接入DeepSeek快捷指令
  • matlab 模拟 闪烁体探测器全能峰
  • 计算机复试面试
  • 伊朗港口爆炸已致40人死亡
  • 哈马斯官员:只要以军持续占领,哈马斯就不会放下武器
  • 广汽集团一季度净亏损7.3亿元,同比转亏,总销量下滑9%
  • 财政部:前3月国有企业利润总额10907.4亿元,同比增1.7%
  • 马上评丨一些影视剧的片名,越来越让人看不懂
  • 央行:25日将开展6000亿元MLF操作,期限为1年期