当前位置: 首页 > news >正文

python康复日记-request库的使用,爬虫自动化测试

一,request的简单应用

#1请求地址
URL='https://example.com/login'
#2参数表单
form_data = {
    'username': 'admin',
    'password': 'secret'
}
#3返回的响应对象response
response = requests.post(
    URL,data=form_data,timeout=5
)
#4处理返回结果,这里直接打印返回网页的正文。通常需要json转化,和encode编码下
print(reponse.content)

1,请求头需要设置,有些网站会限制访问

    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36',
        'Referer': 'https://www.99csw.com/',
        'Accept-Language': 'zh-CN,zh;q=0.9'
    }

    try:
        # 发送HTTP请求
        response = requests.get(url, headers=headers, timeout=15)

2,response的属性

发送request请求后,返回的reponse对象里有我们要的信息,需要处理。常用的3个标粗了。

属性/方法类型/返回类型说明
status_codeintHTTP 状态码(如 200、404、500)
headersCaseInsensitiveDict响应头字典(不区分大小写)
textstr解码后的文本内容(自动根据 encoding 解码)
contentbytes原始字节内容(未解码的二进制数据)
json()dict/list解析 JSON 响应内容(非 JSON 内容会抛异常)
urlstr最终请求的 URL(含重定向后的地址)
encodingstr响应内容的编码格式(可手动修改)
apparent_encodingstr通过内容分析出的编码格式(自动检测)
rawHTTPResponse原始响应流对象(需配合 stream=True 使用)
cookiesRequestsCookieJar服务器返回的 Cookies
elapseddatetime.timedelta请求耗时(从发送到响应完成的时间)
historylist[Response]重定向历史记录列表
reasonstr状态码的文本描述(如 200 → "OK",404 → "Not Found")
requestPreparedRequest关联的请求对象(含请求头、方法、URL 等信息)

rep = reponse.content.decode('utf8'),content获取的正文是二进制,注意编码。

正文处理通常需要 json格式化 和 re正则模块 的匹配。

#对返回content正文中,span标签的获取,标题内容获取
pattern1 = re.compile(r'<span class="title">([^&]*?)</span>')
titles = pattern1.findall(resp.text)

3,session会话保持

相关文章:

  • 【2025】基于springboot+vue的校园创新创业竞赛平台设计与实现(源码、万字文档、图文修改、调试答疑)
  • 使用Mastra.ai构建AI智能体:一次动手实践
  • 年龄预测识别模型训练python代码
  • PostgreSQL 事务处理
  • AI大模型全攻略:原理 · 部署 · Prompt · 场景应用
  • AI本地部署之dify
  • 【LNMP】网站架构分布式部署
  • 智能体(Agent)入门,智能体构建方法、工具链与应用策略;大语言模型的本地化部署、优化
  • 【AI学习从零至壹】PyTorch模型训练相关要素
  • 亚马逊云科技全面托管DeepSeek-R1模型现已上线
  • 第二节第一部分:String字符串
  • 建库字符集选择`utf8mb4` + `utf8mb4_unicode_ci` 组合
  • 第三讲 | C/C++内存管理完全手册
  • 3. 轴指令(omron 机器自动化控制器)——>MC_CamIn
  • 在VMware17中安装使用Ubuntu虚拟机
  • 数据结构笔记
  • R语言结构方程模型(SEM)在生态学领域中的应用
  • 【HTML5】02-列表 + 表格 + 表单
  • 堆外内存 OOM:现象分析与优化方案
  • kubeval结合kube-score实现k8s yaml文件校验
  • 怎样更加贴近中国消费者,运动品牌给出“本地化”选择
  • 只在上海!德国剧团新作亚洲首演:一张古典与流行的声音网络
  • 视频丨伊朗阿巴斯港一处油罐发生高强度爆炸:造成大面积破坏,伤亡不明
  • 利用AI捏造“天价骨灰盒”谣言,内蒙古包头一网民被行政处罚
  • 准“90后”山西壶关县委常委、副县长高雅亭赴北京密云挂职
  • 国家市场监管总局:组织销毁侵权假冒服装、食药等3300吨