当前位置: 首页 > news >正文

爬虫学习笔记(三)--Http协议

思维导图

上面思维导图提取的原文是2026王道计网P286~290 

URL最前面(URL传输过程中遵循HTTP协议)

协议

计算机传输的数据实际上就是二进制0和1,协议就是规定这一串二进制数字的前几位代表什么、中间几位代表什么、后几位代表什么

HTTP(超文本传输协议)-无连接、可靠

传递网站相关内容的基本都用HTTP,因为对于超文本HT进行了规定,网页源代码采用的就是超文本标记语言HTML

 HTTP报文结构

请求头常见

User-Agent:请求载体的身份标识(用什么浏览器、什么操作系统、设备访问的)

Referer:防盗链--这次请求是从哪个页面来的(反爬会用到)

cookie:本地字符串数据信息(用户登录信息,反爬的token)

响应头常见

cookie:同请求头

token字样的字符串:防止各种攻击和反爬

请求方式

get:查询--显式提交

post:更改--隐式提交

相关文章:

  • 厚铜PCB如何兼顾质量与成本?供应商设计规范执行的黄金平衡点
  • 【行业特化篇2】金融行业简历特化指南:合规性要求与风险控制能力的艺术化呈现
  • 软考-软件设计师中级备考 6、数据结构 图
  • 鸿蒙NEXT开发组件截图和窗口截图工具类SnapshotUtil(ArkTs)
  • 榕壹云信用租赁系统:基于ThinkPHP+MySQL+UniApp的全链路免押租赁解决方案
  • 声纹监测技术在新能源汽车的应用场景解析
  • FPGA-数字时钟
  • 深入浅出限流算法(一):简单但有“坑”的固定窗口计数器
  • ORM、Hibernate 与 MyBatis 详解:选择合适的框架
  • 2025年渗透测试面试题总结-拷打题库24(题目+回答)
  • Ethan独立开发产品日报 | 2025-04-27
  • 系统架构-DSSAABSD
  • Django 缓存框架
  • 华为云空间安卓版存储扩展与文件管理体验测评
  • AI大模型学习十四、白嫖腾讯Cloud Studio AI环境 通过Ollama+Dify+DeepSeek构建生成式 AI 应用-接入DeepSeek大模型
  • 使用 ELK 实现全链路追踪:从零到一的实践指南
  • 阿里云服务器(ECS)基础指南:从入门到核心场景解析​
  • ubuntu新增磁盘挂载
  • Jackson 使用方法详解
  • 操作系统八股问——连载ing
  • 赛力斯拟赴港上市:去年扭亏为盈净利59亿元,三年内实现百万销量目标
  • 消费维权周报|上周违规经营类投诉较多,涉诱导加盟等
  • 当隐身13年的北小京决定公开身份 ,专业戏剧评论依然稀缺
  • 张译、惠英红分获第二十届中国电影华表奖优秀男、女演员奖
  • 伊朗外长:美伊谈判进展良好,讨论了很多技术细节
  • 保时捷中国研发中心落户上海虹桥商务区,计划下半年投入运营