爬虫基础之http协议

张开发
2026/4/20 2:01:01 15 分钟阅读

分享文章

爬虫基础之http协议
HTTP和HTTPS协议HTTP/HTTPS是客户端和服务端交流用的语言是应用层的协议以TCP为基础。过程解析urlDNS解析TCP连接建立发送http请求报文得到http响应http报文请求报文请求行 方法、路径、版本GET /index.html HTTP/1.1请求头 域名useragent语言Host: www.example.com │ │ User-Agent: Mozilla/5.0 │ │ Accept-Language: zh-CN空行 (CRLF)body 内容可选。http常用的方法get 搜索、筛选、分页等查询操作请求资源通常没有body暴露在 URL 中post登录、提交表单、上传文件等发送数据有body数据隐藏在body中。cookie和sessioncokkie和session是为了解决HTTP无状态的特性场景网上购物没有状态 每步都要重新登录、重新选择体验极差。Cookie给客户端发身份证解决方案思路服务器我记不住你但我给你一张身份证你每次来都带上。【第一次访问】客户端 → 服务器我要登录服务器 → 客户端登录成功给你身份证Cookie: user_id10086【后续请求】客户端 → 服务器我要看购物车带上身份证Cookie: user_id10086服务器 → 客户端好的这是 10086 用户的购物车Cookie 解决了什么表格问题解决方式识别用户通过 ID 知道你是谁保存偏好记住语言、主题设置追踪行为记录浏览历史推荐系统

更多文章