众所周知,HTTP 连接是无状态的,那么问题来了,怎么记录用户的登录信息呢?通常的做法是用户第一次发送HTTP请求时,在 HTTP Server 端生成一个 SessionID,SessionID 会对应每个会话的状态(比如是否登录,等等),并且将 SessionID 保存在浏览器的 cookies 中。我们登录一个网页后,打开另外一个窗口访问相同的网页不需要登录,就是因为两个网页都对应同一个 cookies。
有时在做 python 爬虫时,需要访问登录后才可以访问的网页,利用已经登录的 cookie 文件就可以达到此目的。下面以迅雷网为例来做实验,实验平台为 Linux。 阅读原文 »

3 收藏


直接登录
最新评论

推荐关注