您的位置 首页 > 数码极客

『手机如何登录新浪微博账号』新浪微博如何显示手机型号…

  • 一、前期准备:

编译环境:Python 3.4

Python库:requests、re、urllib、BeautifulSoup

  • 二、实现分析:

尝试爬虫登陆网站时,会涉及到很多Javascript、验证码、cookies等很多的问题,为了避免太麻烦的登陆方式,我建议大家访问对应网站的移动版。比如访问新浪微博的移动版: ,登陆网址为,登陆界面为:

登陆界面比较简单,不涉及验证码和Javascript处理的问题。

分析网页源码,登陆主要需要填写一个表格的数据,表单数据名分别为: 'tryCount'、'submit'、'vk'、'password_7659'、'backURL'、'remember'、'mobile'、'backTitle',这其中'password_7659'和'mobile'需要自己填写对应的密码和账户名,其余的直接提取原网页的数据即可。

这里,新浪对输入元素名做了处理,每次访问得到的password元素名都不相同,连接了一个四位的随机数字,所以提取password时需要用正则匹配出来。

登陆后需要保存cookie,我这里使用的request库的session模块,可以维持一个长时间的登陆状态。

  • 三、源码

此源码实践时,请填入自己的账号密码。


  1. #!/usr/bin/python3
  2. import requests
  3. from bs4 import BeautifulSoup
  4. from urllib.request import urlopen
  5. import re
  6. #头信息,可以伪装为浏览器访问
  7. myHeaders = {}
  8. myHeaders["User-Agent"] ="Mozilla (X11; Ubuntu; Linux x86_64; rv:42.0) Gecko/20100101Firefox;
  9. myHeaders["Accept"] ="text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8"
  10. #登陆网址
  11. login_url =""
  12. print("====> The login_url: "+ login_url)
  13. print("====> Visit login_url...")
  14. login_reponse =reque(login_url,headers = myHeaders)
  15. #转化为BeautifulSoup对象
  16. bsObj = BeautifulSou;lxml")
  17. #提取出表单中的post网址
  18. action_url =b("form").attrs["action"]
  19. action_url = login_url + action_url
  20. print("====> The action_url: "+ action_url)
  21. print("====> Visit action_url...")
  22. #提取表单中的元素散列
  23. submit_dict = {}
  24. input_values = b("form").findAll("input")
  25. for in_value in input_values:
  26. #name值作为主键,value作为值
  27. if"name" in in_value.attrs:
  28. if"value" in in_value.attrs:
  29. submit_dict[in_value.attrs["name"]]= in_value.attrs["value"]
  30. else:
  31. submit_dict[in_value.attrs["name"]]= ""
  32. #对于随机的password元素名,需要用正则提取
  33. i(r"password.*",in_value.attrs["name"]):
  34. #这里填入自己的密码
  35. submit_dict[in_value.attrs["name"]]= "************"
  36. i["name"] == "remember":
  37. submit_dict[in_value.attrs["name"]]= "on"
  38. i["name"] == "mobile":
  39. #这里填入自己的账号
  40. submit_dict[in_value.attrs["name"]]= "*************"
  41. session = reque()
  42. s = (action_url,params =submit_dict,headers = myHeaders)
  43. print("Login Success")
  44. #输出登陆成功后微博主页的内容
  45. prin)
  46. #我们这里尝试发一条微博
  47. s =("/")
  48. submit_url =BeautifulSou;lxml").find("form",action =re.compile("/mblog/sendmblog\?st=.*")).attrs["action"]
  49. weibo_content ={"rl":"0"}
  50. weibo_content["content"] = "微博测试~"
  51. s = ("/"+submit_url,params= weibo_content,headers = myHeaders)

责任编辑: 鲁达

1.内容基于多重复合算法人工智能语言模型创作,旨在以深度学习研究为目的传播信息知识,内容观点与本网站无关,反馈举报请
2.仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证;
3.本站属于非营利性站点无毒无广告,请读者放心使用!

“手机如何登录新浪微博账号,新浪微博如何显示手机型号,手机如何登录新浪微博邮箱,手机如何注册新浪微博账号,手机如何登录微博电脑版,如何在新手机登录微博”边界阅读