关注我们

PYTHON实现爬虫技术

LzersLzers 安全文摘 2018-07-18 619538 0

Beautiful Soup,这个库的作用是从 HTML 或 XML 文件中抓出有效数据,用来集成在PYTHON中使用,不过需首先要去官网下载,本文将不讲述如何下载安装,直接开撸代码实现爬虫 :# coding=utf-8

 
import urllib
 
from bs4 import BeautifulSoup
 
url ='http://www.baidu.com/s'
 
values ={'wd':'美女'}
 
encoded_param = urllib.urlencode(values)
 
full_url = url +'?'+ encoded_param
 
response = urllib.urlopen(full_url)
 
soup =BeautifulSoup(response)
 
alinks = soup.find_all('a')
版权声明

本文仅代表作者观点,不代表黑白网立场。
如文章侵犯了您的权利,请通过邮箱联系我们删除。
详情查看:版权纠纷
E-Mail:server@heibai.org

喜欢1发布评论

评论列表

发表评论

  • 昵称(必填)
  • 邮箱
  • 网址