资源说明:6.1 最简单的爬虫
网络爬虫是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成。python的urllib\urllib2等模块很容易实现这一功能,下面的例子实现的是对baidu首页的下载。具体代码如下:
复制代码 代码如下:import urllib2page=urllib2.urlopen(“http://www.baidu.com”)print page.read()
6.2 提交表单数据
(1)用GET方法提交数据提交表单的GET方法是把表单数据编码至URL。在给出请示的页面后,加上问号,接着是表单的元素。如在百度中搜索“马伊琍”得到url为http://
本源码包内暂不包含可直接显示的源代码文件,请下载源码包。