python urllib urllib2 httplib 访问url的问题
我想用python解析网页中的url 在下载之前, 我想先发一个head请求 不需要下载整个网页, 先获得该网站的head信息, 读取一些信息之后 在调用这些库的read方法来读取整个网页 该怎么操作呢 多谢
帮顶了
有人能指教一下么 多谢
e.g.,
...
try:
content = None
content = urllib.urlopen(_url).info()['Content-Type']
print "*"*10, content, _url, urllib.urlopen(_url).info()
stext = 'text/plain'
if content[0:len(stext)] == stext :
urllib.urlretrieve(_url, _dest)
except IOError:
return 0
...
urllib.urlopen(_url).info()是只临时提交一个head请求, 把页面头部down下来么??
也就是说 我在调用urlopen的时候 是down下来一部分网页信息还是把整个网页信息都down下来放到缓存中,然后再调用read将数据打印出来呢? 现在这里不理解urlopen的过程 请指教 多谢了
有人能指教一下么 多谢
如果用的是 urllib2.urlopen呢 是不是也是先down个头信息, 然后在 read的时候才开始再次连接网站开始down具体内容呢? 多谢
相关问答:
请问下,我的是python2.5安装了PIL模块,然后编写程序打开本机上的一个图片时,为什么老出现错误呢,老是找不到图片,错误提示如下:File "C:\Python25\Lib\site-packages\PIL\Image.py", line 1888, in o ......
rt
这个怎么实现,谢谢!
比如,我发现某个网站很好玩。我想用python写个程序注册到这个网站上。怎么实现?
up继续等回复
引用
对方可能有反auto机制,比如识别码等。所以你的工程量就大了。
......
feedparser导入这个包 读xml的title,link 都没问题 就是时间读取不出来
错误:
print d['feed']['%s lastBuildDate']
return UserDict.__getitem__(self, realkey)
KeyError: ' ......
我现在要用python访问一个网站的网页,取得一些信息
但是网站要求先登录,然后才能继续访问,登录过程就是写了个cookie
请问下python访问网页怎么保持住cookie呢?
我用的是python3.1,只有urllib和htt ......