python urllib urllib2 httplib 访问url的问题
我想用python解析网页中的url 在下载之前, 我想先发一个head请求 不需要下载整个网页, 先获得该网站的head信息, 读取一些信息之后 在调用这些库的read方法来读取整个网页 该怎么操作呢 多谢
帮顶了
有人能指教一下么 多谢
e.g.,
...
try:
content = None
content = urllib.urlopen(_url).info()['Content-Type']
print "*"*10, content, _url, urllib.urlopen(_url).info()
stext = 'text/plain'
if content[0:len(stext)] == stext :
urllib.urlretrieve(_url, _dest)
except IOError:
return 0
...
urllib.urlopen(_url).info()是只临时提交一个head请求, 把页面头部down下来么??
也就是说 我在调用urlopen的时候 是down下来一部分网页信息还是把整个网页信息都down下来放到缓存中,然后再调用read将数据打印出来呢? 现在这里不理解urlopen的过程 请指教 多谢了
有人能指教一下么 多谢
如果用的是 urllib2.urlopen呢 是不是也是先down个头信息, 然后在 read的时候才开始再次连接网站开始down具体内容呢? 多谢
相关问答:
已知Python 中:
s = unicode("测试", "gb2312")
s = u'\u6d4b\u8bd5'
print s
测试
在Delphi里面如何将\u6d4b\u8bd5这样的还原成Gb2312的汉字呢?
找到个方法
......
请问下,我的是python2.5安装了PIL模块,然后编写程序打开本机上的一个图片时,为什么老出现错误呢,老是找不到图片,错误提示如下:File "C:\Python25\Lib\site-packages\PIL\Image.py", line 1888, in o ......
我现在有一个需求是这样的
我有2个类
class A
{
public:
int val;
}
class B
{
public:
A a
}
现在在脚本中只能
b.a.val = 1
我在python中想使用
b.a = 1
......
我现在要用python访问一个网站的网页,取得一些信息
但是网站要求先登录,然后才能继续访问,登录过程就是写了个cookie
请问下python访问网页怎么保持住cookie呢?
我用的是python3.1,只有urllib和htt ......