易截截图软件、单文件、免安装、纯绿色、仅160KB

python urllib urllib2 httplib 访问url的问题

我想用python解析网页中的url 在下载之前, 我想先发一个head请求 不需要下载整个网页, 先获得该网站的head信息, 读取一些信息之后 在调用这些库的read方法来读取整个网页 该怎么操作呢 多谢
帮顶了

有人能指教一下么 多谢

e.g.,
...
try:
content = None
content = urllib.urlopen(_url).info()['Content-Type']
print "*"*10, content, _url, urllib.urlopen(_url).info()

stext = 'text/plain'

if content[0:len(stext)] == stext :
urllib.urlretrieve(_url, _dest)

except IOError:
return 0

...

urllib.urlopen(_url).info()是只临时提交一个head请求, 把页面头部down下来么??

也就是说 我在调用urlopen的时候 是down下来一部分网页信息还是把整个网页信息都down下来放到缓存中,然后再调用read将数据打印出来呢? 现在这里不理解urlopen的过程 请指教 多谢了

有人能指教一下么 多谢


如果用的是 urllib2.urlopen呢 是不是也是先down个头信息, 然后在 read的时候才开始再次连接网站开始down具体内容呢? 多谢


相关问答:

python PIL模块打开图片问题

请问下,我的是python2.5安装了PIL模块,然后编写程序打开本机上的一个图片时,为什么老出现错误呢,老是找不到图片,错误提示如下:File "C:\Python25\Lib\site-packages\PIL\Image.py", line 1888, in o ......

python 在网站注册用户

rt
这个怎么实现,谢谢!

比如,我发现某个网站很好玩。我想用python写个程序注册到这个网站上。怎么实现?

up继续等回复


引用
对方可能有反auto机制,比如识别码等。所以你的工程量就大了。
......

python根据feedparser读取xml的时间

feedparser导入这个包 读xml的title,link 都没问题 就是时间读取不出来
错误:
print d['feed']['%s lastBuildDate']

return UserDict.__getitem__(self, realkey)
KeyError: ' ......

python访问网页带cookie问题

我现在要用python访问一个网站的网页,取得一些信息
但是网站要求先登录,然后才能继续访问,登录过程就是写了个cookie
请问下python访问网页怎么保持住cookie呢?

我用的是python3.1,只有urllib和htt ......
© 2009 ej38.com All Rights Reserved. 关于E健网联系我们 | 站点地图 | 赣ICP备09004571号