python 爬取网页是出现的错误
代码:
timeout = 10
socket.setdefaulttimeout(timeout)
sock = urllib2.urlopen(url)
html = sock.read()
一般情况能行,运行没问题,可有常常会突然报错
Traceback (most recent call last):
File "/usr/local/lib/python2.5/threading.py", line 486, in __bootstrap_inner
self.run()
File "spider_eastmoney.py", line 150, in run
next_page = parse_ (mysqlDB, http, html, mod_name)
File "spider_eastmoney.py", line 94, in parse_
page_html= http.get_html(pageurl)
File "/home/Spider/News/genericHttp.py", line 47, in get_html
File "/home/Spider/News/genericHttp.py", line 47, in get_html
html = sock.read()
File "/usr/local/lib/python2.5/socket.py", line 304, in read
data = self._sock.recv(rbufsize)
File "/usr/local/lib/python2.5/httplib.py", line 529, in read
s = self.fp.read(amt)
File "/usr/local/lib/python2.5/socket.py", line 328, in read
data = self._sock.recv(left)
timeout: timed out
这是什么问题,以前没遇过,我用了多线程,线程数我设为1,会不会是这个原因。
这不是很明显地写着receive timeout吗
我说,是什么原因造成的
网络情况造成的...
很正常....
这种情况需要你
相关问答:
我用了def CreateMyDialog(self):
dlg = MyDialog(None, -1, ''.decode('utf8'), (300,300), (300,200), wx.DEFAULT_DIALOG_STYLE | wx.DIALOG_NO_PARENT )
&nbs ......
刚接触,感觉功能比较强大,主要是粘合性好,可以有机结合其他语言。但不明白它主要应用于什么领域,主要做那方面的东东。开发ERP系统是否可行?
基本上什么都可以做
今天去看了一下,基本上什么 ......
请问下,我的是python2.5安装了PIL模块,然后编写程序打开本机上的一个图片时,为什么老出现错误呢,老是找不到图片,错误提示如下:File "C:\Python25\Lib\site-packages\PIL\Image.py", line 1888, in o ......
我想用sax包来解析xml, 要求如下:
Python code:
<?xml version="1.0" encoding="UTF-8"?>
<waf>
<policy> acl </policy>
<prot>
< ......