python 爬取网页是出现的错误
代码:
timeout = 10
socket.setdefaulttimeout(timeout)
sock = urllib2.urlopen(url)
html = sock.read()
一般情况能行,运行没问题,可有常常会突然报错
Traceback (most recent call last):
File "/usr/local/lib/python2.5/threading.py", line 486, in __bootstrap_inner
self.run()
File "spider_eastmoney.py", line 150, in run
next_page = parse_ (mysqlDB, http, html, mod_name)
File "spider_eastmoney.py", line 94, in parse_
page_html= http.get_html(pageurl)
File "/home/Spider/News/genericHttp.py", line 47, in get_html
File "/home/Spider/News/genericHttp.py", line 47, in get_html
html = sock.read()
File "/usr/local/lib/python2.5/socket.py", line 304, in read
data = self._sock.recv(rbufsize)
File "/usr/local/lib/python2.5/httplib.py", line 529, in read
s = self.fp.read(amt)
File "/usr/local/lib/python2.5/socket.py", line 328, in read
data = self._sock.recv(left)
timeout: timed out
这是什么问题,以前没遇过,我用了多线程,线程数我设为1,会不会是这个原因。
这不是很明显地写着receive timeout吗
我说,是什么原因造成的
网络情况造成的...
很正常....
这种情况需要你
相关问答:
各位高手,哪位能写个简单的通讯录,只保存姓名和手机号,能保存到硬盘并可读回,有添加,删除,修改,查询功能,命令行式的就行
这种活你得自己干,有问题可以问,但不会有人帮你做的。
给你源码
http://dow ......
像 C 的 scanf() 那样
比如读入 1 2 3 a b c
每次读入一个
下面这个应该是你想要的吧:
Python code:
>>> k = raw_input()
0 0123 ds dsl sd
>>> k
'0 0123 ds dsl sd'
>>> ......
#include <Python.h>
#include <string>
#include <vector>
#include <iostream>
using namespace std;
int main(int argc, char* argv[])
{
vector <string> ......
目前python的官网上好像下载不了东西,所以跑到这上面来问问,有没有人留有相应的家当,能否给小弟共享一份,什么平台下的都可以,谢谢!
怎么可能下不了?
下载页面貌似被墙了,上代理就行...
请问二楼能否讲 ......
我想用sax包来解析xml, 要求如下:
Python code:
<?xml version="1.0" encoding="UTF-8"?>
<waf>
<policy> acl </policy>
<prot>
< ......