#filename Seek.py
import unicodedata
import sys
import os
class Seek():
"""
功能:查找中文,并替换成指定字符或字符串
使用方法:python脚本用法
参数说明:
-d : 文件目录(绝对或相对路径)(默认为脚本所在目录)
-t : 文件类型(文件名后缀,如.jsp;.txt)(默认为所有文件)
-sf : 是否包括子目录(Y|N)(option,默认不包括子目录)
-r : 输出文件名(option,默认为'ChineseCharacter.txt'),位于脚本目录下
-encoding:文件字符编码(默认为utf-8)
"""
def __init__(self):
"""
&n ......
总结下,Python 下载网页的几种方法
1
fd = urllib2.urlopen(url_link)
data = fd.read()
这是最简洁的一种,当然也是Get的方法
2
通过GET的方法
def GetHtmlSource(url):
try:
htmSource = ''
req = urllib2.Request(url)
fd = urllib2.urlopen(req,"")
while 1:
data = fd.read(1024)
if not len(data):
break
  ......
import urllib2
import time
import socket
from datetime import datetime
from thread_pool import *
def main():
url_list = {"sina":"http://www.sina.com.cn",
"sohu":"http://www.sohu.com",
"yahoo":"http://www.yahoo.com",
"xiaonei":"http://www.xiaonei.com",
"qihoo":"http://www.qihoo.com",
"laohan":"http://www.laohan.org",
"eyou":"http://www.eyou.com",
"chinaren":"http://www.chinaren.com",
"douban":"http://www.douban.com",
"163":"http://www.163.com",
"daqi":"http://www.daqi.com",
"qq":"http://www.qq.com",
"baidu_1":"http://www.baidu.com/s?wd=asdfasdf",
"baidu_2":"http://www.baidu.com/s?wd=dddddddf",
"google_1":"http://www.baidu.com/s?wd=sadfas",
"google_2":"http://www.baidu.com/s?wd=sadflasd",
"hainei":"http://www.hainei.com",
......
1、str类型可以理解为一个二进制block,或multibyte
2、multibyte_str.decode("<multibyte_encode_method>") -> unicode
3、unicode_str.encode("<multibyte_encode_method>") -> multibyte_str(binary block)
4、unicode_str 的操作参数也应为unicode,如:unicode_str.find("样本".decode("utf-8"))
5、代码里的u前缀会自动生成unicode字符串(它跟据源码首部的#coding:*** 段来决定应该怎样由multibyte生成unicode)
6、python 的print将输出binary block给console,colsole将用系统的multibyte_encode_method为显示这些binary block
REF
http://blog.sina.com.cn/s/blog_620c017e0100erh8.html ......
对于个人版,使用了.NET,安装完企业版后,看了看目录,发现大量python脚本。dll中也有sqlite3.dll
C:\Program Files\China Mobile\Efetion目录下文件:
Addin
boost_python.dll
bz2.pyd
dbghelp.dll
EFetion.exe
EFetion.exe.manifest
EFWP.exe
EFXLiveUpdate.exe
EFXLiveUpdate.exe.manifest
Face
Help.chm
icon.ico
image
Installed_PlugIns.XML
install_flash_player_ax_10d.exe
library
library.zip
medianetsetting.xml
mfc71.dll
msvcp71.dll
msvcp90.dll
MSVCR71.dll
MSVCR71D.dll
msvcr90.dll
netsetting.xml
pinyin.txt
pyAgent.dll
pyexpat.pyd
pymedia
python24.dll
pythoncom24.dll
pywintypes24.dll
ReleaseNote.txt
select.pyd
sensmon.ocx
shell.pyd
Sound
sqlite3.dll
theme
unicodedata.pyd
unicows.dll
uninst.exe
w9xpopen.exe
win32api.pyd
win32clipboard.pyd
win32event.pyd
win32gui.pyd
win32help.pyd
win32pdh.pyd
win32process.pyd
win32trace.pyd
win32ui.pyd
winxpgui.pyd
wxbase28uh_net_vc.dll
wxbase28uh_vc.dll
wxbase28uh_xml_vc.dll
wxmsw28uh_adv_vc.dll
wxmsw28uh_core_vc. ......
假设你你的操作系统是WinXP:
开始菜单-> 运行-> cmd
然后就可以敲命令了。
如果你用IDLE,可以用IDLE打开这个.py文件,然后在菜单 "Run "下有一项 "Run Module ",点击即可。 ......