>>> import copy
>>> a = [1,2,3,4,['a','v']]
>>> b = a
>>> b
[1, 2, 3, 4, ['a', 'v']]
>>> c = copy.copy(a)
>>> c
[1, 2, 3, 4, ['a', 'v']]
>>> d = copy.deepcopy(a)
>>> d
[1, 2, 3, 4, ['a', 'v']]
>>> a.append(5)
>>> a
[1, 2, 3, 4, ['a', 'v'], 5]
>>> b
[1, 2, 3, 4, ['a', 'v'], 5]
>>> c
[1, 2, 3, 4, ['a', 'v']]
>>> d
[1, 2, 3, 4, ['a', 'v']]
>>> a[4].append('c')
>>> a
[1, 2, 3, 4, ['a', 'v', 'c'], 5]
>>> b
[1, 2, 3, 4, ['a', 'v', 'c'], 5]
>>> c
[1, 2, 3, 4, ['a', 'v', 'c']]
>>> d
[1, 2, 3, 4, ['a', 'v']]
>>>
在Python中有一个非常重要也非常好用的模块re,在import re后,就能够在Python中使用正则表达式,源于此次项目要用正则表达式对html代码提取一定的字符,所以在这也就用些小例子来熟悉一下正则表达式
现在就用最简单的例子
import re
s='<title>http://www.baidu.com</title>'
print re.findall(r'&l ......
下面这个小工具包含了 判断unicode是否是汉字,数字,英文,或者其他字符。 全角符号转半角符号。 unicode字符串归一化等工作。 还有一个能处理多音字的汉字转拼音的程序,还在整理中。
#!/usr/bin/env python
# -*- coding:GBK -*-
"""汉字处理的工具:
判断unicode是否是汉字,数字,英 ......