初学者求助:使用python进行文本搜索
现在有一个文本,内容如下:
>>cat a.txt
a=1,befc
a=11,azxv
a=2,azvf
a=231,fffe
a=24,zefg
需求:
写一完整python程序对其字符串进行排序处理,排序结果如下:
a=1,befc
a=2,azvf
a=11,azxv
a=24,zefg
a=231,fffe
先自己顶一个^_^
这样就可以了
Python code:
import re
file_a = open('a.txt')
pattern = re.compile('a=(\d+),(\w+)')
dict_1 = {}
for line in file_a:
s = pattern.match(line).group(1)
dict_1[int(s)] = line
list_1 = dict_1.keys()
list_1.sort()
for i in list_1:
print dict_1[i]
def my_cmp(a, b ):
a_value = int(a.lstrip('a=').split(',')[0])
b_value = int(b.lstrip('a=').split(',')[0])
return cmp(a_value, b_value)
lines = [ l.strip() for l in open('t.txt') if l.strip() ]
for l in sorted(lines, cmp = my_cmp):
print l
大型文件可能会挂掉
大型文件
http://code.activestate.com/recipes/576755/
多谢各位大侠,按二楼、三楼的code已经验证okay,再请教下:
如果文本变成多段,每段通过/*CSDN*/分开,中间有空行。段的数量实际情况很多,并且每段数字前的索引相同,但不同段间的索引不同)
>>cat a.t
相关问答:
请问下,我的是python2.5安装了PIL模块,然后编写程序打开本机上的一个图片时,为什么老出现错误呢,老是找不到图片,错误提示如下:File "C:\Python25\Lib\site-packages\PIL\Image.py", line 1888, in o ......
s='aaa111aaa,bbb222,333ccc,444ddd444,555eee666,fff777ggg'
用正则表达式取出 前后字母相同的数据 结果如下:
111 ddd
谢谢~
Python code:
import re
s='aaa111aaa,bbb222,333ccc,444ddd444,555eee666,ff ......
rt
这个怎么实现,谢谢!
比如,我发现某个网站很好玩。我想用python写个程序注册到这个网站上。怎么实现?
up继续等回复
引用
对方可能有反auto机制,比如识别码等。所以你的工程量就大了。
......
我想用python解析网页中的url 在下载之前, 我想先发一个head请求 不需要下载整个网页, 先获得该网站的head信息, 读取一些信息之后 在调用这些库的read方法来读取整个网页 该怎么操作呢 多谢
帮顶了
有人能指教一 ......