关于用Python处理大量数据的问题
我现在要处理数百万条数据,处理过程是通过比较数据里是否有指定的字符串,再插入到另外的表中,请问用Python如何高效完成?先谢谢各位了。
建议:别直接跟数据库比较。太耗费IO。
把你需要比较的字段从数据库导出,然后再做文本之间的比较。
同意楼上的。这种大量操作,直接操作数据库肯定要快很多。如果你确定不能使用数据库来操作的话,可以考虑用C++写个简单代码来做,否则那你只好慢慢做了
我现在要处理数百万条数据,处理过程是通过比较数据里是否有指定的字符串,
====》直接用sql语句就可以实现
再插入到另外的表中
====》把符合条件的记录用事务添加到另一个表里。
不是很同样这位哥们的说法。我觉得这里的主要问题是对数据库中大量数据的操作,而不是具体编程语言的问题。
请教一下,用SQL语句如何实现,我对SQL语句不太熟?我用的是MySQL
谢谢,我试试。
海量数据还是用数据库吧,不然要它干嘛的。当然如果能事先全部加载到内存更好了。
相关问答:
最近用python写一个程序,总是异常退出,但是却没法用try..except来捕捉
由于没法发图片,所以把相关的信息打印出来
异常的信息大致如下:
python.exe遇到问题需要关闭。我们对此引起的不便表示抱歉 ......
RT,貌似Python之父也说如果你现在开始新的项目的话,最好是直接使用Python3,可是实际上大家使用得大部分还是2.5,估计用2.6的都不是很多,并且相对应的许多扩展都没有3对应的版本。
  ......
a.txt
文件内容如下(其中空白部分都是以tab键隔开):
om 2 0.68 0.83 0 0 0 0 0 0
pos
ppa 17 0.74 0.9 0 0 0 1 2 2
ppc 2 & ......
详细信息请查看:
http://blog.csdn.net/lgg201/archive/2009/10/08/4643635.aspx
Let's-python-系列视频发布专贴 收藏
视频较早的时候就说是要录了, 这一周录了第一集, 由于第一次录视频, ......