易截截图软件、单文件、免安装、纯绿色、仅160KB

关于用Python处理大量数据的问题

我现在要处理数百万条数据,处理过程是通过比较数据里是否有指定的字符串,再插入到另外的表中,请问用Python如何高效完成?先谢谢各位了。

建议:别直接跟数据库比较。太耗费IO。
把你需要比较的字段从数据库导出,然后再做文本之间的比较。

同意楼上的。这种大量操作,直接操作数据库肯定要快很多。如果你确定不能使用数据库来操作的话,可以考虑用C++写个简单代码来做,否则那你只好慢慢做了

我现在要处理数百万条数据,处理过程是通过比较数据里是否有指定的字符串,
====》直接用sql语句就可以实现

再插入到另外的表中
====》把符合条件的记录用事务添加到另一个表里。

引用
同意楼上的。这种大量操作,直接操作数据库肯定要快很多。如果你确定不能使用数据库来操作的话,可以考虑用C++写个简单代码来做,否则那你只好慢慢做了


不是很同样这位哥们的说法。我觉得这里的主要问题是对数据库中大量数据的操作,而不是具体编程语言的问题。

引用
我现在要处理数百万条数据,处理过程是通过比较数据里是否有指定的字符串,
====》直接用sql语句就可以实现

再插入到另外的表中
====》把符合条件的记录用事务添加到另一个表里。

请教一下,用SQL语句如何实现,我对SQL语句不太熟?我用的是MySQL


谢谢,我试试。

海量数据还是用数据库吧,不然要它干嘛的。当然如果能事先全部加载到内存更好了。


相关问答:

Python与接口

聊聊,我一直不是很理解为什么动态语言就不需要接口,我只是从建模的角度考虑,接口是一种合理的建模方式呀,特别是大的项目,而且代码容易维护。相比接口多重继承是一种很糟糕的方式。为什么动态语言就不需要接口, ......

python字典问题

d = {"a":"a","b":"b","c":"c"}
print d

为什么输出是:{'a': 'a', 'c': 'c', 'b': 'b'} ......

关于python读列数据

a.txt
文件内容如下(其中空白部分都是以tab键隔开):

om 2 0.68 0.83 0 0 0 0 0 0
pos
ppa 17 0.74 0.9 0 0 0 1 2 2
ppc    2           & ......

请问python和pyodc有什么区别

麻烦高手解答一下 谢谢了 我是新手 一些概念都不太清楚。。。
pyodbc is a Python module that allows you to use ODBC to connect to almost any database from Windows, Linux, OS/X, and more.

pyodbc是 ......
© 2009 ej38.com All Rights Reserved. 关于E健网联系我们 | 站点地图 | 赣ICP备09004571号