Heritrix网络爬虫对BDB嵌入式数据库的应用(JAVA)
Heritrix网络爬虫对BDB嵌入式数据库的应用(JAVA)
一、Heritrix中和BDB相关的类
org.archive.bdb.BdbModule 用来映射一个共享的BDB数据库环境(JE)的通用模型。
org.archive.bdb.BdbModule.BdbConfig 数据库配置对象。必需的,因为com.sleepycat.je.DatabaseConfig这个对象是不会被序列化的。此外它还可以防止无效设置。(所有通过这个模型打开的数据库必需是deferred-write模式的,因为不这样的话这些数据库就不能调sync()方法,并且你不能在第一次调sync()方法前来运行一个checkpoint检查点。)
org.archive.checkpointing.Checkpoint 代表一个用来检查BDB数据库名称和BDB主存储目录的检查点。
相关文档:
在成功实现Java调用C++之后,接下来想到能否通过JNA实现Java调用Fortran,今天试验了一下,还是比较容易的。
网上有一个Java调用F95的例子,但是我考虑不仅要实现F95的调用,还要实现F77的调用,所以费了一些周折。
问题的关键在于F77为过程名自动添加了一个尾部的下划线,所以sub1这个过程,到Java一端,就变成了sub1_, ......
写入时,先做encode:
public static String encode(String src) {
String result = null;
try {
result = new String(src.getBytes("gbk"), "ISO-8859-1");
} catch (UnsupportedEncodingException uee) {
System.err.println(uee);
}
return result;
}
读出时,再做decode:
public static String deco ......
JAVA中位运算符包括: & | ~ ^ << >> >>>
一、首先要搞清楚参与运算的数的位数:
java的8种基本类型:byte,short, char, int, long,float,double,boolean.
在内存中固定长度(字节):1&nbs ......
通过 Groovy 进行循环
同大多数脚本语言一样,Groovy 经常被宣传为生产力更高 的 Java 语言替代品。您已经看到了 Groovy 缺少类型能够如何减少打字工作。在这一节,将创建并试用一个 repeat 函数。在这个过程中,将进一步探索 Groovy 提高效率的方式。
更好、更短的循环
下面这种方法可以更好地感受 Groovy 缺乏类型的好 ......