众所周知Windows下的文件删除之后是有可能恢复的,对重要文件,为了增加恢复的难度,我们可以用文件粉碎工具进行文件粉碎。我最常用的是集成到资源管理器中的Eraser。那么在Linux下有没有类似的软件呢?我在一台只有Ubuntu系统的主机上,安装了一个文件粉碎工具wipe,有些想法,记下来。
安装:apt-get install wipe
wipe有没有GUI我不知道,命令行也不难用:
粉碎一个文件:wipe 文件名
粉碎一个文件夹:wipe -rf 文件夹名
(更多用法,请参考 wipe -h)
虽然在命令行使用wipe挺简单,但是,在图形界面下,我们希望它能集成到类似于Windows的右键菜单里,那样我们就可以在浏览某个文件/文件夹的时候,直接点击右键,在菜单里执行wipe。要达到这种的效果,你首先需要一个工具 nautilus,安装方法:apt-get install nautilus-actions
安装了之后,在“系统”→“首选项”里就可以看到“Nautilus 动作配置”的选项了。点击进入之后,请按下面的步骤跟着我一起,将wipe集成到右键菜单中:
(1)点击工具栏的“Define a new action”按钮:
(2)在各个选项卡里分别如下设置:
Action选项卡:
Command选项卡:
Con ......
标题:配置VNC服务实现红旗Linux远程桌面访问
内容简介:
VNC (Virtual Network Computing)是虚拟网络计算机的缩写,是一款优秀的远程控制工具软件,由著名的AT&T的欧洲研究实验室开发。
下面介绍在“红旗Linux DC Server 5.0”和“红旗Linux 桌面版 6.0”操作系统中,配置VNC服务,实现客户端以“远程桌面”方式的连接访问。
一、红旗Linux DC Server 5.0下提供远程桌面服务:
服务器:RedFlag Linux DC Server 5.0
说明:RedFlag Linux DC Server 5.0已自带安装VNC Server的rpm包。无须单独安装。
配置和操作如下:
1. 配置VNC Server
编辑/etc/sysconfig/下的vncservers文件,添加VNC用户。
在vncservers文件末尾,加入如下一行:
-------------
VNCSERVERS="1:root"
--------------
注意:
*. 添加的用户(此处是根用户root),需是已经存在用户。
......
LINUX常用命令(基础)
1. man 对你熟悉或不熟悉的命令提供帮助解释
eg:man ls 就可以查看ls相关的用法
注:按q键或者ctrl+c退出,在linux下可以使用ctrl+c终止当前程序运行。
2. ls 查看目录或者文件的属*,列举出任一目录下面的文件
eg: ls /usr/man
ls -l
a.d表示目录(directory),如果是一个"-"表示是文件,如果是l则表示是一个连接文件(link)
b.表示文件或者目录许可权限.分别用可读(r),可写(w),可运行(x)。
3. cp 拷贝文件
eg: cp filename1 filename2 //把filename1拷贝成filename2
cp 1.c netseek/2.c //将1.c拷到netseek目录下命名为2.c
4. rm 删除文件和目录
eg: rm 1.c //将1.c这个文件删除
5. mv 移走目录或者改文件名
eg: mv filename1 filename2 //将filename1 改名为filename2
mv qib.tgz ../qib.tgz //移到上一级目录
6. cd 改变当前目录 pwd 查看当前所在目录完整路径
eg: pwd //查看当前所在目录路径
cd netseek //进入netseek这个目录
cd //退出当前目录
7. cat,more命令
将某个文件的内容显示出来。两个命令所不同的是:cat把文件内容一直打印出来,而 more则分屏显示
eg; cat>1.c //就可以把代码粘帖到1.c文件里,按ctrl+ ......
nutch的爬虫和搜索可以说是分离的两块,爬虫可以是M/R作业,但搜索不是M/R作业。搜索有两种方式:一是将爬虫数据(或者称索引数据)放在本地硬盘,进行搜索。二是直接搜索HDFS中的爬虫数据。
这里介绍如何使用nutch-1.0的WEB前端检索本地爬虫数据:
(1)Nutch的搜索可以独立于hadoop集群,只要将爬虫下来的数据copy到任何机器,在此机器上安装一个tomcat,并运行nutch自带的WEB前端程序并做相应配置,就可实现搜索。
(2)将使用命令bin/nutch crawl -dir data -depth 3 -topN 5爬虫下下来的数据data放在本地某目录下(如果是分布式爬虫,可以使用命令" bin/hadoop dfs -copyfromLocal data 本地目录" 将爬虫数据data复制到本地目录),例如将生成的data目录复制到/home/nutch/nutchinstall/crawltest/目录下。(安全起见,请确保目录路径中没有空格,这个可能有影响)。
说明:
data目录是爬虫生成的目录,下面有这些子目录:crawldb,index,indexes,linkdb,segments
(3)安装tomcat,请确保安装路径没有空格,这很重要,在windows上因为有空格导致搜索结果始终为0.
(4)将Nutch主目录下的WEB前端程序nutch-1.0.war复制到 /usr/program/apache-tomcat-6.0.18/webapps/目录下(a ......
Linux下单机配置Nutch
1.环境介绍
操作系统:Red hat linux 9
Nutch版本:nutch-0.9,下载:http://apache.etoak.com/lucene/nutch/
JDK版本:JDK 1.6
Apache Tomcat版本:apache-tomcat-6.0.18
http://apache.etoak.com/tomcat/tomcat-6/v6.0.18/bin/apache-tomcat-6.0.18.tar.gz
2.配置前提
2.1 安装jdk 1.6
首先下载jdk安装包jdk-1_6_0_13-linux-i586-rpm.bin
第一步:# chmod +x jdk-1_6_0_13-linux-i586-rpm.bin (获得执行权限)
第二步:# ./jdk-1_6_0_13-linux-i586-rpm.bin (生成rpm安装包)
第三步:# rpm -ivh jdk-1_6_0_13-linux-i586.Rpm(安装JDK)
安装完毕后,jdk默认安装在/usr/java/目录下。
第四步:配置JAVA环境变量。
在/etc/profile中设置环境变量
[root@red-hat-9 root]# vi /etc/profile
加入以下语句:
JAVA_HOME=/usr/java/jdk1.6.0_13
export JAVA_HOME
CLASSPATH=.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib (注意是冒号)
export CLASSPATH
PATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH
[root@red-hat-9 root ......
Linux下Nutch分布式配置和使用
目 录
介绍. 2
0 集群网络环境介绍. 2
1 /etc/hosts文件配置. 2
2 SSH无密码验证配置. 2
2.1配置所有节点之间SSH无密码验证. 2
3 JDK安装和Java环境变量配置. 3
3.1 安装 JDK 1.6 3
3.2 Java环境变量配置. 4
4 Hadoop集群配置. 4
5 Hadoop集群启动. 6
6 Nutch分布式爬虫. 9
6.1配置Nutch配置文件. 9
6.2 执行Nutch分布式爬虫. 10
7 Nutch检索. 13
7.1 Windows下Nutch单机搜索本地索引数据. 13
7.2 Linux下Nutch单机搜索本地索引数据. 14
7.2.1 WEB前端搜索. 14
7.2.2 命令行搜索. 15
7.3 Linux下Nutch搜索HDFS中索引数据. 15
7.3.1 WEB前端搜索. 16
7.3.2 命令行搜索. 17
附 Nutch-1.1 介绍. 18
介绍
这是本人在完全分布式环境下在Cent-OS中配置Nutch-1.1时的总结文档,但该文档适合所有Linux系统和目前各版本的nutch。
0 集群网络环境介绍
集群中所有节点均是Cent-OS系统,防火墙均禁用,sshd服务均开启;所有节点上均有一个名为nutch的用户(非超级用户,安装前root使用useradd添加),用户主目录是/home/nutch。
&nbs ......