易截截图软件、单文件、免安装、纯绿色、仅160KB

Linux 下 将PDF文件中的文本,图片导出的方法。


PDF格式文件中的文本是可以导出来再修改的。
同样,PDF里面的插图也是可以提取出来的。
PDF转纯文本:
pdftotext -enc GBK godson2e-data.Sheet.pdf text.GBK.txt
-enc (encoding)
要参照/etc/xpdf/xpdfrc 里面提到的编码格式。对于中文,用GBK
就可以了。
提取插图:
pdfimages godson2e-data.Sheet.pdf img
该命令就生成N个PPM文件,(一种BMP格式)
文件名为img-00?.ppm
? = (1 ~ N)
可以用ImageMagick里面的convert工具将其转换成相要的格式:
convert img-001.ppm img-001.jpg

convert img-001.ppm img-001.eps 
上述方法在ubuntu下测试通过。
其中,pdfimages, pdftotext来自xpdf-utils包,xpdf的中文编码
支持来自xpdf-chinese-simplified包。换句话说,要实现上述功能
得安装:
xpdf-utils
xpdf-chinese-simplified
安装方法:
aptitude install xpdf-utils xpdf-chinese-simplified
如果没有aptitude,可以用apt-get
apt-get install xpdf-utils xpdf-chinese-simplified


相关文档:

Linux设备模型之input子系统详解

一:前言
最近在研究android的sensor driver,主要是E-compass,其中用到了Linux input子系统.在网上也看了很多这方面的资料,感觉还是这篇分析的比较细致透彻,因此转载一下以便自己学习,同时和大家分享!
(这篇博客主要是以键盘驱动为例的,不过讲解的是Linux Input Subsystem,可以仔细的研究一下!)
键盘驱动将检 ......

[转]Linux 汇编器:对比 GAS 和 NASM

Linux 汇编器:对比 GAS 和 NASM
对比 GNU Assembler(GAS)和 Netwide Assembler(NASM)
Ram Narayam (rnaraya2@in.ibm.com), 软件工程师, IBM
2007 年 11 月 05 日
本文解释两种最流行的 Linux® 汇编器 —— GNU Assembler(GAS)和 Netwide Assembler(NASM) —— 之间一些比较重要的语法 ......

新手看招 实用的Ubuntu Linux命令大全

1 文件管理 # ls ls -a 列出当前目录下的所有文件,包括以.头的隐含文件
文件管理 # ls ls -l或ll 列出当前目录下文件的详细信息
文件管理 # pwd pwd 查看当前所在目录的绝对路经
文件管理 # cd cd .. 回当前目录的上一级目录
文件管理 # cd cd - 回上一次所在的目录
文件管理 # cd cd ~ 或 cd 回当前用户的宿主目录
......

8个最好的Linux平台商业智能(BI)软件

商业智能工具是从不同类型的数据源中挖掘数据,用来设计和产生报表。商业智能软件类型也很多,包括报表和查询软件,数字仪表盘,处理和数据挖掘,经营绩效
管理以及电子数据表等。一般一个商业智能平台包括三个层面:数据层,商业智能层,分析/绩效管理层。本文将介绍8个最好的Linux平台下商业智能软件:
Pentaho:提供企 ......

实用技巧:Linux系统下文件权限设置方法

  Windows系统其实和Linux系统有相似的地方,Windows系统文件、目录的属性有只读、隐藏,而Linux也一样。 Linux中,每一个文件都具有特定的属性。主要包括文件类型和文件权限两个方面。可以分为5种不同的类型:普通文件、目录文件、链接文件、设备文件和管道文件。 所谓的文件权限,是指对文件的访问权限,包括对 ......
© 2009 ej38.com All Rights Reserved. 关于E健网联系我们 | 站点地图 | 赣ICP备09004571号