使用Perl的HTML::TreeBuilder::XPath来解析网页内容

HTML特殊字符显示

HTML字符实体(Character Entities)
有些字符在HTML里有特别的含义，比如小于号<就表示HTML Tag的开始，这个小于号是不显示在我们最终看到的网页里的。那如果我们希望在网页中显示一个小于号，该怎么办呢？
这就要说到HTML字符实体(HTML Character Entities)了。
一个字符实体(Character Entity)分成三部分：第一部� ......

XHTML和HTML的区别

因为Wap2.0使用XHTML语言并兼容WML，以下是网上找的XHTML和HTML的区别
XHTML相比于HTML
1.所有的标记都必须要有一个相应的结束标记
以前在HTML中，你可以打开许多标签，例如和<li>而不一定写对应的
和</li>来关闭它们。但在XHTML中这是不合法的。XHTML要求有严谨的结构，所有标签必须 ......

HTML 简史

HTML 简史
HTML 是 Web 统一语言，这些容纳在尖括号里的简单标签，构成了如今的 Web。1991 年，Tim Berners-Lee 编写了一份叫做 “HTML 标签”的文档，里面包含了大约20个用来标记网页的 HTML 标签。他直接借用 SGML 的标记格式，也就是后来我们看到的 HTML 标记的格式。本文讲� ......

java把word转html或txt

最近项目中需要在页面中预览word文件，虽说word本身就可以在页面中打开，但是有两个弊端，1是可客户端必须安装word， 2是客户端的环境以及office版本有差异，会造成预览不稳定。在网上找了一下，发现poi可以把word装换成txt,但是格式都丢了,只有光秃秃的文本,又搜jacob, 网友们众说纷纭, 最后还是自己sourceforge上下载jaco ......