开源的网页抓取项目HTML Parser 介绍
HTML Parser is a Java library used to parse HTML in either a linear or nested fashion. Primarily used for transformation or extraction, it features filters, visitors, custom tags and easy to use JavaBeans. It is a fast, robust and well tested package.
code download:http://sourceforge.net/projects/htmlparser/
相关文档:
HTML 5——下一代web开发标准
HTML5看来将成为主流,浏览器战争乃至整个互联网的发展也将围绕这一点展开。而Flash、Silverlight和JavaFX等等RIA技术,将面临严峻的生存挑战
参考51cto
http://developer.51cto.com/art/200907/133407.htm ......
/************************************************************************
* Description: 访问zip中的htm 之 Widgets学习
* Author: 陈相礼
* Compiled: VC8 + wxWidgets2.8.10
* Date: 04/02/10
************************************************************************/
/******************************** ......
1: 遍历并输出Table中值
<table id="tb">
<tr>
<td></td>
</tr>
<tr>
<td></td>
</tr>
</ ......
转自:InfoQ
作者
Abel Avram
译者
张龙
发布于
2010年1月30日 上午12时6分
目前Web Hypertext Application
Technology Working Group
(WHATWG)正与W3C
通
力合作建立HTML 5标准,在过去3个月中 ......