易截截图软件、单文件、免安装、纯绿色、仅160KB

Delphi 通过MSHTML实现一个HTML解析类

最近经常会模拟网页提交返回网页源码,然后获得网页中相应的元素,于是需要常常解析Html中相应的各种元素,网络是个好东西,搜索一番,就找到了
好几个Delphi版本的HtmlParser的类库,试着使用了几个,发现解析起来都不完整,或多或少的回出现一些问题!于是想到了如果界面上有一个浏
览器,我们可以通过WebBrowser的Document接口对网页元素进行操作,很是方便!但是模拟网页提交,界面上是不一定要出现
WebBrowser的,肯定有办法,不通过WebBrowser就直接解析HTML的,那便是我不要WebBrowser这个外壳,只要他里面的
Document文档接口对象就能实现对Html的解析了,查找了一番MSDN,然后Google一下,果然可行,构建方法如下:
//创建
IHTMLDocument2接口
  CoCreateInstance(CLASS_HTMLDocument, nil,
CLSCTX_INPROC_SERVER, IID_IHTMLDocument2, FHtmlDoc);
接口创建好了之后就能够对文
档元素进行解析了,很是爽快!
结合了我自己的特有操作,我对Combobox,Table,Frame等一些网页元素做了相应的封装,实现
了一个HTMLParser,大致代码如下:
这里只给出声明,代
码请在最后下载
 
代码
(*
****************************************************
*)
(*
                得闲工作
室                          
*)
(*
              网页元素操作
类库                      
*)
(*
                                                    
*)
(*
              DxHtmlElement Unit       


相关文档:

如何抓取网页数据、分析并且去除Html标签(C#)

<@Aattention Content="本Blog原创文章,转载或引用请注明转载"
from="Robby.cnblogs.com"@>
      由于自己的搜索引擎中做到了这一块内容,所以今天说说如何抓取网页数据、分析并且去除Html标签,给大家提供一个参考。我的平台是Visual
Studio2005,C#。
& ......

HTML学习1

<p>: 格式化段落; <h1>,<h6> 标题; <blockquote>-- 引用的文本;  <pre>--预先格式化好的文本;保留原有的格式.
<ol><dl><ul>:顺序列表,定义列表,无标号列表. <li>用以显示单个的元素; <dl><dt><dd></dd></dt><dl>
< ......

javascript之HTML(select option)详解

一、基础理解:
var e = document.getElementById("selectId");
e. options= new Option("文本","值") ;
//创建一个option对象,即在<select>标签中创建一个或多个<option value="值">文本</option>
//options是个数组,里面可以存放多个<option value="值">文本</option>这样的标签
1:opt ......

去除字符串中的Html代码

        /// <summary>
        /// 去掉所有HTML标签
        /// </summary>
        /// <param name="strHtml">源字符串</param> ......

获取其它进程中的Web Browser中的HTML源码


HWND H1,H2,H3,H4,hw;
 H1=H2=H3=H4=hw=NULL;
 H1=::FindWindow("TForm1",NULL);
 if (H1) H2=::FindWindowEx(H1,NULL,"Shell Embedding",NULL);
 if (H2) H3=::FindWindowEx(H2,NULL,"Shell DocObject View",NULL);
 if (H3) H4=::FindWindowEx(H3,NULL,"Internet Explorer_Server",NULL) ......
© 2009 ej38.com All Rights Reserved. 关于E健网联系我们 | 站点地图 | 赣ICP备09004571号