易截截图软件、单文件、免安装、纯绿色、仅160KB

完善自己的html parse

       说来惭愧,我发现自己写的那个html parse过于理想化,解析xml还差不多,想解析现今的html,估计是不大可能的,所以我把代码重写了一遍,数据结构改成双向链表,这样解析速度更快,最大程度地对html进行容错处理,试验时发现的确可以解析普通html字符串,不需要再严格符合那个xhtml标准了。而且在链式调用的传递参数上不需要再传入dom类型的参数,这样写起来就更加简便了。
        好了,废话不多说,看代码:
#include<iostream>
using namespace std;
class node;
class dom;
class nodecollect{
private:
 node *n;
 int length;
public:
 nodecollect();
 ~nodecollect();
    int getlength();
 void add(node *nn);
 node* item(int i);
};
class node{
private:
 int start;
 int len;
 char name[20];
public:
 char* nodehtml();
 char* innerhtml();
 char* outerhtml();
 char* innertext();
 char* getattr(char* str);
 char* tagname();
 void setname(char *str);
 node* getparent();
 nodecollect* getchild(); 
 node* getnext();
 node* getprevious();
 node *next;
 node *previous;
 void setstart(int i);
 void setlen(int i);
 int getstart();
 int getlen();
 dom *d;
};
class dom{
private:
 char *text;
 node *start;
 node *end;
 int count;
 int parse(char *s);
public:
 ~dom();
 char *gettext();
 void load(char *str);
 node* getitem(int i);
 int getcount();
 node *getbyid(char* id);
 nodecollect* getbytagname(char *tagname);
};
void dom::load(char* str){
 start=0;
 end=0;
 count=0;
 int l=strlen(str);
 text=new char[l+1];
 strcpy(text,str);
 char *t=text;
 parse(t);
 
}
int dom::getcount(){
 return count;
}
char *dom::gettext(){
 return text;
}
node* dom::getitem(int i){
 node* n1=start;
 while(i--){
&


相关文档:

Struts1的HTML标签库

<html:html>标签有一个 lang 属性,用于显示用户使用的语言:
  <html:html lang="true">
    如果客户浏览器使用中文,那么以上代码在运行时将被解析为普通的 HTML 代码:
  <html lang="zh-CN">
    解释:当 lang 属性为 "true ......

将aspx页面转换为html页面

        StringBuilder sb = new StringBuilder();
        Server.Execute("~/Default2.aspx", new StringWriter(sb));
        File.WriteAllText(Server.MapPath("index.htm"), sb.ToString()); ......

在winform中解析html标签

  最近在弄公司的系统时遇到一个问题,有一个winform要调用网站的数据库,数据库中存的是经过eWebEditor处理过的文章,都带有html标签,当时想用正则表达式过滤掉,但是还是放弃了原因有三:1.我对正则表达式了解很少;2.虽说我可以现学正则表达式,但是实现起来也是很麻烦的;3.如果过滤掉的话文章的格式就没有了。于 ......

通过HTML 注释性语法判断IE版本

Example:
1.<!--[if !IE]><!--> 除IE外都可识别 <!--<![endif]-->
2.<!--[if IE]> 所有的IE可识别 <![endif]-->
3.<!--[if IE 5.0]> 只有IE5.0可以识别 <![endif]-->
4.<!--[if IE 5]> 仅IE5.0与IE5.5可以识别 <![endif]-->
5.<!--[if gt IE 5.0]> IE ......
© 2009 ej38.com All Rights Reserved. 关于E健网联系我们 | 站点地图 | 赣ICP备09004571号