易截截图软件、单文件、免安装、纯绿色、仅160KB

word转html如何清除冗余代码

我有几万个从word转来的html文件,但这些html文件由doc的100多K变成了几M,几十M。

原来转为html时产生了大量的冗余代码,请问有什么方法可以清除这些垃圾。

需要程序代码。
刚才没分了,现在又有了,可以加分的

    /// <summary>
        /// 清理Word生成的冗余HTML
        /// </summary>
        /// <param name="html"> </param>
        /// <returns> </returns>
        public static string CleanWordHtml(string html)
        {
            StringCollection sc = new StringCollection();
            // get rid of unnecessary tag spans (comments and title)
            sc.Add(@" <!--(\w|\W)+?-->");
            sc.Add(@" <title>(\w|\W)+? </title>");
            // Get rid of classes and styles
            sc.Add(@"\s?class=\w+");
            sc.Add(@"\s+style='[^']+'");
            // Get rid of unnecessary tags
            //sc.Add(@"


相关问答:

html转jsp后布局为什么变了

一个静态的html页面,美化,界面布局已经处理好了 ,在编写程序的时候需要在转化成JSP页面,

所以新建一个JSP页面,讲原来的代码拷贝到里面去,结果布局变了?

不存在路径问题!

没人? 真失败!
......

asp生成html后的调用方法

      我在做一个网站asp的,想生成html,生成后如何调用呢?

如:我当前调用页面是http://192.168.0.100/jdasp/x.asp?cnmai=1795 ,生成的是x1795.html文件,
    如何在调用x ......

如果在html头部加上一段JavaScript代码,会发生什么?

如题所示,处于某种需要,需要(无法改变)在html最头端加上一段JavaScript代码。可是加上之后就影响了页面的显示,有没有哪种办法可以避免这种情况的

如下所示,原来的htmlHTML code:
<!DOCTYPE html P ......

字符串转化为 HTML 实体? 怎么写最简单?

字符串转化为 HTML 实体? 怎么写最简单?


比如把“你好”

输出为:

&#20320; &#22909;




不行

C# code:

string str = "你好";
......

禁用HTML标签

<a href="src"> aaa </a>

我想把这个A标记禁用成不可点击的状态
怎么处理...
<a href="#"> aaa </a>
这样就可以了啊


<a> aaa </ ......
© 2009 ej38.com All Rights Reserved. 关于E健网联系我们 | 站点地图 | 赣ICP备09004571号