易截截图软件、单文件、免安装、纯绿色、仅160KB

html unicode编码转换方法

对于"&# 24038;&# 36793;"这种&#开始的字符,应该为html unicode编码类型,解码方法如下:
s="&#  24038;& # 36793;"
s="左边"
import re
_=re.compile('&#(x)?([0-9a-fA-F]+);')
to_str=lambda s,charset='utf-8':_.sub(lambda result:unichr(int(result.group(2),result.group(1)=='x' and 16 or 10)).encode(charset) ,s)
print to_str(s)


相关文档:

html基本知识汇总表(txt)

<html>
<head>
<title>text-font</title>
</head>
<body>
 ************************<font size="7" color="red">标题章节</font>*************************<br>
 
 正常文本
 <h1>一级标题</h1>
 <h2 align=righ ......

用WebBrowser实现HTML界面的应用

HTML的界面有以下特点:图文混排,格式灵活,可以包含Flash、声音和视频等,实现图文声像的多媒体界面,而且易于建立和维护。另外,HTML的显示环境一般机器上都具备,通常不需要安装额外的软件。当然,HTML界面也有它欠缺的方面,即:界面控制能力有限,代码调试不便----虽然DHTML提供了比较强的编程特性,但是比起Delphi的 ......

HTML 标记的原义输出 函数


function unhtml($content){
$content=htmlspecialchars($content);
$content=str_replace(chr(13),"<br>",$content);
$content=str_replace(chr(32),"&nbsp;",$content);
return trim($content);
}
......

HTML特殊字符

双引号:&quot;或&#34;
单引号:&apos;或&#39;(IE实体名无效)
&符号:&amp;或&#38;
<小于:&lt;或&#60;
>大于:&gt;或&#62;
空格:&nbsp;或&#160;
£英磅:&pound;或&#163;
¥元:&yen;或&#165;
¦分隔符:&brvbar;或& ......

刚刚找出来的相对准确的查找HTML的正则表达式

Dim objReg,objMatches,objMatch
Set objReg=new RegExp
objReg.Global=True
objReg.IgnoreCase=True
objReg.Pattern="<('[^']*'|""[^""]*""|[^'"">])*?>"
Set objMatches=objReg.Execute(字符串)
For Each objMatch In objMatches
找到的HTML :objMatch.value
Next
Set objMatches=Nothing
Set objRe ......
© 2009 ej38.com All Rights Reserved. 关于E健网联系我们 | 站点地图 | 赣ICP备09004571号