HTML特殊字符对照表
�
@
@
at符号
€
€
À
À
À

A
A
A

Á
Á
Á

B
B
B
‚
‚
Â
Â
Â

C
C
C
ƒ
ƒ
Ã
Ã
Ã

D
D
D
„
„
Ä
Ä
Ä

E
E
E
…
…
Å
Å
Å

F
F
F
†
†
Æ
Æ
Æ

G
G
G
‡
‡
Ç
Ç
Ç

H
H
H
ˆ
ˆ
È
È
È
	
I
I
I
‰
‰
É
É
É
换行
J
J
J
Š
Š
Ê
Ê
Ê

K
K
K
‹
‹
Ë
Ë
Ë

L
L
L
Œ
Œ
Ì
Ì
Ì
回车
M
M
M

Í
Í
Í

N
N
相关文档:
HTML:
<META HTTP-EQUIV="pragma" CONTENT="no-cache">
<META HTTP-EQUIV="Cache-Control" CONTENT="no-cache, must-revalidate">
<META HTTP-EQUIV="expires" CONTENT="Wed, 26 Feb 1997 08:21:57 GMT">
<META HTTP-EQUIV="expires" CONTENT="0">
PHP:
header("Expires: Mon, 26 Jul 1997 ......
代码如下:
Function RemoveHTML(strText)
Dim RegEx
Set RegEx = New RegExp
RegEx.Pattern = "<[^>]*>"
RegEx.Global = True
RemoveHTML = RegEx.Replace(strText, "")
RemoveHTML = replace(RemoveHTML," "," ")
End Function
这是最基本的正则替换,有某些特殊字符还没过滤,可自行添加 ......
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta NAME="Copyright" CONTENT="">
<meta http-equiv="Content-Type" content="text/html; charset=u ......
这些天因为工作需要,要将一些html文件转换为chm文件,当然是需要和程序结合在一起。
后来找到NDoc,里头有一段代码是相关的,于是开始分析代码,写完之后,总结:主要是利用微软的hhc.exe来编译html文件,程序需要将具体的数据写入hhp和hhc文件。
主要代码如下:
复制C#代码保存代码public void CompileProject()
{ ......