html文档中心

对于"&# 24038;&# 36793;"这种&#开始的字符，应该为html unicode编码类型，解码方法如下：
s="&# 24038;& # 36793;"
s="左边"
import re
_=re.compile('&#(x)?([0-9a-fA-F]+);')
to_str=lambda s,charset='utf-8':_.sub(lambda result:unichr(int(result.group(2),result.group(1)=='x' and 16 or 10)).encode(charset) ,s)
print to_str(s) ......

因为Wap2.0使用XHTML语言并兼容WML，以下是网上找的XHTML和HTML的区别
XHTML相比于HTML
1.所有的标记都必须要有一个相应的结束标记
以前在HTML中，你可以打开许多标签，例如和<li>而不一定写对应的
和</li>来关闭它们。但在XHTML中这是不合法的。XHTML要求有严谨的结构，所有标签必须关闭。如果是单独不成对的标签，在标签最后加一个"/"来关闭它。例如:
<img height="80" alt="网页设计师" src="../images/logo_w3cn_200x80.gif" width="200" />
2.所有标签的元素和属性的名字都必须使用小写
与HTML不一样，XHTML对大小写是敏感的，<title>和<TITLE>是不同的标签。XHTML要求所有的标签和属性的名字都必须使用小写。例如：<BODY>必须写成<body> 。大小写夹杂也是不被认可的，通常dreamweaver自动生成的属性名字"onMouseOver"也必须修改成"onmouseover"。
3.所有的XML标记都必须合理嵌套
同样因为XHTML要求有严谨的结构，因此所有的嵌套都必须按顺序，以前我们这样写的代码：
<b>
</b>
必须修改为：
就是说，一层� ......

HTML 简史
      HTML 是 Web 统一语言，这些容纳在尖括号里的简单标签，构成了如今的 Web。1991 年，Tim Berners-Lee 编写了一份叫做 “HTML 标签”的文档，里面包含了大约20个用来标记网页的 HTML 标签。他直接借用 SGML 的标记格式，也就是后来我们看到的 HTML 标记的格式。本文讲述了 HTML 这门 Web 标记语言的发展简史。
从 IETF 到 W3C: HTML 4 之路
      HTML 1 并不曾存在，HTML 的第一个官方版本就是由 IETF （互联网工程任务组）推出的 HTML 2.0。问世之前，这个版本中的很多细则已经被实现，比如，1994年的 Mosaic 浏览器已经实现了在文档中嵌入图片的方法，后来 HTML 2.0 便吸纳了 img 这个标签。
后来，W3C 取代 IETF 的角色，成为 HTML 的标准组织，1990年代的后半页，HTML 的版本被频繁修改，直到1999年的 HTML 4.01，至此，HTML 到达了它的第一个拐点。
XHTML 1: XML 风格的 HTML
      HTML 在 HTML 4.01 之后的第一个修订版本就是 XHTML 1.0，其中 X 代表 “eXtensible” ，扩展，当然也有人将之解读为 “eXtreme”，极端。XHTML ......

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta content="text/html; charset=gb2312" http-equiv="Content-Type" />
<title>简单的测试页面</title>
<mce:style type="text/css"></mce:style><style type="text/css" mce_bogus="1">html {
height: 100%;
}
body {
margin: 0px;
padding: 0px;
height: 100%;
}
#dt_3 {
cursor: p ......

最近项目中需要在页面中预览word文件，虽说word本身就可以在页面中打开，但是有两个弊端，1是可客户端必须安装word， 2是客户端的环境以及office版本有差异，会造成预览不稳定。在网上找了一下，发现poi可以把word装换成txt,但是格式都丢了,只有光秃秃的文本,又搜jacob, 网友们众说纷纭, 最后还是自己sourceforge上下载jacob并阅读doc搞定了.
1 goto http://sourceforge.net/projects/jacob-project/ and download latest library of jacob.
下载的zip文件结构如下:
2 intel cpu的机器拷贝jacob-1.15-M3-x86.dll到%JAVA_HOME%/jre/bin, AMD cpu的机器拷贝jacob-1.15-M3-x64.dll. 不过请确保jre目录是你正在使用的jre, 因为现在很多eclipse版本自己带jre. 这个在eclipse windows-> preferences -> installed jres可以查看.
3 拷贝jacob.jar到你项目目录的lib下面并确保加入到了classpath.
准备工作完毕, 现在就写程序了.
import com.jacob.activeX.ActiveXComponent;
import com.jacob.com.Dispatch;
import com.jacob.com.Variant;
public class Test {
public static void main(String[] args) {
ActiveXComponent app = new ActiveXComponent ......

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title> new document </title>
</head>
<body><select id="s1"></select><select id="s2"></select><select id="s3"></select>
<script type="text/javascript">
<!--
    function LianDong(arr, sel)
{
this.GetCnNameByValue = function(val)
{
      for ( var j = 0; j < arr.length; j++)
      {
           if (arr[j][0] == val)
           {
             return arr[j][2];
     & ......

html unicode编码转换方法

XHTML和HTML的区别

HTML 简史

html弹出提示框并实现拖动的源码

java把word转html或txt

java把word转html或txt

省市县不刷页面js 完成html代码