java String与unicode
java String与unicode
java.nio.charset.Charset
public static Charset defaultCharset()
此方法的作用:返回java虚拟机的默认字符集,默认的字符集取决于操作系统的字符集。
java.lang.String
public byte[] getBytes()
此方法的作用:编码字符串到一个字节流序列,此时采用的编码是平台默认的编码,如果想获得指定编码的字节序列,可用下面这个方法:
public byte[] getBytes(String charsetName)
按照指定编码返回此字符串的编码格式。
证据如下:
String str = "我";
System.out.println(Integer.toHexString(codePoint));
byte[] bs = str.getBytes();
System.out.println(Charset.defaultCharset());
for (int i=0; i<bs.length; i++) {
System.out.print(bs[i] + " ");
}
System.out.println();
6211
GBK
-50 -46
当指定编码为UTF-8时:
6211
GBK
-26 -120 -111
当指定为UTF-16时:
-2 -1 98 17
注意此处输出了四个字节,是因为前面两个字节是用来表示字符的编码序列.
public int codePointAt(int index)
返回指定索引处的字符(Unicode 代码点)。该索引引用 char 值(Unicode 代码单元),其范围从 0 到length()- 1。
注意字符串在内存中是以unicode代码点的方式存储的。
public String(byte[] bytes, String charsetName)
throws UnsupportedEncodingException
构造一个新的 String,方法是使用指定的字符集解码指定的字节数组。新的 String 的长度是一个字符集函数,因此不能等于字节数组的长度。
public String[] split(String regex)
根据给定的正则表达式的匹配来拆分此字符串。
该方法的作用就像是使用给定的表达式和限制参数 0 来调用两因此,结果数组中不包括结尾空字符串。
例如,字符串 "boo:and:foo" 产生带有下面这些表达式的结果:
Regex
结果
:
{ "boo", "and", "foo" }
o
{ "b", "", ":and:f" }
试验证明:
String str = "boo:and:foo";
String[] tr = str.split(":");
for (String s : tr) {
System.out.println(s);
}
输出结果:
boo
and
foo
public String[] split(String regex,
in
相关文档:
List的用法
List包括List接口以及List接口的所有实现类。因为List接口实现了Collection接口,所以List接口拥有Collection接口提供的所有常用方法,又因为List是列表类型,所以List接口还提供了一些适合于自身的常用方法,如表1所示。
表1 List接口定义的常用方法及功能
从表1可以看出,List接口提供的适合于自身的 ......
传智播客JAVA培训2010-5-21EMS项目总结1
EMS项目都过去了三天,我对自己的能力也越来越怀疑,现在每每想起从前自己对JAVA只有十分之一解的时间,感觉自己是多么的强大,而如今学得越多,反而发现在自己越来越是那样的无知。面向知识浩瀚的海洋,真的感觉到自己是沧海一粟。人们都说,现在的年青人太浮躁了,真的是这样吗 ......
英文字体
arial.fon
Download
courier.fon
Download
elephant.fon
Download
georgia.fon
Download
impact.fon
Download
rockwell.fon
Download
roman.fon
Download
serif.fon
Download
verdana.fon
Download
中文字体
fangsong.fon(仿宋)
Download
heiti.fon(黑体)
Download
lishu.fon(隶书 ......
第二章 类和对象
A. 万物皆对象
B. 对象由表示状态的属性和表示行为的方法组成
C.   ......