存档

文章标签 ‘编码’

JSP实现URL中文编码

2010年8月8日 admin 没有评论

URL中传中文字符是件头疼事,本身URL不支持中文字符,但有些情况下又不得不传中文字当参数,若直接把中文字加上去,获取后势必会是乱码,这该怎么办呢?幸好JAVA提供一个URL中字符编码转换的API–URLEncoder,下面给段使用范例: 阅读全文…

相关日志

分类: JSP 标签: , ,

Java编码转换-内存中字符串编码转换实例

2010年7月10日 admin 没有评论

Java编程时会遇到很多字符集编码转换的问题,当读取的字符在内存中如何执行编码转换?下面给出一个实例 阅读全文…

相关日志

4大类Java应用编码转换的详细过程

2010年7月7日 admin 没有评论

常见的JAVA程序包括以下类别:
*直接在console上运行的类(包括可视化界面的类)
*JSP代码类(注:JSP是Servlets类的变型)
*Servelets类
*EJB类
*其它不可以直接运行的支持类

这些类文件中,都有可能含有中文字符串,并且常用前三类JAVA程序和用户直接交互,用于输出和输入字符,如:在JSP和Servlet中得到客户端送来的字符,这些字符也包括中文字符。无论这些JAVA类的作用如何,这些JAVA程序的生命周期都是这样的:

*编程人员在一定的操作系统上选择一个合适的编辑软件来实现源程序代码并以.java扩展名保存在操作系统中,例如我们在中文win2k中用记事本编辑一个java源程序;
*编程人员用JDK中的javac.exe来编译这些源代码,形成.class类(JSP文件是由容器调用JDK来编译的);
*直接运行这些类或将这些类布署到WEB容器中去运行,并输出结果。
那么,在这些过程中,JDK和JVM是如何将这些文件如何编码和解码并运行的呢?

这里,以中文win2k操作系统为例说明JAVA类是如何来编码和被解码的。 阅读全文…

相关日志

分类: Java 标签: , ,

6大要点轻松了解Java字符编码规则

2010年7月5日 admin 没有评论

1. 概述

本文主要包括以下几个方面:编码基本知识,java,系统软件,url,工具软件等。

在下面的描述中,将以”中文”两个字为例,经查表可以知道其GB2312编码是”d6d0 cec4“,Unicode编码为”4e2d 6587“,UTF编码就是”e4b8ad e69687“。注意,这两个字没有iso8859-1编码,但可以用iso8859-1编码来”表示”。

2. 编码基本知识

最早的编码是iso8859-1,和ascii编码相似。但为了方便表示各种各样的语言,逐渐出现了很多标准编码,重要的有如下几个。

2.1. iso8859-1

属于单字节编码,最多能表示的字符范围是0-255,应用于英文系列。比如,字母’a'的编码为0×61=97。

很明显,iso8859-1编码表示的字符范围很窄,无法表示中文字符。但是,由于是单字节编码,和计算机最基础的表示单位一致,所以很多时候,仍旧使用iso8859-1编码来表示。而且在很多协议上,默认使用该编码。比如,虽然”中文”两个字不存在iso8859-1编码,以gb2312编码为例,应该是”d6d0 cec4“两个字符,使用iso8859-1编码的时候则将它拆开为4个字节来表示:”d6 d0 ce c4“(事实上,在进行存储的时候,也是以字节为单位处理的)。而如果是UTF编码,则是6个字节”e4 b8 ad e6 96 87“。很明显,这种表示方法还需要以另一种编码为基础。

2.2. GB2312/GBK

这就是汉子的国标码,专门用来表示汉字,是双字节编码,而英文字母和iso8859-1一致(兼容iso8859-1编码)。其中gbk编码能够用来同时表示繁体字和简体字,而gb2312只能表示简体字,gbk是兼容gb2312编码的。 阅读全文…

相关日志

分类: Java 标签: , , ,

Java编码转换-TXT文件编码转换实例

2010年7月5日 admin 没有评论

Java中编码转换用到的类主要为Charset,CharsetDecoder,CharsetEncoder类,下面举例展示一下如何使用这些类处理TXT文件的编码转换。 阅读全文…

相关日志

Easy AdSense by Unreal