首页 > 技术文章 > Java把字符串转Unicode

kinglearnjava 2015-01-09 20:28 原文

今天研究了一下Unicode,写了个普通字符串转Unicode的程序,同时又写了个方法可以把本程序输出的Unicode字符串转化 回普通字符串。

但是奇怪的是,从别人那里复制过来的Unicode字符串,直接用输出就可以得到普通字符串,如果用程序中的方法,反而不行。

看来是在给String赋值的时候,已经被系统自动转化了。


import java.util.regex.*;
public class Test{  
    private static StringBuilder sb = new StringBuilder();
    private static Pattern p = Pattern.compile("\\\\u[\\da-f]{4}");

    public static void main(String[] args){
        String s2 = stringToUnicode("抓住楼主枪毙两分钟");
        System.out.println(s2);
    }

    public static String stringToUnicode(String s){
        sb.setLength(0);//清零
        StringBuilder tmp = new StringBuilder();
        for(int i = 0; i < s.length(); i++){
            sb.append("\\u"); //以 \ u开头
            tmp.setLength(0); //清零
            tmp.append(Integer.toHexString(s.charAt(i)).toLowerCase());
            while(tmp.length() < 4){
                tmp.insert(0, 0);
            }
            sb.append(tmp);
        }
        return sb.toString();
    }

    public static String unicodeToString(String s){
        s = s.toLowerCase();
        sb.setLength(0);
        Matcher m = p.matcher(s);
        while(m.find()){
            sb.append((char)Integer.parseInt(m.group().substring(2), 16));
        }
        return sb.toString();
    }
}






版权声明:本文为博主原创文章,未经博主允许不得转载。

推荐阅读