今天研究了一下Unicode,写了个普通字符串转Unicode的程序,同时又写了个方法可以把本程序输出的Unicode字符串转化 回普通字符串。
但是奇怪的是,从别人那里复制过来的Unicode字符串,直接用输出就可以得到普通字符串,如果用程序中的方法,反而不行。
看来是在给String赋值的时候,已经被系统自动转化了。
import java.util.regex.*; public class Test{ private static StringBuilder sb = new StringBuilder(); private static Pattern p = Pattern.compile("\\\\u[\\da-f]{4}"); public static void main(String[] args){ String s2 = stringToUnicode("抓住楼主枪毙两分钟"); System.out.println(s2); } public static String stringToUnicode(String s){ sb.setLength(0);//清零 StringBuilder tmp = new StringBuilder(); for(int i = 0; i < s.length(); i++){ sb.append("\\u"); //以 \ u开头 tmp.setLength(0); //清零 tmp.append(Integer.toHexString(s.charAt(i)).toLowerCase()); while(tmp.length() < 4){ tmp.insert(0, 0); } sb.append(tmp); } return sb.toString(); } public static String unicodeToString(String s){ s = s.toLowerCase(); sb.setLength(0); Matcher m = p.matcher(s); while(m.find()){ sb.append((char)Integer.parseInt(m.group().substring(2), 16)); } return sb.toString(); } }
版权声明:本文为博主原创文章,未经博主允许不得转载。