首页 > 技术文章 > 算法笔记_232:提取拼音首字母(Java)

liuzhen1995 2017-05-24 15:04 原文

目录

1 问题描述

2 解决方案

 


1 问题描述

在很多软件中,输入拼音的首写字母就可以快速定位到某个词条。比如,在铁路售票软件中,输入: “bj”就可以定位到“北京”。怎样在自己的软件中实现这个功能呢?问题的关键在于:对每个汉字必须能计算出它的拼音首字母。

GB2312汉字编码方式中,一级汉字的3755个是按照拼音顺序排列的。我们可以利用这个特征,对常用汉字求拼音首字母。

GB2312编码方案对每个汉字采用两个字节表示。第一个字节为区号,第二个字节为区中的偏移号。为了能与已有的ASCII编码兼容(中西文混排),区号和偏移编号都从0xA1开始。

我们只要找到拼音a,b,c,...x,y,z 每个字母所对应的GB2312编码的第一个汉字,就可以定位所有一级汉字的拼音首字母了(不考虑多音字的情况)。下面这个表给出了前述信息。请你利用该表编写程序,求出常用汉字的拼音首字母。


a 啊 B0A1
b 芭 B0C5
c 擦 B2C1
d 搭 B4EE
e 蛾 B6EA
f 发 B7A2
g 噶 B8C1
h 哈 B9FE
j 击 BBF7
k 喀 BFA6
l 垃 C0AC
m 妈 C2E8
n 拿 C4C3
o 哦 C5B6
p 啪 C5BE
q 期 C6DA
r 然 C8BB
s 撒 C8F6
t 塌 CBFA
w 挖 CDDA
x 昔 CEF4
y 压 D1B9
z 匝 D4D1


【输入、输出格式要求】

用户先输入一个整数n (n<100),表示接下来将有n行文本。接着输入n行中文串(每个串不超过50个汉字)。

程序则输出n行,每行内容为用户输入的对应行的汉字的拼音首字母。

字母间不留空格,全部使用大写字母。

例如:
用户输入:
3
大家爱科学
北京天安门广场
软件大赛

则程序输出:
DJAKX
BJTAMGC
RJDS

 

 

 


2 解决方案

 1 import java.io.UnsupportedEncodingException;
 2 import java.util.Scanner;
 3 
 4 public class Main {
 5     public static String[] arrayA = {"啊","芭","擦 ","搭","蛾 ","发 ","噶 ","哈 ",
 6         "击","喀","垃 ","妈 ","拿","哦 ","啪 ","期 ","然 ", "撒 ","塌","挖","昔",
 7         "压","匝"}; 
 8     public static int[] valueA = new int[23];
 9     public static char[] resultA = {'A','B','C','D','E','F','G','H','J','K',
10         'L','M','N','O','P','Q','R','S','T','W','X','Y','Z'};
11     
12     public int getNum(String A) {
13         byte[] a = null;
14         try {
15             a = A.getBytes("GB2312");
16         } catch (UnsupportedEncodingException e) {
17             e.printStackTrace();
18         }
19         int b = ((a[0]<<8)&0xff00) + (a[1]&0xff);
20         return b;
21     }
22     
23     public String getResult(String A) {
24         int num = getNum(A);
25         int i = 0;
26         for(;i < 23;i++)
27             if(valueA[i] > num)
28                 break;
29         String r = "" + resultA[i - 1];
30         return r;
31     }
32     
33     public static void main(String[] args) {
34         Main test = new Main();
35         for(int i = 0;i < 23;i++)
36             valueA[i] = test.getNum(arrayA[i]);
37         Scanner in = new Scanner(System.in);
38         int n = in.nextInt();
39         String[] result = new String[n];
40         for(int i = 0;i < n;i++) {
41             String A = in.next();
42             StringBuffer s = new StringBuffer("");
43             for(int j = 0;j < A.length();j++) {
44                 String temp = "" + A.charAt(j);
45                 s.append(test.getResult(temp));
46             }
47             result[i] = s.toString();
48         }
49         for(int i = 0;i < n;i++)
50             System.out.println(result[i]);
51     }
52 }

 

 

运行结果:

4
建设社会主义新农村
欧洲
给我一个支点我可以撬动地球
怎
JSSHZYXNC
OZ
GWYGZDWKYQDDQ
Z

 

推荐阅读