3. 生成拼英码
按照数据源A的顺序,依次处理每一个汉字:
对于某一个汉字的英文解释里面的所有英文单词,计算以下数值
定义 Is-Partial 为是否该词出现在横杠左右或者句点的前面
定义 In-Quote 为是否该词出现在某对括号包含的文字里
定义 Upper-Case 为是否该词使用了大写字母,例如人名和国家名
定义 Score-Value 为(单词在英文解释的长度) + (单词的长度 * 单词的词频)
把单词按照 Is-Partial, In-Quote, Upper-Case, Score-Value, 和单词字符串进行排序
然后选择第一个没有被使用的编码,编码是无声调拼音 + 点 + 英文单词
如果所有单词都已经被占用了,则尝试使用无意义的字母,以如下方式组成:
{ (空) ; b ; p ; m ; f ; d ; t ; n ; l ; g ; k ; h; s } x { a ; e ; i ; o ; u }
数据源