| Win95拼音输入法词库的改进 如果你是一个南方人,你也许会为WINDOWS的拼音输入法中的zh-z、ch-c、sh-s、h-f、l-n、eng-en、ing-in老是和你闹别扭而感到苦恼。既然你不适应它,那就用下面的方法让它来适应你!
1.将\WIN95\SYSTEM\目录下的winpy.mb备份后,利用输入法生成器将全拼码表文件winpy.mb转换成词库文件winpy.txt。
方法是:启动Win95——开始——程序——附件——输入法生成器——逆转换,单击“打开文件”,输入码表文件winpy.mb后单击“返回”,在“逆转换”任务栏中点击“逆转换”即可进行转换,转换完毕后单击“确定”返回,退出输入法生成器。
2.将winpy.txt复制两份,假设文件名为py1.txt和py2.txt。
3.打开文字编辑器(如写字板)编辑py1.txt,利用查找替换功能将[TEXT]字段以下内容中的zh、ch、sh、h、l、eng、ing分别替换成对应的z、c、s、f、n、en、in,存盘。
4.用文字编辑工具处理py2.txt,先将[Descriription]至[Text]间的内容删除,只留下[Text]以下的内容,再将文件中的z、c、s、f、in、en、n替换成对应的zh、ch、sh、h、ing、eng、l,这样一来出现一个麻烦,就是它将韵母中的n也换成了l,必须将韵母还原,利用查找替换将al、ol、el、ul、il换成an、on、en、un、in,存盘。
5.将py1.txt、py2.txt合并成一个文件py.txt,注意py1.txt文件的内容在前。之后你还可在py.txt文件的末尾加入新的词组,如:新潮电子xinchaodianzi、新潮电子xincaodianzi、新潮电子xcdz等。
6.利用输入法生成器对py.txt进行排序。
7.对排序后生成的py.txt按使用频度手工进行词条排序和重复词组的删除,比如:yiyuan编码对应的词有:医院、议院、议员、遗愿、以远、意愿,你可以按你的使用频度改成:意愿、医院、遗愿、议院、议员、以远。如果你觉得“以远”根本不像一个词,那就将它删去。为了减少重码率,对于完全重复的词条,也要尽量手工删除,这一步的工作量稍大。
8.利用输入法生成器将编辑好的py.txt转换成码表文件py.mb。
9.将py.mb拷贝到\WIN95\SYSTEM\目录下并改名为winpy.mb,将原文件覆盖。至此,你的修改工作就完成了,赶快试用一下,有没有新感觉?
注意事项及效果
1.先备份码表文件,以防不测,在修改后自己不满意时,还可吃后悔药。
2.用输入法生成器进行排序时,词条数目不能超过65700,因而在对字库源文件*.txt进行排序前,最好能将完全重复的词条进行手工删除,以防生成器检索词条时因词条数目超过65700而出错。这对全拼字库的修改尤其重要,因为原来的全拼字库有3600多个词条,按上述1~5步修改后生成的py.txt有7万多个词条,如果不先进行手工删除就直接用输入法生成器进行排序,一旦排序到65700个词条时,程序就会出错而中止工作,无法生成排序后的码表原文件py.txt。
3.优点:拼音输入法不再区分南方人咬不准的zh、ch、sh、eng、ing等声母韵母,避免了不知是zh、ch、sh、eng、ing还是z、c、s、en、in而重输的缺点。缺点:重码率稍有增加,但只按一下数字选择键总比重新输入来得快。 |