大家可能已经注意到了,我们的用户词典导入工具,已加入了对QQ和紫光输入法用户词典的支持。
首先请下载这个导入工具,解压缩到某个目录中。注意:如果您使用的是实验版词表和语言模型,请下载open-gram项目的词表,解压并覆盖sunpinyin_importer目录下的dict.utf8文件,然后再执行下面的步骤。
导入QQ输入法的用户词典
在windows上激活QQ拼音输入法,然后打开“属性设置”对话框,在“词库管理”标签页下的“本地词库管理”中,点击“导出”按钮,将用户词典导出到一个文件中(例如,名为qq_userdict.dic),然后将这个文件拷贝到您的机器上(mac或linux),然后执行下面的操作,
$ python import_qq_userdict.py qq_userdict.dic
导入紫光华宇输入法的用户词典
在windows上激活紫光华宇拼音输入法,然后打开“设置”对话框,然后在“词库管理”标签页下,选中“用户词库”,点击“导出...”,将用户词典导出到一个文件中(例如,名为ziguang_userdict.txt),然后将这个文件拷贝到您的机器上(mac或linux),然后执行下面的操作:
$ python import_ziguang_userdict.py ziguang_userdict.dic
越来越厉害了,忍不住来赞一下,下一步能导入谷歌输入法词库吗,呵呵~~
@seraph,上一篇blog就是关于导入google输入法用户词典的 🙂
真是太详细了。谢谢。现在基本所有的词库均可以导入了。希望下一步就可以看到一些功能上的改进。
再次表示感谢。
真是太详细了。谢谢。
现在基本所有的词库均可以导入了。希望下一步就可以看到一些功能上的改进。
再次表示感谢。
建议增加一个xxxl可以输出希腊字母的功能,类似的大写罗马等也一并支持了。谢谢
@Marc,xxxl是什么意思?
xxxl是拼音小写希腊的首字母,可以输出α β等,dalm可以输出 Ⅰ Ⅱ Ⅲ Ⅳ等
@Marc,多谢!我们将来会为sunpinyin添加脚本插件的功能,可以通过脚本插件来实现 🙂
我的系统是Mac 在导入QQPinyin_2010_4_20.txt 词库的时候出现 IOError: [Errno 2] No such file or directory: 'dict.utf8' 错误,请问该如何解决啊?
@haini,在sunpinyin_importer目录下应该有一个dict.utf8的文件,脚本需要在sunpinyin_importer目录下运行即可 ...
再次再次期待,可以提供多个词库管理的功能
执行命令后最后提示这个
UnicodeError: UTF-16 stream does not start with BOM
@Sean,是QQ的还是紫光的?把脚本中的UTF-16改为UTF-16LE试试看?
.. QQ导出的.txt 你那上写的是.dic,有关系麽?
现在提示:
TypeError: exceptions must be classes or instances, not str
求解 麻烦老师了~