导入sogou输入法的细胞词库

首先请下载这个导入工具,解压缩到某个目录中。从pinyin.sogou.com下载细胞词库(scel格式),保存在某个目录中。然后在terminal中执行下面的操作:

$ python import_sogou_celldict.py PATH_TO_CELL_DICT.scel

感谢中文社区其他开发者和项目reverse engineering的工作,

导入fcitx用户词典

首先请下载这个导入工具,解压缩到某个目录中。注意:如果您使用的是实验版词表和语言模型,请下载open-gram项目的词表,解压并覆盖sunpinyin_importer目录下的dict.utf8文件,然后再执行下面的步骤。

如果在linux上,可以直接运行:

$ python import_fcitx_userdict.py

如果是要导入到mac平台上,请先使用mb2org(fcitx自带的工具),将用户词典导入到一个文本文件中:

$ /usr/bin/mb2org ~/.fcitx/pyusrphrase.mb > fcitx_userdict.txt,

然后将这个文件拷贝到mac上,再执行:

$ python import_fcitx_userdict.py fcitx_userdict.txt

导入QQ和紫光输入法的用户词典

大家可能已经注意到了,我们的用户词典导入工具,已加入了对QQ和紫光输入法用户词典的支持。

首先请下载这个导入工具,解压缩到某个目录中。注意:如果您使用的是实验版词表和语言模型,请下载open-gram项目的词表,解压并覆盖sunpinyin_importer目录下的dict.utf8文件,然后再执行下面的步骤。

导入QQ输入法的用户词典

在windows上激活QQ拼音输入法,然后打开“属性设置”对话框,在“词库管理”标签页下的“本地词库管理”中,点击“导出”按钮,将用户词典导出到一个文件中(例如,名为qq_userdict.dic),然后将这个文件拷贝到您的机器上(mac或linux),然后执行下面的操作,

$ python import_qq_userdict.py qq_userdict.dic

导入紫光华宇输入法的用户词典

在windows上激活紫光华宇拼音输入法,然后打开“设置”对话框,然后在“词库管理”标签页下,选中“用户词库”,点击“导出...”,将用户词典导出到一个文件中(例如,名为ziguang_userdict.txt),然后将这个文件拷贝到您的机器上(mac或linux),然后执行下面的操作:

$ python import_ziguang_userdict.py ziguang_userdict.dic

导入google和sogou输入法的用户词典

此次更新的导入工具,加入了对google和sogou输入法用户词典导入的支持。由于sunpinyin用户词典的一些限制,只能导入长度为2~6个字符的词条,并且最多可导入6万多个词条。我们后续会改进sunpinyin,以支持更大的词库和用户词典。该导入工具也可以在linux或solaris下运行,不过目前只支持ibus的前端。(因为我们不是很好判断,用户所使用的是xim还是ibus平台。)

注意:如果您使用的是实验版词表和语言模型,请下载open-gram项目的词表,解压并覆盖sunpinyin_importer目录下的dict.utf8文件,然后再执行下面的步骤。

首先请下载这个导入工具,解压缩到某个目录中。

导入google输入法用户词典

在windows上激活google拼音输入法,然后打开“属性设置”对话框,在“词典”标签页下,点击“导出”按钮,将用户词典导出到一个文件中(例如,名为google_userdict.dic),然后将这个文件拷贝到您的机器上(mac或linux),然后执行下面的操作,

$ python import_google_userdict.py google_userdict.dic

导入sogou输入法用户词典

在windows上激活sogou拼音输入法,然后打开“设置属性”对话框,然后在“词库”标签页下,在“词库操作选择”下拉框中选择“导出文本词库”,并点击“执行该操作”,将用户词典导出到一个文件中(例如,名为sogou_userdict.txt),然后将这个文件拷贝到您的机器上(mac或linux),然后执行下面的操作:

$ python import_sogou_userdict.py sogou_userdict.txt

基本上,只要输入法提供导出用户词典的功能、且导出格式为文本文件的话,为sunpinyin实现一个导入小工具是很简单的(可参考已有的importer)。大家可以自行编写一个,欢迎您为常用的输入法编写一个导入工具哦 :)

如果需要将fitx的用户词典导入到sunpinyin中,参见@Yunkwan同学编写的导入工具

将QIM的用户词典导入SunPinyin用户词典

感谢QIM提供的QDM工具,可以将用户词典导出到一个文件中。执行QDM,点击“Export”,选择“Export Simplified Words&Pinyin”,然后点击OK,将文件保存到某处,例如~/Desktop/User\'s\ Database.txt。下载这个导入工具,解压缩到某个目录中,然后执行下面的操作,

$ python import_qim_userdict.py ~/Desktop/User\'s\ Database.txt
[先下载] is imported into sunpinyin's userdict
[官网] is imported into sunpinyin's userdict
[那套] is imported into sunpinyin's userdict
[分隔符] is imported into sunpinyin's userdict
... ...
... ...

注意如果您使用的是实验版词表和语言模型,请下载open-gram项目的词表,解压并覆盖sunpinyin_importer目录下的dict.utf8文件,然后再执行上面的步骤。另外,导入时会忽略掉QDM中包含不完全音节的词条,敬请谅解 ...

将FIT的用户词典导入SunPinyin用户词典

许多从FIT转到SunPinyin的用户,希望能将FIT的用户词典导入到SunPinyin的用户词典中。因为FIT和SunPinyin都使用了SQLite来实现用户词典,因此编写一个python脚本来进行导入,并不困难。大家可以下载这个导入工具,解压缩到某个目录中,然后执行下面的操作,

$ python import_fit_userdict.py
[先下载] is imported into sunpinyin's userdict
[官网] is imported into sunpinyin's userdict
[那套] is imported into sunpinyin's userdict
[分隔符] is imported into sunpinyin's userdict
... ...
... ...

注意如果您使用的是实验版词表和语言模型,请下载open-gram项目的词表,解压并覆盖sunpinyin_importer目录下的dict.utf8文件,然后再执行上面的步骤。