Jul 16

首先请下载这个导入工具,解压缩到某个目录中。从pinyin.sogou.com下载细胞词库(scel格式),保存在某个目录中。然后在terminal中执行下面的操作:

$ python import_sogou_celldict.py <path to your cell_dict.scel>

感谢中文社区其他开发者和项目reverse engineering的工作,

66 Responses to “导入sogou输入法的细胞词库”

  1. yongsun says:

    @o_0! 先下载scel格式的词库,然后依文中的步骤执行脚本导入即可 …

  2. Houge says:

    @yongsun 谢谢您的答复,您能帮我导入一次,发封邮件附在邮件中可以吗?身边实在没有其他的系统了。邮箱地址您应该能从回复那里看到。我只是需要那个词库:http://pinyin.sogou.com/dict/cell.php?id=15125

    如果您能帮我,小生将不胜感激

  3. dunjian says:

    @yongsun 不好意思,我重新下载了code和词库,不过还是有同样的问题。看他的提示,似乎是UnicodeEncodeError,不过我不知道这是啥咚咚,需要在哪修改,还请大侠指点:-)

  4. yongsun says:

    @dunjian, 您能告诉我您使用的是什么系统,以及python解释器的版本么?python –version

  5. dunjian says:

    系统是:OS X 10.6.4

    Python的版本是:Python 2.6.1 (r261:67515, Feb 11 2010, 00:51:29)
    [GCC 4.2.1 (Apple Inc. build 5646)] on darwin

    P.S. 这个Python是我通过fink安装的。

  6. yongsun says:

    @dunjian,您可以试一试系统自带的python,10.6上的python版本就是2.6 …

  7. Kandu says:

    @Houge,寫好了一個程式,可以將 sunpinyin 的系統詞庫從 UTF-32 轉換為 UTF-8 編碼,然後改 importer.py 里的 UTF-32 至 UTF-8 並改讀入文件為轉換出的文件即可導入。

  8. Kandu says:

    @Houge 此程式是依照編碼來改,所以不依賴外部庫,在 mac 上應該可以執行。 irc 聯繫吧

  9. dunjian says:

    谢谢yongsun,不过用了系统自带的python还是存在同样的问题 :-(

  10. dunjian says:

    对了,还有一点是我用的是英文的系统,并且用textedit打开细胞词库时,里面都是乱码 :-(

  11. yongsun says:

    @dunjian,奇怪,我在10.6下可以很正常的导入啊?是否可以先把fink的路径在$PATH中去掉再试试看?另,scel是二进制格式,不能直接用textedit打开 …

  12. dunjian says:

    yongsun,实在太麻烦你了。我试了把fink的路径去掉了,还是存在同样的问题。

    Traceback (most recent call last):
    File “import_sogou_celldict.py”, line 81, in
    main()
    File “import_sogou_celldict.py”, line 78, in main
    import_to_sunpinyin_user_dict (generator)
    File “/Users/Xinfeng/Desktop/sunpinyin_importer/importer.py”, line 50, in import_to_sunpinyin_user_dict
    print “[%s] is too long or too short for sunpinyin userdict” % utf8str
    UnicodeEncodeError: ‘ascii’ codec can’t encode characters in position 1-9: ordinal not in range(128)

  13. yongsun says:

    @dunjian,我也不明白到底是什么原因了 :(

  14. lin says:

    您好,非常感谢您开发了这么好的软件,用mac打字从来没这么舒服过,我也发现晚了,呵呵。但是“贇”字只有繁体,没有简体,这是我的名字,打繁体跟护照上不对应,有点麻烦。您能帮忙看一下不?不甚感激~~~^–^

  15. yongsun says:

    @lin,已经在open-gram上fix了,稍后发布新版词库的二进制文件 …

  16. yongsun says:

    @lin, 请下载http://code.google.com/p/sunpinyin/downloads/detail?name=pydict_sc.bin.le,并替换系统中的/Library/Input\ Methods/SunPinyin.app/Contents/Resources/pydict_sc.bin,并杀死sunpinyin的进程 …

Leave a Reply

To submit your comment, click the image below where it asks you to... Clickcha - The One-click Captcha
preload preload preload