<?xml version="1.0" encoding="UTF-8"?> <rss
version="2.0"
xmlns:content="http://purl.org/rss/1.0/modules/content/"
xmlns:wfw="http://wellformedweb.org/CommentAPI/"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:atom="http://www.w3.org/2005/Atom"
xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
> <channel><title>素心如何天上月 &#187; sunpinyin-2.0</title> <atom:link href="http://yongsun.me/tag/sunpinyin-2-0/feed/" rel="self" type="application/rss+xml" /><link>http://yongsun.me</link> <description>Yong Sun&#039;s Blog</description> <lastBuildDate>Mon, 19 Mar 2012 02:29:22 +0000</lastBuildDate> <language>en</language> <sy:updatePeriod>hourly</sy:updatePeriod> <sy:updateFrequency>1</sy:updateFrequency> <generator>http://wordpress.org/?v=3.3.2</generator> <item><title>open-gram词表协议改为Apache V2.0</title><link>http://yongsun.me/2011/09/%e3%80%90%e5%85%ac%e5%91%8a%e3%80%91open-gram%e8%af%8d%e8%a1%a8%e5%8d%8f%e8%ae%ae%e6%9b%b4%e6%94%b9%e4%b8%baapache-v2-0/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=%25e3%2580%2590%25e5%2585%25ac%25e5%2591%258a%25e3%2580%2591open-gram%25e8%25af%258d%25e8%25a1%25a8%25e5%258d%258f%25e8%25ae%25ae%25e6%259b%25b4%25e6%2594%25b9%25e4%25b8%25baapache-v2-0</link> <comments>http://yongsun.me/2011/09/%e3%80%90%e5%85%ac%e5%91%8a%e3%80%91open-gram%e8%af%8d%e8%a1%a8%e5%8d%8f%e8%ae%ae%e6%9b%b4%e6%94%b9%e4%b8%baapache-v2-0/#comments</comments> <pubDate>Sat, 03 Sep 2011 16:19:24 +0000</pubDate> <dc:creator>yongsun</dc:creator> <category><![CDATA[Input Method]]></category> <category><![CDATA[open-gram]]></category> <category><![CDATA[sunpinyin]]></category> <category><![CDATA[sunpinyin-2.0]]></category> <guid
isPermaLink="false">http://yongsun.me/?p=1666</guid> <description><![CDATA[经过社区的讨论，我们一致同意，将open-grame词表的协议改为Apache V2.0。 新的词库将以android-google-pinyin的词库为基础 废弃之前基于cc-cedict的老词库，但是将open-gram自己发现/汇总的一些新词以Apache V2.0协议重新贡献给open-gram词表 libpinyin/novel-pinyin/smart-pinyin 项目lead已同意，将各自项目的词库，以Apache V2.0的协议贡献给open-gram项目 FIT团队同意将FIT输入法的网络热词，定期反馈给open-gram社区 非常感谢大家的支持和帮助！ SunPinyin的词库一直以来为大家所诟病，希望这次能为大家带来质量更好的词库，和更好的输入体验…]]></description> <content:encoded><![CDATA[<p>经过社区的讨论，我们一致同意，将open-grame词表的协议改为<a
href="http://www.apache.org/licenses/LICENSE-2.0.html">Apache V2.0</a>。</p><ul><li>新的词库将以android-google-pinyin的词库为基础</li><li>废弃之前基于cc-cedict的老词库，但是将open-gram自己发现/汇总的一些新词以Apache V2.0协议重新贡献给open-gram词表</li><li>libpinyin/novel-pinyin/smart-pinyin 项目lead已同意，将各自项目的词库，以Apache V2.0的协议贡献给open-gram项目</li><li>FIT团队同意将FIT输入法的网络热词，定期反馈给open-gram社区</li></ul><p>非常感谢大家的支持和帮助！</p><p>SunPinyin的词库一直以来为大家所诟病，希望这次能为大家带来质量更好的词库，和更好的输入体验…</p> ]]></content:encoded> <wfw:commentRss>http://yongsun.me/2011/09/%e3%80%90%e5%85%ac%e5%91%8a%e3%80%91open-gram%e8%af%8d%e8%a1%a8%e5%8d%8f%e8%ae%ae%e6%9b%b4%e6%94%b9%e4%b8%baapache-v2-0/feed/</wfw:commentRss> <slash:comments>4</slash:comments> </item> <item><title>sunpinyin-2.0.3 released</title><link>http://yongsun.me/2011/02/sunpinyin-2-0-3-released/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=sunpinyin-2-0-3-released</link> <comments>http://yongsun.me/2011/02/sunpinyin-2-0-3-released/#comments</comments> <pubDate>Fri, 18 Feb 2011 08:49:56 +0000</pubDate> <dc:creator>yongsun</dc:creator> <category><![CDATA[Input Method]]></category> <category><![CDATA[sunpinyin-2.0]]></category> <guid
isPermaLink="false">http://yongsun.me/?p=1566</guid> <description><![CDATA[在漫长的RC之后，sunpinyin社区release了2.0.3版本… Quoted from sunpinyin.org: 2.0.3 release is containing a lot of major fix compare to last release. User should update to this release as soon as possible. It fixed many inconveniet bugs. Changes compare to 2.0.2 are described below: Build: &#8230; <a
href="http://yongsun.me/2011/02/sunpinyin-2-0-3-released/">Continue reading <span
class="meta-nav">&#8594;</span></a>]]></description> <content:encoded><![CDATA[<p>在漫长的RC之后，sunpinyin社区release了2.0.3版本…</p><p>Quoted from <a
href="http://sunpinyin.org">sunpinyin.org</a>:</p><p>2.0.3 release is containing a lot of major fix compare to last  release.  User should update to this release as soon as possible.  It  fixed many inconveniet bugs.  Changes compare to 2.0.2 are described  below:</p><p>Build:</p><ul><li>CFLAGS, CXXFLAGS and LDFLAGS are recongnized.</li><li>Scons scripts now will remember the configuration arguments in configure.conf.</li><li>Ported to ARMEL architecture.</li><li>Able to build on FreeBSD.</li></ul><p>libsunpinyin:</p><ul><li>New LOGO!</li><li>History cache focus more on recent commits.</li><li>Supports --libdir and --libdatadir as configuration arguments.</li><li>Hunpin support. (Contributed by Hanjie Xu)</li><li>Fixed weird behavior of history with a single character.</li><li>Fixed a potential issue for candidate ranking.</li></ul><p>ibus-sunpinyin:</p><ul><li>Supports --libdir, --datadir, --execdir as configuration arguments.</li><li>Alt+num key as the candidate delete key for ibus-sunpinyin.</li><li>Able to build on IBus-1.4</li></ul><p>xsunpinyin:</p><ul><li>Synchronized the version between xsunpinyin and libsunpinyin project.</li><li>Fixed startup crash with empty directory.</li><li>Fixed position problem on multi-screen.</li><li>Fixed crash on exit, which caused history information lost.</li><li>Refact UI system</li><li>Added skin support</li><li>Fixed text overbound when pinyin are too long.</li><li>Fixed ignorance of ShuangPin setting.</li><li>Fixed weird behavior of fast switch to english. (<span
style="text-decoration: line-through;"><a
title="xsunpinyin candidate bar won't disappear after pressing shift" href="http://code.google.com/p/sunpinyin/issues/detail?id=213"> Issue 213 </a></span>).</li></ul><p>scim-sunpinyin:</p><ul><li>Add legacy support for scim (Thanks to liangguo)</li></ul> ]]></content:encoded> <wfw:commentRss>http://yongsun.me/2011/02/sunpinyin-2-0-3-released/feed/</wfw:commentRss> <slash:comments>28</slash:comments> </item> <item><title>FIT和SunPinyin展开全面合作</title><link>http://yongsun.me/2010/09/fit%e5%92%8csunpinyin%e5%b1%95%e5%bc%80%e5%85%a8%e9%9d%a2%e5%90%88%e4%bd%9c/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=fit%25e5%2592%258csunpinyin%25e5%25b1%2595%25e5%25bc%2580%25e5%2585%25a8%25e9%259d%25a2%25e5%2590%2588%25e4%25bd%259c</link> <comments>http://yongsun.me/2010/09/fit%e5%92%8csunpinyin%e5%b1%95%e5%bc%80%e5%85%a8%e9%9d%a2%e5%90%88%e4%bd%9c/#comments</comments> <pubDate>Wed, 15 Sep 2010 12:12:29 +0000</pubDate> <dc:creator>yongsun</dc:creator> <category><![CDATA[Input Method]]></category> <category><![CDATA[fit]]></category> <category><![CDATA[Mac]]></category> <category><![CDATA[sunpinyin-2.0]]></category> <guid
isPermaLink="false">http://yongsun.me/?p=1512</guid> <description><![CDATA[FIT和SunPinyin社区决定长期合作，联手制作下一个版本的FIT中文输入法。在合作中，FIT将使用SunPinyin的核心组件作为FIT的拼音输入引擎，完全替换掉旧版的fitx拼音引擎。新的拼音引擎将应用在FIT的Mac版、iPhone版和即将推出的iPad版。 对SunPinyin社区来说，SunPinyin的Mac版本将不会作为社区的工作重心，从而将更多的将精力集中到引擎、算法本身的改进中去，并全力协同FIT整合sunpinyin的输入引擎。FIT团队也会积极参与到引擎的改进和完善中，并将会负责SunPinyin-for-Mac的用户支持工作。SunPinyin-for-Mac依然遵循CDDL+LGPLv2.1，合作并不会妨碍任何有兴趣改进/完善它的朋友，贡献自己的努力。 另见FIT官方网站的声明。 FAQ： Q0. 为什么会有此次合作，这次合作有得到所有sunpinyin贡献者的认可吗？ 应该说FIT和SunPinyin-mac是mac平台上使用最广泛的free的拼音输入法，FIT的开发团队长于前端功能以及用户体验上的开发，sunpinyin社区长于输入引擎的算法。两个团体的合作，会融合两者的长处，打造更好的mac平台以及iOS平台上的拼音输入法。 关于合作的事宜，sunpinyin社区主要的、活跃的contributors，有经过详细的讨论，大家都充分表达了各自的意见；多数contributor都支持这一合作。 Q1. sunpinyin-mac被放弃了么？ 我更愿意将其解读为，FIT放弃了其自身的拼音引擎，转而采用sunpinyin的输入引擎；同时FIT团队也会积极参与到引擎的改进和完善的工作中，以及支持原有的sunpinyin-mac用户。sunpinyin的社区力量相比来说更加壮大了。sunpinyin-mac依然遵循CDDL+LGPLv2.1，合作并不会妨碍任何有兴趣改进/完善它的朋友，贡献自己的努力。 Q2. sunpinyin和fit的合作是因为收到Goopy的压力么？ fit和sunpinyin的合作意向，在Goopy“泄露”之前就已经达成了。sunpinyin的主要贡献者，基本上都是纯粹为了爱好和兴趣，我们的目标一直是，做最好的、开源的拼音输入法；Goopy的压力只会成为我们的动力，激励我们继续努力]]></description> <content:encoded><![CDATA[<p><img
class="alignnone" title="fit_and_sunpinyin" src="http://fit4.cn/uploads/blog/2010/fit_and_sun.jpg" alt="" width="259" height="155" /></p><p>FIT和SunPinyin社区决定长期合作，联手制作下一个版本的FIT中文输入法。在合作中，FIT将使用SunPinyin的核心组件作为FIT的拼音输入引擎，完全替换掉旧版的fitx拼音引擎。新的拼音引擎将应用在FIT的Mac版、iPhone版和即将推出的iPad版。</p><p>对SunPinyin社区来说，SunPinyin的Mac版本将不会作为社区的工作重心，从而将更多的将精力集中到引擎、算法本身的改进中去，并全力协同FIT整合sunpinyin的输入引擎。FIT团队也会积极参与到引擎的改进和完善中，并将会负责SunPinyin-for-Mac的用户支持工作。SunPinyin-for-Mac依然遵循CDDL+LGPLv2.1，合作并不会妨碍任何有兴趣改进/完善它的朋友，贡献自己的努力。</p><p>另见<a
href="http://fit4.cn/blog?bid=302">FIT官方网站的声明</a>。</p><p><strong>FAQ：</strong></p><p><strong>Q0. 为什么会有此次合作，这次合作有得到所有sunpinyin贡献者的认可吗？</strong></p><p>应该说FIT和SunPinyin-mac是mac平台上使用最广泛的free的拼音输入法，FIT的开发团队长于前端功能以及用户体验上的开发，sunpinyin社区长于输入引擎的算法。两个团体的合作，会融合两者的长处，打造更好的mac平台以及iOS平台上的拼音输入法。</p><p>关于合作的事宜，sunpinyin社区主要的、活跃的contributors，有经过详细的讨论，大家都充分表达了各自的意见；多数contributor都支持这一合作。</p><p><strong>Q1. sunpinyin-mac被放弃了么？</strong></p><p>我更愿意将其解读为，FIT放弃了其自身的拼音引擎，转而采用sunpinyin的输入引擎；同时FIT团队也会积极参与到引擎的改进和完善的工作中，以及支持原有的sunpinyin-mac用户。sunpinyin的社区力量相比来说更加壮大了。sunpinyin-mac依然遵循CDDL+LGPLv2.1，合作并不会妨碍任何有兴趣改进/完善它的朋友，贡献自己的努力。</p><p><strong>Q2. sunpinyin和fit的合作是因为收到Goopy的压力么？</strong></p><p>fit和sunpinyin的合作意向，在Goopy“泄露”之前就已经达成了。sunpinyin的主要贡献者，基本上都是纯粹为了爱好和兴趣，我们的目标一直是，做最好的、开源的拼音输入法；Goopy的压力只会成为我们的动力，激励我们继续努力 <img
src='http://yongsun.me/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /></p> ]]></content:encoded> <wfw:commentRss>http://yongsun.me/2010/09/fit%e5%92%8csunpinyin%e5%b1%95%e5%bc%80%e5%85%a8%e9%9d%a2%e5%90%88%e4%bd%9c/feed/</wfw:commentRss> <slash:comments>21</slash:comments> </item> <item><title>发布SunPinyin-MacOS-2.0.2.1008 (10.5/10.6)</title><link>http://yongsun.me/2010/08/%e5%8f%91%e5%b8%83sunpinyin-macos-2-0-2-1008-10-510-6/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=%25e5%258f%2591%25e5%25b8%2583sunpinyin-macos-2-0-2-1008-10-510-6</link> <comments>http://yongsun.me/2010/08/%e5%8f%91%e5%b8%83sunpinyin-macos-2-0-2-1008-10-510-6/#comments</comments> <pubDate>Mon, 23 Aug 2010 14:07:00 +0000</pubDate> <dc:creator>yongsun</dc:creator> <category><![CDATA[Input Method]]></category> <category><![CDATA[Mac]]></category> <category><![CDATA[sunpinyin-2.0]]></category> <guid
isPermaLink="false">http://yongsun.me/?p=1506</guid> <description><![CDATA[本次更新的主要内容包括： 加入了关闭/打开内模糊切分的选项 加入了使用backspace取消用户选择的选项 升级系统词库和语言模型至open-gram 0.1.22 解决了Sparkle升级时无法打开安装包的问题 加入了小鹤双拼方案的支持 bugfixes若干 功能方面和上次在twitter上放出的RC版本，没有什么不同，主要是将数据文件更新至了open-gram 0.1.22。虽然Sparkle升级时无法打开安装包的问题已经解决，但是得等到下一次更新的时候才能起作用；所以，烦请大家不要通过自动升级来安装，而是直接下载pkg包来安装 … 欢迎大家下载试用 …]]></description> <content:encoded><![CDATA[<p>本次更新的主要内容包括：</p><ol><li>加入了关闭/打开内模糊切分的选项</li><li>加入了使用backspace取消用户选择的选项</li><li>升级系统词库和语言模型至open-gram 0.1.22</li><li>解决了Sparkle升级时无法打开安装包的问题</li><li>加入了小鹤双拼方案的支持</li><li>bugfixes若干</li></ol><p>功能方面和上次在twitter上放出的RC版本，没有什么不同，主要是将数据文件更新至了open-gram 0.1.22。虽然Sparkle升级时无法打开安装包的问题已经解决，但是得等到下一次更新的时候才能起作用；所以，烦请大家不要通过自动升级来安装，而是直接下载pkg包来安装 …</p><p>欢迎大家<a
href="http://code.google.com/p/sunpinyin/downloads/detail?name=SunPinyin-MacOS-2.0.2.1008.zip">下载试用</a> …</p> ]]></content:encoded> <wfw:commentRss>http://yongsun.me/2010/08/%e5%8f%91%e5%b8%83sunpinyin-macos-2-0-2-1008-10-510-6/feed/</wfw:commentRss> <slash:comments>51</slash:comments> </item> <item><title>导入sogou输入法的细胞词库</title><link>http://yongsun.me/2010/07/%e5%af%bc%e5%85%a5sogou%e8%be%93%e5%85%a5%e6%b3%95%e7%9a%84%e7%bb%86%e8%83%9e%e8%af%8d%e5%ba%93/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=%25e5%25af%25bc%25e5%2585%25a5sogou%25e8%25be%2593%25e5%2585%25a5%25e6%25b3%2595%25e7%259a%2584%25e7%25bb%2586%25e8%2583%259e%25e8%25af%258d%25e5%25ba%2593</link> <comments>http://yongsun.me/2010/07/%e5%af%bc%e5%85%a5sogou%e8%be%93%e5%85%a5%e6%b3%95%e7%9a%84%e7%bb%86%e8%83%9e%e8%af%8d%e5%ba%93/#comments</comments> <pubDate>Thu, 15 Jul 2010 16:05:48 +0000</pubDate> <dc:creator>yongsun</dc:creator> <category><![CDATA[Input Method]]></category> <category><![CDATA[cell dict]]></category> <category><![CDATA[importer]]></category> <category><![CDATA[sogou]]></category> <category><![CDATA[sunpinyin-2.0]]></category> <guid
isPermaLink="false">http://yongsun.me/?p=1496</guid> <description><![CDATA[首先请下载这个导入工具，解压缩到某个目录中。从pinyin.sogou.com下载细胞词库（scel格式），保存在某个目录中。然后在terminal中执行下面的操作： $ python import_sogou_celldict.py PATH_TO_CELL_DICT.scel 感谢中文社区其他开发者和项目reverse engineering的工作， http://code.google.com/p/imewlconverter http://code.google.com/p/ibus-cloud-pinyin http://forum.ubuntu.org.cn/viewtopic.php?f=8&#38;t=250136&#38;start=0]]></description> <content:encoded><![CDATA[<p>首先请<a
href="http://sunpinyin.googlecode.com/files/sunpinyin_importer.tar.bz2">下载这个导入工具</a>，解压缩到某个目录中。从<a
href="http://pinyin.sogou.com">pinyin.sogou.com</a>下载细胞词库（scel格式），保存在某个目录中。然后在terminal中执行下面的操作：</p><p
style="padding-left: 30px;">$ python import_sogou_celldict.py PATH_TO_CELL_DICT.scel</p><p>感谢中文社区其他开发者和项目reverse engineering的工作，</p><ul><li><a
href="http://code.google.com/p/imewlconverter">http://code.google.com/p/imewlconverter</a></li><li><a
href="http://code.google.com/p/ibus-cloud-pinyin">http://code.google.com/p/ibus-cloud-pinyin</a></li><li><a
href="http://forum.ubuntu.org.cn/viewtopic.php?f=8&amp;t=250136&amp;start=0">http://forum.ubuntu.org.cn/viewtopic.php?f=8&amp;t=250136&amp;start=0</a></li></ul> ]]></content:encoded> <wfw:commentRss>http://yongsun.me/2010/07/%e5%af%bc%e5%85%a5sogou%e8%be%93%e5%85%a5%e6%b3%95%e7%9a%84%e7%bb%86%e8%83%9e%e8%af%8d%e5%ba%93/feed/</wfw:commentRss> <slash:comments>98</slash:comments> </item> <item><title>【紧急更新】SunPinyin-MacOS-2.0.2 (10.5/10.6) Patch 1</title><link>http://yongsun.me/2010/06/%e3%80%90%e7%b4%a7%e6%80%a5%e6%9b%b4%e6%96%b0%e3%80%91sunpinyin-macos-2-0-2-10-510-6-patch-1/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=%25e3%2580%2590%25e7%25b4%25a7%25e6%2580%25a5%25e6%259b%25b4%25e6%2596%25b0%25e3%2580%2591sunpinyin-macos-2-0-2-10-510-6-patch-1</link> <comments>http://yongsun.me/2010/06/%e3%80%90%e7%b4%a7%e6%80%a5%e6%9b%b4%e6%96%b0%e3%80%91sunpinyin-macos-2-0-2-10-510-6-patch-1/#comments</comments> <pubDate>Thu, 03 Jun 2010 14:46:52 +0000</pubDate> <dc:creator>yongsun</dc:creator> <category><![CDATA[Input Method]]></category> <category><![CDATA[Mac]]></category> <category><![CDATA[sunpinyin-2.0]]></category> <guid
isPermaLink="false">http://yongsun.me/?p=1459</guid> <description><![CDATA[非常灰常抱歉，昨天（06/02）发布的2.0.2中发现有一个crash的bug，感谢@fishwang同学的bug report。我刚刚fix了这个bug（#134），并上传了最新的2.0.2的完整安装包，原链接不变。烦请您重新下载安装，对给您带来的不便，实在是万分抱歉]]></description> <content:encoded><![CDATA[<p>非常灰常抱歉，<a
href="http://yongsun.me/2010/06/%e5%8f%91%e5%b8%83-sunpinyin-macos-2-0-2-10-510-6/">昨天（06/02）发布的2.0.2</a>中发现有一个crash的bug，感谢<a
href="http://twitter.com/fishywang">@fishwang</a>同学的bug report。我刚刚fix了这个bug（<a
href="http://code.google.com/p/sunpinyin/issues/detail?id=134">#134</a>），并上传了最新的2.0.2的完整安装包，<a
href="http://code.google.com/p/sunpinyin/downloads/detail?name=SunPinyin-MacOS-2.0.2.zip">原链接</a>不变。烦请您重新<a
href="http://code.google.com/p/sunpinyin/downloads/detail?name=SunPinyin-MacOS-2.0.2.zip">下载安装</a>，对给您带来的不便，实在是万分抱歉 <img
src='http://yongsun.me/wp-includes/images/smilies/icon_sad.gif' alt=':(' class='wp-smiley' /></p> ]]></content:encoded> <wfw:commentRss>http://yongsun.me/2010/06/%e3%80%90%e7%b4%a7%e6%80%a5%e6%9b%b4%e6%96%b0%e3%80%91sunpinyin-macos-2-0-2-10-510-6-patch-1/feed/</wfw:commentRss> <slash:comments>34</slash:comments> </item> <item><title>发布 SunPinyin-MacOS-2.0.2 (10.5/10.6)</title><link>http://yongsun.me/2010/06/%e5%8f%91%e5%b8%83-sunpinyin-macos-2-0-2-10-510-6/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=%25e5%258f%2591%25e5%25b8%2583-sunpinyin-macos-2-0-2-10-510-6</link> <comments>http://yongsun.me/2010/06/%e5%8f%91%e5%b8%83-sunpinyin-macos-2-0-2-10-510-6/#comments</comments> <pubDate>Wed, 02 Jun 2010 13:57:03 +0000</pubDate> <dc:creator>yongsun</dc:creator> <category><![CDATA[Input Method]]></category> <category><![CDATA[Mac]]></category> <category><![CDATA[sunpinyin-2.0]]></category> <guid
isPermaLink="false">http://yongsun.me/?p=1451</guid> <description><![CDATA[本次更新主要是对2.0.2-beta-1进行了一些修正，加入了“声母简写（z/c/s-&#62;zh/ch/sh）”的选项，也加入了全角空格的支持（尚未支持全角小写字母）。 从2.0.2开始，SunPinyin 2 for Mac 全面采用了open-gram的词库和语言模型，因此会导致您的history cache无效，您可以在执行完安装程序之后，手工删除现有的history cache文件（$ rm ~/Library/Application\ Support/SunPinyin/history）。另外一个重大的更改是，扩大了wordID的范围，使系统词库+用户词库的理论容量可以达到2^24，您现在可以放心导入比较大的个人词库了。不过这也导致了和2.0/2.0.1的词库格式不相兼容。 正是由于上面两个原因，2.0.2的安装包中，直接包括了lm_sc.t3g.le和pydict_sc.bin.le的二进制数据文件，大家可以直接安装就好。另外，sunpinyin_importer中的系统词表也更新为open-gram的词表了。 对于power的mac用户来说，我们已经解决了大端数据的生成问题，请在安装时下载相应的数据文件 ... 另外，非常抱歉的是，sparkle自动升级的问题还没有来得及解决，请大家不要通过自动升级来安装，而是直接下载pkg包来安装 ... 欢迎大家下载试用 ...]]></description> <content:encoded><![CDATA[<p>本次更新主要是对<a
href="http://yongsun.me/2010/05/%e6%9b%b4%e6%96%b0sunpinyin-macos-2-0-2-beta-1-10-510-6/">2.0.2-beta-1</a>进行了一些修正，加入了“声母简写（z/c/s-&gt;zh/ch/sh）”的选项，也加入了全角空格的支持（尚未支持全角小写字母）。</p><p>从2.0.2开始，SunPinyin 2 for Mac 全面采用了<a
href="http://sunpinyin.org/open-gram">open-gram</a>的词库和语言模型，因此会导致您的history cache无效，您可以在执行完安装程序之后，手工删除现有的history cache文件（$ rm ~/Library/Application\ Support/SunPinyin/history）。另外一个重大的更改是，扩大了wordID的范围，使系统词库+用户词库的理论容量可以达到2^24，您现在可以放心导入比较大的个人词库了。不过这也导致了和2.0/2.0.1的词库格式不相兼容。</p><p>正是由于上面两个原因，2.0.2的安装包中，直接包括了lm_sc.t3g.le和pydict_sc.bin.le的二进制数据文件，大家可以直接安装就好。另外，<a
href="http://code.google.com/p/sunpinyin/downloads/detail?name=sunpinyin_importer.tar.bz2">sunpinyin_importer</a>中的系统词表也更新为open-gram的词表了。</p><p>对于power的mac用户来说，我们已经解决了大端数据的生成问题，请在安装时下载相应的数据文件 ... 另外，非常抱歉的是，sparkle自动升级的问题还没有来得及解决，<span
style="background-color: #ffff00;">请大家不要通过自动升级来安装，而是直接下载pkg包来安装</span> ...</p><p>欢迎大家<a
href="http://code.google.com/p/sunpinyin/downloads/detail?name=SunPinyin-MacOS-2.0.2.zip">下载试用</a> ...</p> ]]></content:encoded> <wfw:commentRss>http://yongsun.me/2010/06/%e5%8f%91%e5%b8%83-sunpinyin-macos-2-0-2-10-510-6/feed/</wfw:commentRss> <slash:comments>20</slash:comments> </item> <item><title>更新SunPinyin-MacOS-2.0.2 beta 1 (10.5/10.6)</title><link>http://yongsun.me/2010/05/%e6%9b%b4%e6%96%b0sunpinyin-macos-2-0-2-beta-1-10-510-6/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=%25e6%259b%25b4%25e6%2596%25b0sunpinyin-macos-2-0-2-beta-1-10-510-6</link> <comments>http://yongsun.me/2010/05/%e6%9b%b4%e6%96%b0sunpinyin-macos-2-0-2-beta-1-10-510-6/#comments</comments> <pubDate>Tue, 04 May 2010 15:05:45 +0000</pubDate> <dc:creator>yongsun</dc:creator> <category><![CDATA[Input Method]]></category> <category><![CDATA[Mac]]></category> <category><![CDATA[sunpinyin-2.0]]></category> <guid
isPermaLink="false">http://yongsun.me/?p=1345</guid> <description><![CDATA[本此更新的主要内容包括： 为全拼切分器加入了模糊切分的功能，即根据上下文将fangan自动切分为fang'an或fan'gan。 为双拼加入了南方模糊音的功能。 将删除用户自造词的快捷键改为ctrl+command+num，以避免和Space的快捷键相冲突。 上述的一些功能，虽已大体稳定，但尚未经过严格的测试；另外还有其他一些bug fixes，也计划在2.0.2中加入。欢迎有兴趣尝鲜的朋友下载试用，SunPinyin-MacOS-2.0.2-beta1.zip。已安装2.0/2.0.1版本的朋友，无需删除已安装的版本，直接运行安装程序即可。 首次安装的朋友请注意，当安装程序进行到“下载数据文件”步骤时，请点击“开始…”按钮下载必要的数据文件（文件较大，可能比较耗时）。]]></description> <content:encoded><![CDATA[<p>本此更新的主要内容包括：</p><ol><li>为全拼切分器加入了模糊切分的功能，即根据上下文将fangan自动切分为fang'an或fan'gan。</li><li>为双拼加入了南方模糊音的功能。</li><li>将删除用户自造词的快捷键改为ctrl+command+num，以避免和Space的快捷键相冲突。</li></ol><p
style="padding-left: 30px;"><a
href="http://yongsun.me/wp-content/uploads/2010/05/sunpinyin-2.0.2-mac-pinyin-setup.png"><img
class="size-medium wp-image-1348 alignnone" title="sunpinyin-2.0.2-mac-pinyin-setup" src="http://yongsun.me/wp-content/uploads/2010/05/sunpinyin-2.0.2-mac-pinyin-setup-300x274.png" alt="" width="300" height="274" /></a></p><p><a
href="http://yongsun.me/wp-content/uploads/2010/05/sunpinyin-2.0.2-mac-fuzzy-segmentation.png"><img
class="size-medium wp-image-1346 alignnone" title="sunpinyin-2.0.2-mac-fuzzy-segmentation" src="http://yongsun.me/wp-content/uploads/2010/05/sunpinyin-2.0.2-mac-fuzzy-segmentation.png" alt="" width="603" height="54" /></a></p><p>上述的一些功能，虽已大体稳定，但尚未经过严格的测试；另外还有其他一些bug fixes，也计划在2.0.2中加入。欢迎有兴趣尝鲜的朋友下载试用，<a
title="http://sunpinyin.googlecode.com/files/SunPinyin-MacOS-2.0.2-beta1.zip" href="http://sunpinyin.googlecode.com/files/SunPinyin-MacOS-2.0.2-beta1.zip">SunPinyin-MacOS-2.0.2-beta1.zip</a>。已安装2.0/2.0.1版本的朋友，无需删除已安装的版本，直接运行安装程序即可。</p><p>首次安装的朋友请注意，当安装程序进行到“下载数据文件”步骤时，请点击“开始…”按钮下载必要的数据文件（文件较大，可能比较耗时）。</p><p><img
class="size-medium wp-image-1254 alignnone" title="sunpinyin-2.0-mac-installation-note" src="http://yongsun.me/wp-content/uploads/2010/03/sunpinyin-2.0-mac-installation-note.png" alt="" width="441" height="328" /></p> ]]></content:encoded> <wfw:commentRss>http://yongsun.me/2010/05/%e6%9b%b4%e6%96%b0sunpinyin-macos-2-0-2-beta-1-10-510-6/feed/</wfw:commentRss> <slash:comments>57</slash:comments> </item> <item><title>SunPinyin-2.0模糊音节切分的实现</title><link>http://yongsun.me/2010/04/sunpinyin-2-0%e6%a8%a1%e7%b3%8a%e9%9f%b3%e8%8a%82%e5%88%87%e5%88%86%e7%9a%84%e5%ae%9e%e7%8e%b0/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=sunpinyin-2-0%25e6%25a8%25a1%25e7%25b3%258a%25e9%259f%25b3%25e8%258a%2582%25e5%2588%2587%25e5%2588%2586%25e7%259a%2584%25e5%25ae%259e%25e7%258e%25b0</link> <comments>http://yongsun.me/2010/04/sunpinyin-2-0%e6%a8%a1%e7%b3%8a%e9%9f%b3%e8%8a%82%e5%88%87%e5%88%86%e7%9a%84%e5%ae%9e%e7%8e%b0/#comments</comments> <pubDate>Tue, 27 Apr 2010 14:17:50 +0000</pubDate> <dc:creator>yongsun</dc:creator> <category><![CDATA[Input Method]]></category> <category><![CDATA[fuzzy-segmentation]]></category> <category><![CDATA[sunpinyin-2.0]]></category> <guid
isPermaLink="false">http://yongsun.me/?p=1325</guid> <description><![CDATA[模糊切分，即根据上下文，将有歧义的拼音字符串进行自动切分，例如，将fangan切分为fang'an或fan'gan。这是许多现代拼音输入法都具备的功能。SunPinyin的ime-core本身具有搜索多种切分组合的能力，只要在buildLattice时，保证传入的segments是按照起始位置（m_start）排好顺序的即可。 那么首先要解决的问题就是，根据得到的最佳句子，反查到对应的切分序列。例如，最佳句子是“我的方案获得通过”，可以推得“wo'de'fang'an'huo'de'tong'guo”。 我们为TLexiconState加入了m_seg_path的成员，用来记录这个LexiconState对应的切分路径，例如我们有一个lexiconState对应是上例中的fang'an，其切分路径是[4, 8, 10]。然后，为CLatticeState加入了m_pLexiconState成员，用来记录之前transfer时所引用的那个lexiconState。这样，在backTrace最佳句子的时候，就可以得到对应的音节了。由于易混淆音（即z&#60;-&#62;zh）的存在，一个seg_path可能对应多个syllable_paths（m_syls）；但是最后在存入用户词典时，必须要知道真实的syllables，所以没有采用TLexiconState结构包含一个seg_path、和多个syllable_paths的方案。 接下来，就是该如何产生模糊切分的了。我们为CPinyinData类加入了一些额外的table，这些table都是使用pinyin_data.py脚本生成的。包括fuzzy_finals_map，这是为处理型如xian-&#62;xian/xi'an的模糊切分的；以及fuzzy_pre_syllables和fuzzy_pro_syllables，分别代表可能产生切分歧义的前一个音节和后一个音节。经过pinyin_data.py的筛选，发现只有“r/g/n”三个声母，可能作为前一个音节的结尾，或后一个音节的声母。 接下来，我们为CQuanpinSegmentor加入了一个新的helper functor，CGetFuzzySegmentsOp。这个助手类的输入是主切分器（即基于double-array trie的、改良的、最大后向匹配算法）所得到的segments；输出是，其对应的模糊切分segments。这个寻找模糊切分的过程，和切分器的主过程是平行的。但是，我们并不是简单的每次输入都从头到尾扫描一遍。 首先，根据主切分序列的最后一个segment（记为seg），invalidate那些受影响的fuzzy segments。在我们目前的实现中，fuzzy_segs中的模糊切分都是成对出现的，我们从后向前一对一对的进行筛选，只有当某一对的右边界（r），小于或等于seg的起始位置，才能够保留下来。然后，我们仅需要对主切分的最后一个切分（如果是xian的情况），或最近两个切分（如果是fangan的情况），进行处理。然后小心地调整好updatedFrom的值，并返回给CQuanpinSegmentor::_push()。 因此，如果输入xian，会生成xian和xi'an的两种切分，如果继续输入一个a，则会得到xia'na和xian'a，而不会包括xi'an'a这个切分了。主切分器的最后一个segment（即na），会先将xi'an给invalidate掉；然后辅助切分器会将xian'a加入到fuzzy_segs中。从这一点来说，我们和google和sogou输入法的处理仍然有所不同，他们都会保留xi'an'a这个切分。 我个人的感觉，sogou和google输入法每次在追加或删除一个拼音字符时，都是会从头进行一遍扫描处理；其间处理了各种情况，包括易混淆音，自动就错，和模糊音节切分等。而SunPinyin的push/pop操作，尽可能少的对拼音字符串进行扫描和匹配，应该来说效率要高一些。而且，我感觉目前的这种实现方式，也基本满足大家的需要了。:) 返回到_push方法之后，如果设置了易混淆音，就对m_fuzzy_segs的最后两个segments，加入易混淆音。无论之前是否已经加入过易混淆音，CQuanpinSegmentor::_addFuzzySyllables都会先将seg.m_syllables resize为1，即清空了之前的易混淆音。 最后，在getSegments()时，将m_fuzzy_segs和m_segs合并到m_merged_segs中，并按照m_start排好顺序，返回给外层的调用者。我们今后可能会改进这部分，其实m_segs和m_fuzzy_segs都是有序的，只要让CIMIContext::buildLattice可以按照m_start的顺序，同时迭代这两个有序的vector就可以了。 还有其他的一些辅助的修改，例如，CIMIContext::getCandidates的循环退出条件不同了，导致我们现在迭代的次数会明显增多了，需要想一些更好的解决方法。]]></description> <content:encoded><![CDATA[<p>模糊切分，即根据上下文，将有歧义的拼音字符串进行自动切分，例如，将fangan切分为fang'an或fan'gan。这是许多现代拼音输入法都具备的功能。SunPinyin的ime-core本身具有搜索多种切分组合的能力，只要在buildLattice时，保证传入的segments是按照起始位置（m_start）排好顺序的即可。</p><p>那么首先要解决的问题就是，根据得到的最佳句子，反查到对应的切分序列。例如，最佳句子是“我的方案获得通过”，可以推得“wo'de'fang'an'huo'de'tong'guo”。</p><p>我们为TLexiconState加入了m_seg_path的成员，用来记录这个LexiconState对应的切分路径，例如我们有一个lexiconState对应是上例中的fang'an，其切分路径是[4, 8, 10]。然后，为CLatticeState加入了m_pLexiconState成员，用来记录之前transfer时所引用的那个lexiconState。这样，在backTrace最佳句子的时候，就可以得到对应的音节了。由于易混淆音（即z&lt;-&gt;zh）的存在，一个seg_path可能对应多个syllable_paths（m_syls）；但是最后在存入用户词典时，必须要知道真实的syllables，所以没有采用TLexiconState结构包含一个seg_path、和多个syllable_paths的方案。</p><p>接下来，就是该如何产生模糊切分的了。我们为CPinyinData类加入了一些额外的table，这些table都是使用pinyin_data.py脚本生成的。包括fuzzy_finals_map，这是为处理型如xian-&gt;xian/xi'an的模糊切分的；以及fuzzy_pre_syllables和fuzzy_pro_syllables，分别代表可能产生切分歧义的前一个音节和后一个音节。经过pinyin_data.py的筛选，发现只有“r/g/n”三个声母，可能作为前一个音节的结尾，或后一个音节的声母。</p><p>接下来，我们为CQuanpinSegmentor加入了一个新的helper functor，CGetFuzzySegmentsOp。这个助手类的输入是主切分器（即基于double-array trie的、改良的、最大后向匹配算法）所得到的segments；输出是，其对应的模糊切分segments。这个寻找模糊切分的过程，和切分器的主过程是平行的。但是，我们并不是简单的每次输入都从头到尾扫描一遍。</p><p>首先，根据主切分序列的最后一个segment（记为seg），invalidate那些受影响的fuzzy segments。在我们目前的实现中，fuzzy_segs中的模糊切分都是成对出现的，我们从后向前一对一对的进行筛选，只有当某一对的右边界（r），小于或等于seg的起始位置，才能够保留下来。然后，我们仅需要对主切分的最后一个切分（如果是xian的情况），或最近两个切分（如果是fangan的情况），进行处理。然后小心地调整好updatedFrom的值，并返回给CQuanpinSegmentor::_push()。</p><p>因此，如果输入xian，会生成xian和xi'an的两种切分，如果继续输入一个a，则会得到xia'na和xian'a，而不会包括xi'an'a这个切分了。主切分器的最后一个segment（即na），会先将xi'an给invalidate掉；然后辅助切分器会将xian'a加入到fuzzy_segs中。从这一点来说，我们和google和sogou输入法的处理仍然有所不同，他们都会保留xi'an'a这个切分。</p><p>我个人的感觉，sogou和google输入法每次在追加或删除一个拼音字符时，都是会从头进行一遍扫描处理；其间处理了各种情况，包括易混淆音，自动就错，和模糊音节切分等。而SunPinyin的push/pop操作，尽可能少的对拼音字符串进行扫描和匹配，应该来说效率要高一些。而且，我感觉目前的这种实现方式，也基本满足大家的需要了。:)</p><p>返回到_push方法之后，如果设置了易混淆音，就对m_fuzzy_segs的最后两个segments，加入易混淆音。无论之前是否已经加入过易混淆音，CQuanpinSegmentor::_addFuzzySyllables都会先将seg.m_syllables resize为1，即清空了之前的易混淆音。</p><p>最后，在getSegments()时，将m_fuzzy_segs和m_segs合并到m_merged_segs中，并按照m_start排好顺序，返回给外层的调用者。我们今后可能会改进这部分，其实m_segs和m_fuzzy_segs都是有序的，只要让CIMIContext::buildLattice可以按照m_start的顺序，同时迭代这两个有序的vector就可以了。</p><p>还有其他的一些辅助的修改，例如，CIMIContext::getCandidates的循环退出条件不同了，导致我们现在迭代的次数会明显增多了，需要想一些更好的解决方法。</p> ]]></content:encoded> <wfw:commentRss>http://yongsun.me/2010/04/sunpinyin-2-0%e6%a8%a1%e7%b3%8a%e9%9f%b3%e8%8a%82%e5%88%87%e5%88%86%e7%9a%84%e5%ae%9e%e7%8e%b0/feed/</wfw:commentRss> <slash:comments>22</slash:comments> </item> <item><title>初步实现了sunpinyin-2.0的模糊音节切分</title><link>http://yongsun.me/2010/04/%e5%88%9d%e6%ad%a5%e5%ae%9e%e7%8e%b0%e4%ba%86sunpinyin-2-0%e7%9a%84%e6%a8%a1%e7%b3%8a%e9%9f%b3%e8%8a%82%e5%88%87%e5%88%86/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=%25e5%2588%259d%25e6%25ad%25a5%25e5%25ae%259e%25e7%258e%25b0%25e4%25ba%2586sunpinyin-2-0%25e7%259a%2584%25e6%25a8%25a1%25e7%25b3%258a%25e9%259f%25b3%25e8%258a%2582%25e5%2588%2587%25e5%2588%2586</link> <comments>http://yongsun.me/2010/04/%e5%88%9d%e6%ad%a5%e5%ae%9e%e7%8e%b0%e4%ba%86sunpinyin-2-0%e7%9a%84%e6%a8%a1%e7%b3%8a%e9%9f%b3%e8%8a%82%e5%88%87%e5%88%86/#comments</comments> <pubDate>Wed, 21 Apr 2010 14:46:43 +0000</pubDate> <dc:creator>yongsun</dc:creator> <category><![CDATA[Input Method]]></category> <category><![CDATA[fuzzy-segmentation]]></category> <category><![CDATA[sunpinyin-2.0]]></category> <guid
isPermaLink="false">http://yongsun.me/?p=1321</guid> <description><![CDATA[SunPinyin-2.0的模糊切分（例如，根据上下文将fangan自动切分为fang'an或fan'gan），取得阶段性进展，不过还有很多扫尾的工作要做，先上个图给大家show一下：]]></description> <content:encoded><![CDATA[<p>SunPinyin-2.0的模糊切分（例如，根据上下文将fangan自动切分为fang'an或fan'gan），取得阶段性进展，不过还有很多扫尾的工作要做，先上个图给大家show一下：</p><p><a
href="http://yongsun.me/wp-content/uploads/2010/04/sunpinyin_2.0_fuzzy_segmentation.png"><img
class="alignleft size-medium wp-image-1320" title="sunpinyin_2.0_fuzzy_segmentation" src="http://yongsun.me/wp-content/uploads/2010/04/sunpinyin_2.0_fuzzy_segmentation.png" alt="" /></a></p> ]]></content:encoded> <wfw:commentRss>http://yongsun.me/2010/04/%e5%88%9d%e6%ad%a5%e5%ae%9e%e7%8e%b0%e4%ba%86sunpinyin-2-0%e7%9a%84%e6%a8%a1%e7%b3%8a%e9%9f%b3%e8%8a%82%e5%88%87%e5%88%86/feed/</wfw:commentRss> <slash:comments>4</slash:comments> </item> </channel> </rss>
