<?xml version="1.0" encoding="UTF-8"?><rss
version="2.0"
xmlns:content="http://purl.org/rss/1.0/modules/content/"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:atom="http://www.w3.org/2005/Atom"
xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
> <channel><title>Comments on: open-gram项目简介</title> <atom:link href="http://yongsun.me/2010/03/open-gram%e9%a1%b9%e7%9b%ae%e7%ae%80%e4%bb%8b/feed/" rel="self" type="application/rss+xml" /><link>http://yongsun.me/2010/03/open-gram%e9%a1%b9%e7%9b%ae%e7%ae%80%e4%bb%8b/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=open-gram%25e9%25a1%25b9%25e7%259b%25ae%25e7%25ae%2580%25e4%25bb%258b</link> <description>Yong Sun&#039;s Blog</description> <lastBuildDate>Wed, 16 May 2012 04:13:59 +0000</lastBuildDate> <sy:updatePeriod>hourly</sy:updatePeriod> <sy:updateFrequency>1</sy:updateFrequency> <generator>http://wordpress.org/?v=3.3.2</generator> <item><title>By: yongsun</title><link>http://yongsun.me/2010/03/open-gram%e9%a1%b9%e7%9b%ae%e7%ae%80%e4%bb%8b/comment-page-1/#comment-2335</link> <dc:creator>yongsun</dc:creator> <pubDate>Wed, 09 Jun 2010 00:45:26 +0000</pubDate> <guid
isPermaLink="false">http://yongsun.me/?p=1056#comment-2335</guid> <description>@jiapu, 我们的确需要有篇文档来说明一下，
人文社会科学：n-gram（本例中是unigram）
0.000000004155：p(w&#124;h)，如果n-gram是A/B/C，这个概率值是p(C&#124;AB)
1.000000000000：bow(h)，如果n-gram是A/B/C，这个值是bow(AB)
(0, 0)：回退到低阶n-gram的索引（不一定总是n-1），本例中，第一个0表示是回退到平均分布的0-gram，第二个0表示是0-gram上的index</description> <content:encoded><![CDATA[<p>@jiapu, 我们的确需要有篇文档来说明一下，</p><p>人文社会科学：n-gram（本例中是unigram）<br
/> 0.000000004155：p(w|h)，如果n-gram是A/B/C，这个概率值是p(C|AB)<br
/> 1.000000000000：bow(h)，如果n-gram是A/B/C，这个值是bow(AB)<br
/> (0, 0)：回退到低阶n-gram的索引（不一定总是n-1），本例中，第一个0表示是回退到平均分布的0-gram，第二个0表示是0-gram上的index</p> ]]></content:encoded> </item> <item><title>By: jia pu</title><link>http://yongsun.me/2010/03/open-gram%e9%a1%b9%e7%9b%ae%e7%ae%80%e4%bb%8b/comment-page-1/#comment-2333</link> <dc:creator>jia pu</dc:creator> <pubDate>Wed, 09 Jun 2010 00:20:45 +0000</pubDate> <guid
isPermaLink="false">http://yongsun.me/?p=1056#comment-2333</guid> <description>Hello,
I&#039;m curious how I should interpret each column in the lm_sc.t3g.arpa, for instance:
人文社会学科   0.000000004155   1.000000000000 (0,0)
Thanks.</description> <content:encoded><![CDATA[<p>Hello,</p><p>I'm curious how I should interpret each column in the lm_sc.t3g.arpa, for instance:</p><p>人文社会学科   0.000000004155   1.000000000000 (0,0)</p><p>Thanks.</p> ]]></content:encoded> </item> <item><title>By: tchaikov</title><link>http://yongsun.me/2010/03/open-gram%e9%a1%b9%e7%9b%ae%e7%ae%80%e4%bb%8b/comment-page-1/#comment-1896</link> <dc:creator>tchaikov</dc:creator> <pubDate>Fri, 05 Mar 2010 07:37:32 +0000</pubDate> <guid
isPermaLink="false">http://yongsun.me/?p=1056#comment-1896</guid> <description>错了，我用的是 cconv 不是 pyzh。:P</description> <content:encoded><![CDATA[<p>错了，我用的是 cconv 不是 pyzh。:P</p> ]]></content:encoded> </item> <item><title>By: tchaikov</title><link>http://yongsun.me/2010/03/open-gram%e9%a1%b9%e7%9b%ae%e7%ae%80%e4%bb%8b/comment-page-1/#comment-1895</link> <dc:creator>tchaikov</dc:creator> <pubDate>Fri, 05 Mar 2010 04:36:09 +0000</pubDate> <guid
isPermaLink="false">http://yongsun.me/?p=1056#comment-1895</guid> <description>对了，ibus-pinyin-data 现在叫 ibus-pinyin-db-open-phrase，已经进入了 ubuntu 和 debian。license 是 GPLv2。</description> <content:encoded><![CDATA[<p>对了，ibus-pinyin-data 现在叫 ibus-pinyin-db-open-phrase，已经进入了 ubuntu 和 debian。license 是 GPLv2。</p> ]]></content:encoded> </item> <item><title>By: tchaikov</title><link>http://yongsun.me/2010/03/open-gram%e9%a1%b9%e7%9b%ae%e7%ae%80%e4%bb%8b/comment-page-1/#comment-1894</link> <dc:creator>tchaikov</dc:creator> <pubDate>Fri, 05 Mar 2010 04:12:12 +0000</pubDate> <guid
isPermaLink="false">http://yongsun.me/?p=1056#comment-1894</guid> <description>不是的，那样根本就是不是繁简转换嘛。我目前是用 http://code.google.com/p/pyzh/ 提供的工具。接下来，我准备用 wikipedia 提供的对照表来转换。</description> <content:encoded><![CDATA[<p>不是的，那样根本就是不是繁简转换嘛。我目前是用 <a
href="http://code.google.com/p/pyzh/" rel="nofollow">http://code.google.com/p/pyzh/</a> 提供的工具。接下来，我准备用 wikipedia 提供的对照表来转换。</p> ]]></content:encoded> </item> <item><title>By: yongsun</title><link>http://yongsun.me/2010/03/open-gram%e9%a1%b9%e7%9b%ae%e7%ae%80%e4%bb%8b/comment-page-1/#comment-1893</link> <dc:creator>yongsun</dc:creator> <pubDate>Fri, 05 Mar 2010 04:09:43 +0000</pubDate> <guid
isPermaLink="false">http://yongsun.me/?p=1056#comment-1893</guid> <description>btw, 你是如何将其转换为简体的呢？by iconv?</description> <content:encoded><![CDATA[<p>btw, 你是如何将其转换为简体的呢？by iconv?</p> ]]></content:encoded> </item> <item><title>By: yongsun</title><link>http://yongsun.me/2010/03/open-gram%e9%a1%b9%e7%9b%ae%e7%ae%80%e4%bb%8b/comment-page-1/#comment-1892</link> <dc:creator>yongsun</dc:creator> <pubDate>Fri, 05 Mar 2010 04:08:46 +0000</pubDate> <guid
isPermaLink="false">http://yongsun.me/?p=1056#comment-1892</guid> <description>@tchaikov, cool! :)</description> <content:encoded><![CDATA[<p>@tchaikov, cool! <img
src='http://yongsun.me/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /></p> ]]></content:encoded> </item> <item><title>By: tchaikov</title><link>http://yongsun.me/2010/03/open-gram%e9%a1%b9%e7%9b%ae%e7%ae%80%e4%bb%8b/comment-page-1/#comment-1891</link> <dc:creator>tchaikov</dc:creator> <pubDate>Fri, 05 Mar 2010 03:47:50 +0000</pubDate> <guid
isPermaLink="false">http://yongsun.me/?p=1056#comment-1891</guid> <description>刚改正了一个 bug。原来的 zh.wikipedia 下载得到的语料用的是繁体。里面的”於“在转换的时候没有变成”于“，同时因为它是多音字，有个读音是”wu“，导致 &quot;wu&quot; 第一个就是它。新的版本已经上传了。</description> <content:encoded><![CDATA[<p>刚改正了一个 bug。原来的 zh.wikipedia 下载得到的语料用的是繁体。里面的”於“在转换的时候没有变成”于“，同时因为它是多音字，有个读音是”wu“，导致 "wu" 第一个就是它。新的版本已经上传了。</p> ]]></content:encoded> </item> </channel> </rss>
