基于信息增益改进贝叶斯模型的汉语词义消歧

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于信息增益改进贝叶斯模型的汉语词义消歧

范冬梅, 卢志茂, 张汝波, 潘树燊

文章导航 > 电子与信息学报 > 2008 > 30(12): 2926-2929

范冬梅, 卢志茂, 张汝波, 潘树燊. 基于信息增益改进贝叶斯模型的汉语词义消歧[J]. 电子与信息学报, 2008, 30(12): 2926-2929. doi: 10.3724/SP.J.1146.2007.00868

引用本文:

范冬梅, 卢志茂, 张汝波, 潘树燊. 基于信息增益改进贝叶斯模型的汉语词义消歧[J]. 电子与信息学报, 2008, 30(12): 2926-2929. doi: 10.3724/SP.J.1146.2007.00868

Fan Dong-Mei, Lu Zhi-Mao, Zhang Ru-Bo, Pan Shu-Shen. Chinese Word Sense Disambiguation Based on Bayesian Model Improved by Information Gain[J]. Journal of Electronics & Information Technology, 2008, 30(12): 2926-2929. doi: 10.3724/SP.J.1146.2007.00868

Citation:

Fan Dong-Mei, Lu Zhi-Mao, Zhang Ru-Bo, Pan Shu-Shen. Chinese Word Sense Disambiguation Based on Bayesian Model Improved by Information Gain[J]. Journal of Electronics & Information Technology, 2008, 30(12): 2926-2929. doi: 10.3724/SP.J.1146.2007.00868

范冬梅, 卢志茂, 张汝波, 潘树燊. 基于信息增益改进贝叶斯模型的汉语词义消歧[J]. 电子与信息学报, 2008, 30(12): 2926-2929. doi: 10.3724/SP.J.1146.2007.00868

引用本文:

范冬梅, 卢志茂, 张汝波, 潘树燊. 基于信息增益改进贝叶斯模型的汉语词义消歧[J]. 电子与信息学报, 2008, 30(12): 2926-2929. doi: 10.3724/SP.J.1146.2007.00868

Fan Dong-Mei, Lu Zhi-Mao, Zhang Ru-Bo, Pan Shu-Shen. Chinese Word Sense Disambiguation Based on Bayesian Model Improved by Information Gain[J]. Journal of Electronics & Information Technology, 2008, 30(12): 2926-2929. doi: 10.3724/SP.J.1146.2007.00868

Citation:

Fan Dong-Mei, Lu Zhi-Mao, Zhang Ru-Bo, Pan Shu-Shen. Chinese Word Sense Disambiguation Based on Bayesian Model Improved by Information Gain[J]. Journal of Electronics & Information Technology, 2008, 30(12): 2926-2929. doi: 10.3724/SP.J.1146.2007.00868

基于信息增益改进贝叶斯模型的汉语词义消歧

doi: 10.3724/SP.J.1146.2007.00868

范冬梅^{① 卢志茂,},
卢志茂,
张汝波,
潘树燊

基金项目:

国家自然科学基金(60575042，60603092)和国家教育部博士点专向基金(20070217043)资助课题

计量
- 文章访问数: 3391
- HTML全文浏览量: 100
- PDF下载量: 1221
- 被引次数: 0
出版历程
- 收稿日期: 2007-06-04
- 修回日期: 2008-09-23
- 刊出日期: 2008-12-19

Chinese Word Sense Disambiguation Based on Bayesian Model Improved by Information Gain

摘要: 词义消歧一直是自然语言处理领域的关键问题和难点之一。通常把词义消歧作为模式分类问题进行研究，其中特征选择是一个重要的环节。该文根据贝叶斯假设提出基于信息增益的特征选择方法，并以此改进贝叶斯模型。通过信息增益计算，挖掘上下文中词语的位置信息，提高贝叶斯模型知识获取的效率，从而改善词义分类效果。该文在8个歧义词上进行了实验，结果发现改进后的贝叶斯模型在消歧正确率上比改进前平均提高了3.5个百分点，改进幅度较大，效果突出，证明了该方法的有效性。
- 词义消歧 /
- 自然语言处理 /
- 信息增益 /
- 贝叶斯模型
Abstract: Word Sense Disambiguation (WSD) is one of the key issues and difficulties in natural language processing. WSD is usually considered as an issue about pattern classification to study, which feature selection, is an important component. In this paper, according to Nave Bayesian Model (NBM) assumption, a feature selection method based on information gain is proposed to improve NBM. Location information concealed in the context of ambiguous word is mined through information gain, to improve the knowledge acquisition efficiency of Bayesian model, thereby improving the word-sense classification. The eight ambiguous words are tested in the experiment. The experimental results show that improved Bayesian model is more correct than the NBM an average of 3.5 percentage points. The accuracy rise is bigger and the improvement effect is outstanding. These results prove also the method put forward in this paper is efficacious.
- W /
- o /
- r

参考文献(0)

资源附件(0)

计量

文章访问数: 3391
HTML全文浏览量: 100
PDF下载量: 1221
被引次数: 0

/

下载: 全尺寸图片幻灯片

分享

用微信扫码二维码

分享至好友和朋友圈

返回