基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
基于一个实际的文语转换系统,介绍了它的一些处理方法,采用了一种改进的最大匹配法,可以切分出所有的交集歧义,提出了一种基于统计模型的算法来处理其中的多交集歧义字段,并用穷举法和一些简单的规则相组合的方法从实用角度解决多音字的异读问题以及中文姓名的自动识别方法,解决了汉语切分歧义、多音词处理、中文姓名的自动识别问题,达到实现文语转换的目的.
推荐文章
吕苏语口语标注语料的自动分词方法研究
吕苏语
汉语标注语料
自动分词
改进结巴算法
文语转换系统中的中文姓名识别
中文姓名识别
中文信息处理
文语转换
一个普通话文语转换系统中的韵律模型
文语转换
韵律模型
神经网络
单元选择
基于N元语法的汉语自动分词系统研究
一元语法
二元语法
中文分词
词性标注
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 文语转换系统中基于语料的汉语自动分词研究
来源期刊 计算机应用 学科 工学
关键词 文语转换 汉语分词 最大匹配法 多交集歧义 多音词 姓名识别
年,卷(期) 2000,(2) 所属期刊栏目 研究与设计
研究方向 页码范围 8-11
页数 4页 分类号 TP317.2
字数 5153字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 柴佩琪 同济大学计算机系 50 717 13.0 25.0
2 应志伟 同济大学计算机系 2 65 2.0 2.0
3 陈其晖 同济大学计算机系 23 150 7.0 12.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (7)
节点文献
引证文献  (53)
同被引文献  (10)
二级引证文献  (172)
1987(1)
  • 参考文献(1)
  • 二级参考文献(0)
1989(1)
  • 参考文献(1)
  • 二级参考文献(0)
1990(3)
  • 参考文献(3)
  • 二级参考文献(0)
1992(1)
  • 参考文献(1)
  • 二级参考文献(0)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2001(2)
  • 引证文献(2)
  • 二级引证文献(0)
2002(6)
  • 引证文献(6)
  • 二级引证文献(0)
2003(4)
  • 引证文献(3)
  • 二级引证文献(1)
2004(11)
  • 引证文献(2)
  • 二级引证文献(9)
2005(16)
  • 引证文献(5)
  • 二级引证文献(11)
2006(18)
  • 引证文献(4)
  • 二级引证文献(14)
2007(29)
  • 引证文献(10)
  • 二级引证文献(19)
2008(31)
  • 引证文献(10)
  • 二级引证文献(21)
2009(16)
  • 引证文献(2)
  • 二级引证文献(14)
2010(22)
  • 引证文献(3)
  • 二级引证文献(19)
2011(17)
  • 引证文献(1)
  • 二级引证文献(16)
2012(9)
  • 引证文献(1)
  • 二级引证文献(8)
2013(10)
  • 引证文献(2)
  • 二级引证文献(8)
2014(8)
  • 引证文献(1)
  • 二级引证文献(7)
2015(7)
  • 引证文献(1)
  • 二级引证文献(6)
2016(9)
  • 引证文献(0)
  • 二级引证文献(9)
2017(5)
  • 引证文献(0)
  • 二级引证文献(5)
2018(4)
  • 引证文献(0)
  • 二级引证文献(4)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
文语转换
汉语分词
最大匹配法
多交集歧义
多音词
姓名识别
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
论文1v1指导