基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
日语分词和词性标注是以日语为源语言的机器翻译等自然语言处理工作的第一步.该文提出了一种基于规则和统计的日语分词和词性标注方法,使用基于单一感知器的联合分词和词性标注算法作为基本框架,在其中加入了基于规则的词语的邻接属性作为特征.在小规模测试集上的实验结果表明,这种方法分词的F值达到了98.2%,分词加词性标注的F值达到了94.8%.该文所采用的方法已经成功应用到日汉机器翻译系统中.
推荐文章
汉语分词和词性标注一体化分析的方法研究
汉语分词
词性标注
A*解码算法
一种基于规则优先级的词性标注方法
汉语自动分词
词性标注
兼类词
规则优先级
基于助词用法的汉语词性、分词错误自动发现
助词知识库
用法
规则
自动标注
中文分词与词性标注研究
中文分词
主动学习
词性标注
自然语言处理
一体化模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于规则和统计的日语分词和词性标注的研究
来源期刊 中文信息学报 学科 工学
关键词 人工智能 机器翻译 日汉机器翻译系统 日语分词 日语词性标注 联合分词
年,卷(期) 2010,(1) 所属期刊栏目
研究方向 页码范围 117-122
页数 6页 分类号 TP391
字数 5331字 语种 中文
DOI 10.3969/j.issn.1003-0077.2010.01.021
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈群秀 清华大学信息科学与技术国家实验室 8 148 7.0 8.0
5 姜尚仆 清华大学信息科学与技术国家实验室 1 18 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (18)
同被引文献  (34)
二级引证文献  (130)
2010(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2010(1)
  • 引证文献(1)
  • 二级引证文献(0)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(8)
  • 引证文献(2)
  • 二级引证文献(6)
2016(18)
  • 引证文献(3)
  • 二级引证文献(15)
2017(31)
  • 引证文献(4)
  • 二级引证文献(27)
2018(46)
  • 引证文献(4)
  • 二级引证文献(42)
2019(33)
  • 引证文献(1)
  • 二级引证文献(32)
2020(9)
  • 引证文献(1)
  • 二级引证文献(8)
研究主题发展历程
节点文献
人工智能
机器翻译
日汉机器翻译系统
日语分词
日语词性标注
联合分词
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中文信息学报
月刊
1003-0077
11-2325/N
16开
北京海淀区中关村南四街4号
1986
chi
出版文献量(篇)
2723
总下载数(次)
5
总被引数(次)
45413
论文1v1指导