中文信息学报期刊
出版文献量(篇)
2723
总下载数(次)
5
总被引数(次)
45413

中文信息学报

Journal of Chinese Information Processing

CSCDJSTCSTPCD

影响因子 0.8079
本刊于1986年创刊,是经国家科委批准,由中国科学技术协会主管,中国中文信息学会和中国科学院软件研究所合办的学术性刊物,是中国中文信息学会会刊。《中文信息学报》是《中文核心期刊要目总览》自动化、计算机技术类的核心刊物。国内外公开发行。它及时反映我国中文信息处理的学术水平,重点刊登我国中文信息处理基础理论与应用技术研究的学术论文,以及相关的综述、研究成果、技术报告、书刊评论、专题讨论、国内外学... 更多
主办单位:
中国中文信息学会 中国科学院软件研究所
ISSN:
1003-0077
CN:
11-2325/N
出版周期:
月刊
邮编:
100190
地址:
北京海淀区中关村南四街4号
出版文献量(篇)
2723
总下载数(次)
5
总被引数(次)
45413
文章浏览
目录
  • 作者: 周昌乐 张开旭
    刊名: 中文信息学报
    发表期刊: 2013年5期
    页码:  1-7,92
    摘要: 大规模未标注语料中蕴含了丰富的词汇信息,有助于提高中文分词词性标注模型效果.该文从未标注语料中抽取词汇的分布信息,表示为高维向量,进一步使用自动编码器神经网络,无监督地学习对高维向量的编码算...
  • 作者: 刘康 徐立恒 来斯惟 赵军 陈玉博
    刊名: 中文信息学报
    发表期刊: 2013年5期
    页码:  8-14
    摘要: 分词是中文自然语言处理中的一个关键基础技术.通过基于字的统计机器学习方法学习判断词边界是当前中文分词的主流做法.然而,传统机器学习方法严重依赖人工设计的特征,而验证特征的有效性需要不断的尝试...
  • 作者: 徐润华 曲维光 王东波 陈小荷
    刊名: 中文信息学报
    发表期刊: 2013年5期
    页码:  15-21,42
    摘要: 汉语四字格的能产性和派生性极强,利用四字格模式创造出的新词数量在现代汉语词汇中一直呈上升趋势.该文将研究的目光投向分词语料库中的四字格,对语料库中的四字格进行了系统的分类和归纳,并对语料库内...
  • 作者: 孙茂松 张扬 张燕
    刊名: 中文信息学报
    发表期刊: 2013年5期
    页码:  22-28
    摘要: 方言研究领域中的语音研究、词汇研究及语法研究是方言研究的三个重要组成部分,如何识别方言词汇,是方言词汇研究首要的环节.目前,汉语方言词汇研究的语料收集与整理主要通过专家人工整理的形式进行,耗...
  • 作者: 李广一 王厚峰
    刊名: 中文信息学报
    发表期刊: 2013年5期
    页码:  29-34,42
    摘要: 命名实体识别和歧义消解是自然语言理解的重要研究内容.针对提供实体知识库情况下的命名实体识别和歧义消解任务,该文提出了一种基于多步聚类的方法.首先通过两轮聚类将命名实体与知识库实体定义链接,然...
  • 作者: 娄鑫坡 张静杰 昝红英
    刊名: 中文信息学报
    发表期刊: 2013年5期
    页码:  35-42
    摘要: 虚词在现代汉语中占有重要地位,虚词与词序一起构成现代汉语的句法手段,对句法分析有重要的影响.依存句法分析是自然语言处理领域研究的热点,为了提高依存关系的识别效果,该文考虑将虚词用法应用到依存...
  • 作者: 周俏丽 张桂平 石翠
    刊名: 中文信息学报
    发表期刊: 2013年5期
    页码:  43-50,59
    摘要: 该文在中文专利语料的基础上,统计分析了中文专利文献中有标记并列结构的内部特征和外部特征.内部特征主要考察了中文专利文献中有标记并列结构的并列标记、并列结构内部分析和词性分布等.外部特征主要统...
  • 作者: 刘群 吕雅娟 熊皓
    刊名: 中文信息学报
    发表期刊: 2013年5期
    页码:  51-59
    摘要: 传统的语义角色标注模型使用的都是本地特征,不利于捕捉一些全局性的标注错误.该文提出使用图模型对语义角色标注结果进行重排序,利用标记传播迭代算法对标注的结果进行重排序,保证全局标注结果的一致性...
  • 作者: 吕晨 姬东鸿 陈波
    刊名: 中文信息学报
    发表期刊: 2013年5期
    页码:  60-66,74
    摘要: 对汉语特殊句型的语义分析是当前中文信息处理的难点之一.现有的传统语义分析方法存在一些问题,不能很好的反映汉语中各个词语或成分之间的语义关联.该文以汉语连动句为例,提出了基于特征结构模型的语义...
  • 作者: 刘滨 吴明芬 徐睿峰 陈涛
    刊名: 中文信息学报
    发表期刊: 2013年5期
    页码:  67-74
    摘要: 考虑到同类型的情感句往往具有相同或者相似的句法和语义表达模式,该文提出了一种基于情感句模的文本情感自动分类方法.首先,将情感表达相关句模人工分为3大类105个二级分类;然后,设计了一种利用依...
  • 作者: 王振宇 郭冲
    刊名: 中文信息学报
    发表期刊: 2013年5期
    页码:  75-83,92
    摘要: 该文定义了一种用于细粒度意见挖掘的情感本体树结构,并基于细粒度意见要素抽取技术提出本体树的自动构建方法.重点研究了评价搭配抽取算法、搭配倾向预测算法以及特征聚合算法,并在解决搭配倾向预测及特...
  • 作者: 吕云云 李旸 王素格
    刊名: 中文信息学报
    发表期刊: 2013年5期
    页码:  84-92
    摘要: 领域相关的大规模和高质量的标注训练数据是分类器性能的重要保证,而标注训练语料是一件费时费力的工作.该文提出了一种采用小规模标注语料识别中文观点句的方法.首先采用Bootstrapping方法...
  • 作者: 李寿山 李逸薇 高伟 黄居仁
    刊名: 中文信息学报
    发表期刊: 2013年5期
    页码:  93-99
    摘要: 情绪原因识别是情绪分析中的一个重要研究任务.该任务旨在自动分析出导致某一情绪发生的原因描述.该文将情绪原因识别任务建模为序列标注模型,即将情绪词相关的子句当成序列,进而整体标注出哪些属于原因...
  • 作者: 刘建达 李霞
    刊名: 中文信息学报
    发表期刊: 2013年5期
    页码:  100-106
    摘要: 中国英语学习者人数众多,迫切需要针对中国学生特点的、有效适用于大规模英文作文数据的全自动评分算法,以解决中国现有英语教学和大规模英语考试中英文作文批改量大和难度大的瓶颈问题.该文提出了一种能...
  • 作者: 刘浏 曲维光 李斌 陈小荷
    刊名: 中文信息学报
    发表期刊: 2013年5期
    页码:  107-113
    摘要: 词汇的时代特征能反应词汇在一个时代发展变化的规律.该文将先秦分为前春秋、春秋和战国三个时代,获取并研究这三个时代的时代独有词、时代特征词及时代发源词.该文提出两种自动判断先秦文献时代的方法,...
  • 作者: 寇宛秋 李芳
    刊名: 中文信息学报
    发表期刊: 2013年5期
    页码:  114-121,143
    摘要: 传统话题模型用词项概率分布表示话题,在可解释性上存在很大的不足.该文在Latent Dirichlet Allocation(LDA)的结果上提出了一种基于种子词汇的话题标签抽取方法.首先根...
  • 作者: 万剑怡 廖亚男 洪欢 王明文
    刊名: 中文信息学报
    发表期刊: 2013年5期
    页码:  122-128
    摘要: 查询扩展是提高检索效果的有效方法,传统的查询扩展方法大都以单个查询词的相关性来扩展查询词,没有充分考虑词项之间、文档之间以及查询之间的相关性,使得扩展效果不佳.针对此问题,该文首先通过分别构...
  • 作者: 刘茂福 姬东鸿 李妍
    刊名: 中文信息学报
    发表期刊: 2013年5期
    页码:  129-136
    摘要: 为了强化文本蕴含系统深层语义分析与推理能力,该文提出了基于事件语义特征的中文文本蕴含识别方法.该方法基于事件标注语料生成事件图,将文本间的蕴含关系转化为事件图间的蕴含关系;利用最大公共子图的...
  • 作者: 周惠巍 李丽双 李瑶 杨欢 黄德根
    刊名: 中文信息学报
    发表期刊: 2013年5期
    页码:  137-143
    摘要: 模糊限制信息检测用于区分模糊限制信息与事实信息,提高抽取信息的真实性和可靠性.模糊限制信息范围的界定具有依赖于语义和句法结构的特点,是模糊限制信息检测的一个难点.该文提出一种基于句法结构约束...
  • 作者: 严馨 余正涛 线岩团 郭剑毅 陈鹏 魏斯超
    刊名: 中文信息学报
    发表期刊: 2013年5期
    页码:  144-148,155
    摘要: 针对在采用支持核函数的机器学习算法进行基于特征的中文领域实体关系抽取中,不同核函数对不同中文领域关系抽取在效果上存在差异性的问题,该文提出一种基于凸组合核函数的中文领域实体关系抽取方法.首先...
  • 作者: 孙乐 石贝 韩先培
    刊名: 中文信息学报
    发表期刊: 2013年5期
    页码:  149-155
    摘要: 实体的别名是指同一个实体的不同名称.传统的别名抽取方法存在训练语料构建困难和时效性差这两个问题.针对这两个问题,该文提出了一种基于图的查询日志实体别名抽取方法.该方法利用查询日志的上下文信息...
  • 作者: 赵建东 飞龙 高光来
    刊名: 中文信息学报
    发表期刊: 2013年5期
    页码:  156-159,165
    摘要: 蒙古文自动词性标注方面的研究工作较少,制约了对蒙古文的机器翻译、语法分析及语义分析等领域的深入研究.针对于此,提出了加入lookahead学习机制的基于历史模型的蒙古文自动词性标注方法.实验...
  • 作者: 于洪志 冷本扎西 李亚超 汪昆
    刊名: 中文信息学报
    发表期刊: 2013年5期
    页码:  160-165
    摘要: 藏文词性标注是藏文信息处理中非常重要的基础性问题,该文以最大熵模型为基本框架,根据藏文的构词特征及统计分析结果,定义并选取特征模板,研究了融合语言特征的最大熵藏文词性标注模型.实验结果表明,...
  • 作者: 刘群 华却才让 姜文斌 赵海兴
    刊名: 中文信息学报
    发表期刊: 2013年5期
    页码:  166-172
    摘要: 依据依存句法理论,该文制订了藏语句法标注体系及层次结构.通过分析构建藏语依存树库中存在的问题,提出了半自动依存树库构建模式,针对藏语特性提出了融合丰富特征的词对依存分类模型和依存边标注模型,...
  • 作者: 周喜 李晓 杨明忠 杨雅婷 米成刚
    刊名: 中文信息学报
    发表期刊: 2013年5期
    页码:  173-178,190
    摘要: 维汉机器翻译过程中会出现较多的未登录词,这些未登录词一部分属于借词(人名、地名等).该文提出一种新颖的根据借词与原语言词发音相似这一特性进行维吾尔语中汉语借词识别的方法.该方法对已有语料进行...
  • 作者: 力提甫·托乎提 王海波 祖漪清
    刊名: 中文信息学报
    发表期刊: 2013年5期
    页码:  179-183
    摘要: 维吾尔语作为一种典型的黏着语,通过丰富的功能词缀来表达各种语法和语气.该文探讨了“词干词性标注方法”与“词缀词性标注方法”在维吾尔语自然语言处理中的优缺点.在大规模语料库中,统计了常用词缀串...
  • 作者: 张玉洁 徐金安 苏晨 郭振
    刊名: 中文信息学报
    发表期刊: 2013年5期
    页码:  184-190
    摘要: 在特定领域的汉英机器翻译系统开发过程中,大量新词的出现导致汉语分词精度下降,而特定领域缺少标注语料使得有监督学习技术的性能难以提高.这直接导致抽取的翻译知识中出现很多错误,严重影响翻译质量....
  • 作者: 朱巧明 胡亚楠 舒佳根 钱龙华
    刊名: 中文信息学报
    发表期刊: 2013年5期
    页码:  191-197
    摘要: 训练语料库的规模对基于机器学习的命名实体间语义关系抽取具有重要的作用,而语料库的人工标注需要花费大量的时间和人力.该文提出了使用机器翻译的方法将源语言的关系实例转换成目标语言的关系实例,并通...
  • 作者: 张健 曾伟辉 李淼 陈雷
    刊名: 中文信息学报
    发表期刊: 2013年5期
    页码:  198-204
    摘要: 自统计机器翻译技术出现以来,调序一直是语序差异显著的语言对互译系统中的关键问题,基于大规模语料训练的调序方法得到了广泛研究.目前汉蒙双语语料资源十分有限,使得现有的依赖于大规模语料和语言学知...
  • 作者:
    刊名: 中文信息学报
    发表期刊: 2013年5期
    页码:  204
    摘要:

中文信息学报基本信息

刊名 中文信息学报 主编 孙茂松
曾用名
主办单位 中国中文信息学会 中国科学院软件研究所  主管单位 中国科学技术协会
出版周期 月刊 语种
chi
ISSN 1003-0077 CN 11-2325/N
邮编 100190 电子邮箱 cips@iscas.ac.cn
电话 010-62562916 网址 www.cipsc.org.cn
地址 北京海淀区中关村南四街4号

中文信息学报统计分析

被引趋势
(/次)
(/年)
学科分布
研究主题
推荐期刊