中文信息学报2013年第5期出版文献-钛学术文献服务平台

文献导航

检索期刊

出版文献量（篇）

2723

总下载数（次）

总被引数（次）

45413

中文信息学报

投稿

Journal of Chinese Information Processing

CSCD JST CSTPCD

影响因子 0.8079

本刊于1986年创刊，是经国家科委批准，由中国科学技术协会主管，中国中文信息学会和中国科学院软件研究所合办的学术性刊物，是中国中文信息学会会刊。《中文信息学报》是《中文核心期刊要目总览》自动化、计算机技术类的核心刊物。国内外公开发行。它及时反映我国中文信息处理的学术水平，重点刊登我国中文信息处理基础理论与应用技术研究的学术论文，以及相关的综述、研究成果、技术报告、书刊评论、专题讨论、国内外学... 更多

主办单位：

中国中文信息学会 中国科学院软件研究所

ISSN：

1003-0077

CN：

11-2325/N

出版周期：

月刊

邮编：

100190

地址：

北京海淀区中关村南四街4号

出版文献量（篇）

2723

总下载数（次）

总被引数（次）

45413

文章浏览

热门刊内文献

年度刊次

1. 基于自动编码器的中文词汇特征无监督学习

作者：周昌乐张开旭

刊名：中文信息学报

发表期刊： 2013年5期

页码: 1-7,92

摘要：大规模未标注语料中蕴含了丰富的词汇信息,有助于提高中文分词词性标注模型效果.该文从未标注语料中抽取词汇的分布信息,表示为高维向量,进一步使用自动编码器神经网络,无监督地学习对高维向量的编码算...
2. 基于表示学习的中文分词算法探索

作者：刘康徐立恒来斯惟赵军陈玉博

刊名：中文信息学报

发表期刊： 2013年5期

页码: 8-14

摘要：分词是中文自然语言处理中的一个关键基础技术.通过基于字的统计机器学习方法学习判断词边界是当前中文分词的主流做法.然而,传统机器学习方法严重依赖人工设计的特征,而验证特征的有效性需要不断的尝试...
3. 多语料库中汉语四字格的切分和识别研究

作者：徐润华曲维光王东波陈小荷

刊名：中文信息学报

发表期刊： 2013年5期

页码: 15-21,42

摘要：汉语四字格的能产性和派生性极强,利用四字格模式创造出的新词数量在现代汉语词汇中一直呈上升趋势.该文将研究的目光投向分词语料库中的四字格,对语料库中的四字格进行了系统的分类和归纳,并对语料库内...
4. 基于中文拼音输入法数据的汉语方言词汇自动识别

作者：孙茂松张扬张燕

刊名：中文信息学报

发表期刊： 2013年5期

页码: 22-28

摘要：方言研究领域中的语音研究、词汇研究及语法研究是方言研究的三个重要组成部分,如何识别方言词汇,是方言词汇研究首要的环节.目前,汉语方言词汇研究的语料收集与整理主要通过专家人工整理的形式进行,耗...
5. 基于多步聚类的汉语命名实体识别和歧义消解

作者：李广一王厚峰

刊名：中文信息学报

发表期刊： 2013年5期

页码: 29-34,42

摘要：命名实体识别和歧义消解是自然语言理解的重要研究内容.针对提供实体知识库情况下的命名实体识别和歧义消解任务,该文提出了一种基于多步聚类的方法.首先通过两轮聚类将命名实体与知识库实体定义链接,然...
6. 汉语虚词用法在依存句法分析中的应用研究

作者：娄鑫坡张静杰昝红英

刊名：中文信息学报

发表期刊： 2013年5期

页码: 35-42

摘要：虚词在现代汉语中占有重要地位,虚词与词序一起构成现代汉语的句法手段,对句法分析有重要的影响.依存句法分析是自然语言处理领域研究的热点,为了提高依存关系的识别效果,该文考虑将虚词用法应用到依存...
7. 面向中文专利文献的有标记并列结构的统计分析

作者：周俏丽张桂平石翠

刊名：中文信息学报

发表期刊： 2013年5期

页码: 43-50,59

摘要：该文在中文专利语料的基础上,统计分析了中文专利文献中有标记并列结构的内部特征和外部特征.内部特征主要考察了中文专利文献中有标记并列结构的并列标记、并列结构内部分析和词性分布等.外部特征主要统...
8. 基于图模型的语义角色标注重排序

作者：刘群吕雅娟熊皓

刊名：中文信息学报

发表期刊： 2013年5期

页码: 51-59

摘要：传统的语义角色标注模型使用的都是本地特征,不利于捕捉一些全局性的标注错误.该文提出使用图模型对语义角色标注结果进行重排序,利用标记传播迭代算法对标注的结果进行重排序,保证全局标注结果的一致性...
9. 基于特征结构的汉语连动句语义标注研究

作者：吕晨姬东鸿陈波

刊名：中文信息学报

发表期刊： 2013年5期

页码: 60-66,74

摘要：对汉语特殊句型的语义分析是当前中文信息处理的难点之一.现有的传统语义分析方法存在一些问题,不能很好的反映汉语中各个词语或成分之间的语义关联.该文以汉语连动句为例,提出了基于特征结构模型的语义...
10. 一种基于情感句模的文本情感分类方法

作者：刘滨吴明芬徐睿峰陈涛

刊名：中文信息学报

发表期刊： 2013年5期

页码: 67-74

摘要：考虑到同类型的情感句往往具有相同或者相似的句法和语义表达模式,该文提出了一种基于情感句模的文本情感自动分类方法.首先,将情感表达相关句模人工分为3大类105个二级分类；然后,设计了一种利用依...
11. 面向细粒度意见挖掘的情感本体树及自动构建

作者：王振宇郭冲

刊名：中文信息学报

发表期刊： 2013年5期

页码: 75-83,92

摘要：该文定义了一种用于细粒度意见挖掘的情感本体树结构,并基于细粒度意见要素抽取技术提出本体树的自动构建方法.重点研究了评价搭配抽取算法、搭配倾向预测算法以及特征聚合算法,并在解决搭配倾向预测及特...
12. 基于BootStrapping的集成分类器的中文观点句识别方法

作者：吕云云李旸王素格

刊名：中文信息学报

发表期刊： 2013年5期

页码: 84-92

摘要：领域相关的大规模和高质量的标注训练数据是分类器性能的重要保证,而标注训练语料是一件费时费力的工作.该文提出了一种采用小规模标注语料识别中文观点句的方法.首先采用Bootstrapping方法...
13. 基于序列标注模型的情绪原因识别方法

作者：李寿山李逸薇高伟黄居仁

刊名：中文信息学报

发表期刊： 2013年5期

页码: 93-99

摘要：情绪原因识别是情绪分析中的一个重要研究任务.该任务旨在自动分析出导致某一情绪发生的原因描述.该文将情绪原因识别任务建模为序列标注模型,即将情绪词相关的子句当成序列,进而整体标注出哪些属于原因...
14. 适用于中国外语学习者的英文作文全自动集成评分算法

作者：刘建达李霞

刊名：中文信息学报

发表期刊： 2013年5期

页码: 100-106

摘要：中国英语学习者人数众多,迫切需要针对中国学生特点的、有效适用于大规模英文作文数据的全自动评分算法,以解决中国现有英语教学和大规模英语考试中英文作文批改量大和难度大的瓶颈问题.该文提出了一种能...
15. 先秦词汇的时代特征自动获取及文献时代的自动判定

作者：刘浏曲维光李斌陈小荷

刊名：中文信息学报

发表期刊： 2013年5期

页码: 107-113

摘要：词汇的时代特征能反应词汇在一个时代发展变化的规律.该文将先秦分为前春秋、春秋和战国三个时代,获取并研究这三个时代的时代独有词、时代特征词及时代发源词.该文提出两种自动判断先秦文献时代的方法,...
16. 基于种子词汇的话题标签抽取研究

作者：寇宛秋李芳

刊名：中文信息学报

发表期刊： 2013年5期

页码: 114-121,143

摘要：传统话题模型用词项概率分布表示话题,在可解释性上存在很大的不足.该文在Latent Dirichlet Allocation(LDA)的结果上提出了一种基于种子词汇的话题标签抽取方法.首先根...
17. 基于迭代方法的多层Markov网络信息检索模型

作者：万剑怡廖亚男洪欢王明文

刊名：中文信息学报

发表期刊： 2013年5期

页码: 122-128

摘要：查询扩展是提高检索效果的有效方法,传统的查询扩展方法大都以单个查询词的相关性来扩展查询词,没有充分考虑词项之间、文档之间以及查询之间的相关性,使得扩展效果不佳.针对此问题,该文首先通过分别构...
18. 基于事件语义特征的中文文本蕴含识别

作者：刘茂福姬东鸿李妍

刊名：中文信息学报

发表期刊： 2013年5期

页码: 129-136

摘要：为了强化文本蕴含系统深层语义分析与推理能力,该文提出了基于事件语义特征的中文文本蕴含识别方法.该方法基于事件标注语料生成事件图,将文本间的蕴含关系转化为事件图间的蕴含关系；利用最大公共子图的...
19. 基于句法结构约束的模糊限制信息范围检测

作者：周惠巍李丽双李瑶杨欢黄德根

刊名：中文信息学报

发表期刊： 2013年5期

页码: 137-143

摘要：模糊限制信息检测用于区分模糊限制信息与事实信息,提高抽取信息的真实性和可靠性.模糊限制信息范围的界定具有依赖于语义和句法结构的特点,是模糊限制信息检测的一个难点.该文提出一种基于句法结构约束...
20. 基于凸组合核函数的中文领域实体关系抽取

作者：严馨余正涛线岩团郭剑毅陈鹏魏斯超

刊名：中文信息学报

发表期刊： 2013年5期

页码: 144-148,155

摘要：针对在采用支持核函数的机器学习算法进行基于特征的中文领域实体关系抽取中,不同核函数对不同中文领域关系抽取在效果上存在差异性的问题,该文提出一种基于凸组合核函数的中文领域实体关系抽取方法.首先...
21. 基于图的查询日志实体别名抽取方法

作者：孙乐石贝韩先培

刊名：中文信息学报

发表期刊： 2013年5期

页码: 149-155

摘要：实体的别名是指同一个实体的不同名称.传统的别名抽取方法存在训练语料构建困难和时效性差这两个问题.针对这两个问题,该文提出了一种基于图的查询日志实体别名抽取方法.该方法利用查询日志的上下文信息...
22. 基于历史模型的蒙古文自动词性标注研究

作者：赵建东飞龙高光来

刊名：中文信息学报

发表期刊： 2013年5期

页码: 156-159,165

摘要：蒙古文自动词性标注方面的研究工作较少,制约了对蒙古文的机器翻译、语法分析及语义分析等领域的深入研究.针对于此,提出了加入lookahead学习机制的基于历史模型的蒙古文自动词性标注方法.实验...
23. 融合音节特征的最大熵藏文词性标注研究

作者：于洪志冷本扎西李亚超汪昆

刊名：中文信息学报

发表期刊： 2013年5期

页码: 160-165

摘要：藏文词性标注是藏文信息处理中非常重要的基础性问题,该文以最大熵模型为基本框架,根据藏文的构词特征及统计分析结果,定义并选取特征模板,研究了融合语言特征的最大熵藏文词性标注模型.实验结果表明,...
24. 基于词对依存分类的藏语树库半自动构建研究

作者：刘群华却才让姜文斌赵海兴

刊名：中文信息学报

发表期刊： 2013年5期

页码: 166-172

摘要：依据依存句法理论,该文制订了藏语句法标注体系及层次结构.通过分析构建藏语依存树库中存在的问题,提出了半自动依存树库构建模式,针对藏语特性提出了融合丰富特征的词对依存分类模型和依存边标注模型,...
25. 基于字符串相似度的维吾尔语中汉语借词识别

作者：周喜李晓杨明忠杨雅婷米成刚

刊名：中文信息学报

发表期刊： 2013年5期

页码: 173-178,190

摘要：维汉机器翻译过程中会出现较多的未登录词,这些未登录词一部分属于借词(人名、地名等).该文提出一种新颖的根据借词与原语言词发音相似这一特性进行维吾尔语中汉语借词识别的方法.该方法对已有语料进行...
26. 基于功能词缀串的维吾尔语词性标注方法

作者：力提甫·托乎提王海波祖漪清

刊名：中文信息学报

发表期刊： 2013年5期

页码: 179-183

摘要：维吾尔语作为一种典型的黏着语,通过丰富的功能词缀来表达各种语法和语气.该文探讨了“词干词性标注方法”与“词缀词性标注方法”在维吾尔语自然语言处理中的优缺点.在大规模语料库中,统计了常用词缀串...
27. 适用于特定领域机器翻译的汉语分词方法

作者：张玉洁徐金安苏晨郭振

刊名：中文信息学报

发表期刊： 2013年5期

页码: 184-190

摘要：在特定领域的汉英机器翻译系统开发过程中,大量新词的出现导致汉语分词精度下降,而特定领域缺少标注语料使得有监督学习技术的性能难以提高.这直接导致抽取的翻译知识中出现很多错误,严重影响翻译质量....
28. 基于机器翻译的跨语言关系抽取

作者：朱巧明胡亚楠舒佳根钱龙华

刊名：中文信息学报

发表期刊： 2013年5期

页码: 191-197

摘要：训练语料库的规模对基于机器学习的命名实体间语义关系抽取具有重要的作用,而语料库的人工标注需要花费大量的时间和人力.该文提出了使用机器翻译的方法将源语言的关系实例转换成目标语言的关系实例,并通...
29. 有限语料汉蒙统计机器翻译调序方法研究

作者：张健曾伟辉李淼陈雷

刊名：中文信息学报

发表期刊： 2013年5期

页码: 198-204

摘要：自统计机器翻译技术出现以来,调序一直是语序差异显著的语言对互译系统中的关键问题,基于大规模语料训练的调序方法得到了广泛研究.目前汉蒙双语语料资源十分有限,使得现有的依赖于大规模语料和语言学知...
30. 征稿简则

作者：

刊名：中文信息学报

发表期刊： 2013年5期

页码: 204

摘要：

中文信息学报基本信息

刊名	中文信息学报	主编	孙茂松
曾用名
主办单位	中国中文信息学会中国科学院软件研究所	主管单位	中国科学技术协会
出版周期	月刊	语种	chi
ISSN	1003-0077	CN	11-2325/N
邮编	100190	电子邮箱	cips@iscas.ac.cn
电话	010-62562916	网址	www.cipsc.org.cn
地址	北京海淀区中关村南四街4号