中文信息学报2011年出版文献-钛学术文献服务平台

文献导航

检索期刊

出版文献量（篇）

2723

总下载数（次）

中文信息学报

投稿

Journal of Chinese Information Processing

CSCD JST CSTPCD

影响因子 0.8079

本刊于1986年创刊，是经国家科委批准，由中国科学技术协会主管，中国中文信息学会和中国科学院软件研究所合办的学术性刊物，是中国中文信息学会会刊。《中文信息学报》是《中文核心期刊要目总览》自动化、计算机技术类的核心刊物。国内外公开发行。它及时反映我国中文信息处理的学术水平，重点刊登我国中文信息处理基础理论与应用技术研究的学术论文，以及相关的综述、研究成果、技术报告、书刊评论、专题讨论、国内外学... 更多

主办单位：

中国中文信息学会 中国科学院软件研究所

ISSN：

1003-0077

CN：

11-2325/N

出版周期：

月刊

邮编：

100190

地址：

北京海淀区中关村南四街4号

出版文献量（篇）

2723

总下载数（次）

文章浏览

热门刊内文献

年度刊次

1. 问答社区中回答质量的评价方法研究

作者：刘奕群孔维泽张敏马少平

刊名：中文信息学报

发表期刊： 2011年1期

页码: 3-8

摘要：问答社区已经成为网络信息获取的一种重要渠道,但其信息质量差异较大.该文研究了问答社区中回答质量的评价方法.具体考察了百度知道的问答社区环境,并对其构建了大规模的语料数据.针对百度知道的特点,...
2. 基于用户行为分析的个人信息检索研究

作者：王斌蒋在帆

刊名：中文信息学报

发表期刊： 2011年1期

页码: 9-14,122

摘要：个人信息检索是指个人计算机上用户搜索个人信息(通常是文档)的过程,与互联网检索相比,个人信息检索能够利用的信息很少,这使得其检索结果的排序更加困难.该文通过考察计算机上的用户行为,对个人信息...
3. 基于关联度模型的文本倾向性检索研究

作者：刘全升姚天昉

刊名：中文信息学报

发表期刊： 2011年1期

页码: 15-19

摘要：该文在研究了信息检索理论与文本倾向性分析技术等的基础上,结合国内外关于观点检索的相关研究,提出了基于关联度的文本观点检索算法.它综合考虑了主题检索过程中的查询扩展、文本检索相关度、文本倾向性...
4. Twitter中近似重复消息的判定方法研究

作者：刘悦曹鹏李静远满彤程学旗

刊名：中文信息学报

发表期刊： 2011年1期

页码: 20-27

摘要：微博客是Web2.0出现以来的一个新生概念.著名的Twitter系统是微博客中具有代表性的一个.其全球用户已经超过1.6亿,在世界范围内具有重要影响力:目前知名政治家、社会名流和大企业几乎都...
5. 基于权重标准化SimRank方法的查询扩展技术研究

作者：林原林鸿飞马云龙

刊名：中文信息学报

发表期刊： 2011年1期

页码: 28-34

摘要：查询扩展是信息检索中的一项重要技术.传统的局部分析查询扩展方法利用伪相关文档作为候选词集合,然而部分伪相关文档并不具有很高的相关性.该文利用真实的搜索引擎查询日志.建立了查询点击图,经过多次...
6. 基于群体智慧的Web访问日志会话主题识别研究

作者：刘奕群张敏方奇茹立云马少平

刊名：中文信息学报

发表期刊： 2011年1期

页码: 35-40

摘要： Web访问日志中的会话(session)是指特定用户在一定时间范围内的访问行为的连续序列.会话主题(topic)是指会话中具有相同用户意图的部分.从会话中进一步识别出能体现用户意图的处理单元...
7. 基于LDA模型的博客垃圾评论发现

作者：刁宇峰杨亮林鸿飞

刊名：中文信息学报

发表期刊： 2011年1期

页码: 41-47

摘要： Blog(博客)作为一种新兴的网络媒体,在很大程度上增强了互联网的开放性,Blog已经成为互联网上的主要信息源之一,这也使得Blog空间中的垃圾评论成倍增长,因此如何识别垃圾评论成为面临的重...
8. 面向互联网舆情的热词分析技术

作者：孙丽华李渝勤

刊名：中文信息学报

发表期刊： 2011年1期

页码: 48-53,59

摘要：热词是一种网络词汇现象,反映了某一特定时空范围内人们普遍关注的问题.该文对热词分析的两项关键技术——热词发现和热词关联技术进行了深入的研究.在热词发现阶段,首先采用命名实体识别技术和高频串统...
9. 大规模短文本的不完全聚类

作者：俞晓明刘春阳彭泽映许洪波

刊名：中文信息学报

发表期刊： 2011年1期

页码: 54-59

摘要：聚类分析是数据挖掘的一个重要手段,人们可以通过聚类发现信息中潜在的热点或规律.至今,已经有大量聚类算法被研究和提出.随着互联网的日益普及,查询日志、Twitter等短文本信息逐渐在人们生活中...
10. 一种基于LDA的潜在语义区划分及Web文档聚类算法

作者：冯时刘振鹿张一飞方东昊王大玲

刊名：中文信息学报

发表期刊： 2011年1期

页码: 60-65,70

摘要：该文应用LDA模型进行文档的潜在语义分析,将语义分布划分成低频、中频、高频语义区,以低频语义区的语义进行Web游离文档检测,以中、高频语义区的语义作为文档特征进行文档聚类,采用文档类别与语义...
11. 面向信息检索的近邻语言模型

作者：李生杨沐昀韩中元齐浩亮

刊名：中文信息学报

发表期刊： 2011年1期

页码: 66-70

摘要：面向信息检索的语言模型对单篇文档构建语言模型,存在较严重的数据稀疏问题.该文认为利用文档的近邻信息能够更合理地反映词在文档中的分布,有助于数据稀疏问题的解决,因此将文档的近邻信息加入语言模型...
12. 基于搜索引擎的双语混合网页识别新方法

作者：冯艳卉姚建民朱巧明洪宇颜振祥

刊名：中文信息学报

发表期刊： 2011年1期

页码: 71-78

摘要：该文提出了一种从搜索引擎返回的结果网页中获取双语网页的新方法,该方法分为两个任务.第一个任务是自动地检测并收集搜索引擎返回的结果网页中的数据记录.该步骤通过聚类的方法识别出有用的记录摘要并且...
13. 语义词典归类不当现象自动发现

作者：邱立坤邵艳秋

刊名：中文信息学报

发表期刊： 2011年1期

页码: 79-84

摘要：平行周遍原则是陈保亚(1999)提出的一种用于区分词与短语的理论,将词语分为既平行又周遍、平行不周遍和不平行不周遍三类,既平行又周遍的是短语,不宜收入词典.由于汉语语叉词典在收词时并未严格遵...
14. 基于上下文的真词错误检查及校对方法

作者：姚建民朱巧明洪宇陆军陆玉清

刊名：中文信息学报

发表期刊： 2011年1期

页码: 85-90

摘要：英文文本中的真词错误即输入的错词是和原词相似的另一个有效词.该文主要研究了对该类错误的检测.通过从所要检测的单词的上下文中提取句法和语义两个方面的特征,运用文档频率和信息增益进行特征筛选,实...
15. 面向文本拷贝检测的分布式索引

作者：俞昊旻张奇张玥黄萱菁

刊名：中文信息学报

发表期刊： 2011年1期

页码: 91-97

摘要：如何对大规模文档集进行高效的拷贝检测是长期以来一直受到研究者们关注的问题.通常的拷贝检测算法都需要借助倒排索引.因此良好的索引结构对于算法性能至关重要.同时,随着文档集规模的增大,单机实现的...
16. 基于结构挖掘的论坛检索模型

作者：刘秉权孙承杰杨小锐林磊

刊名：中文信息学报

发表期刊： 2011年1期

页码: 98-103,109

摘要：随着互联网的发展,网络论坛中蕴涵着数量巨大且质量较好的知识资源.因此对论坛信息进行有效地检索具有重要应用价值.该文研究适合于论坛数据的检索模型,以期能够充分利用论坛平台累积的海量数据来满足用...
17. 一种基于HITS算法的Blog文摘方法

作者：苗家陈竹敏马军

刊名：中文信息学报

发表期刊： 2011年1期

页码: 104-109

摘要： Blog文章对应了大量评论信息,评论中又包含大量的噪声,因此如何结合Blog评论获取Blog文章的主要内容是许多基于Blog的应用所要面临的难题.以往提出的文摘方法大多是针对多文档文摘的通用...
18. 面向单一双语网页的双语资源挖掘方法

作者：季铎张桂平王莹莹罗阳

刊名：中文信息学报

发表期刊： 2011年1期

页码: 110-115

摘要：双语资源是机器翻译和跨语言信息检索等领域的重要资源,但是由于语料库真实性、时效性和语种灵活性等问题,使得现有的双语资源的规模很难满足实际应用的需要.该文提出一种面向单一双语网页的双语资源挖掘...
19. 基于浅层句法分析的中文语义角色标注研究

作者：孙薇薇王鑫穗志方

刊名：中文信息学报

发表期刊： 2011年1期

页码: 116-122

摘要：语义角色标注是获取语义信息的一种重要手段.许多现有的语义角色标注都是在完全句法分析的基础上进行的,但由于现阶段中文完全句法分析器性能比较低,基于自动完全句法分析的中文语义角色标注效果并不理想...
20. 基于Low-IDF-SIG的句子重复检测

作者：俞昊旻张奇张玥黄萱菁

刊名：中文信息学报

发表期刊： 2011年1期

页码: 123-128

摘要：随着互联网上数据的爆炸式增长,互联网上产生了大量的重复数据.这些重复数据给搜索引擎、观点挖掘等许多web应用带来了严峻的问题.目前绝大部分的重复检测的算法均着重考虑文档级别,不能有效地检测出...
21. 信息动态

作者：

刊名：中文信息学报

发表期刊： 2011年1期

页码: 128

摘要：
22. 基于北京大学中文网库的语义角色分类

作者：常宝宝杨敏

刊名：中文信息学报

发表期刊： 2011年2期

页码: 3-8

摘要：语义角色标注的研究方法中使用最频繁的一类是基于特征工程,将任务转化成分类问题使用机器学习的方法来解决,几乎所有的有指导语义角色标注采用的标注语料都是宾州大学命题库标注体系.近年来,北京大学开...
23. 面向查询的多模式自动摘要研究

作者：何婷婷李芳

刊名：中文信息学报

发表期刊： 2011年2期

页码: 9-14

摘要：的多种基础上,除传统的摘要模式外,该文又设计了概括摘要、局部摘要、全局摘要和详细摘要这四种摘要模式,并给出了各种摘要的生成方法.支持用户以主题为线索自主漫游,按照一定的逻辑顺序浏览信息.
24. 音乐领域典型事件抽取方法研究

作者：丁效刘挺宋凡秦兵

刊名：中文信息学报

发表期刊： 2011年2期

页码: 15-20

摘要：事件抽取是信息抽取领域一个重要的研究方向.该文从音乐领域的事件抽取出发,通过领域事件词聚类的方法自动发现音乐领域具有代表性的事件,然后采用基于关键词与触发词相结合的过滤方法简化了事件类型的识...
25. 依存信息在蛋白质关系抽取中的作用

作者：刘兵周国栋徐华钱龙华

刊名：中文信息学报

发表期刊： 2011年2期

页码: 21-26

摘要：基于核函数的蛋白质关系(PPI)抽取可以捕获结构化信息,取得了较高的性能,但其计算复杂度过高.该文结合词汇、句法等信息,重点探讨了依存信息对基于特征向量的蛋白质关系(PPI)抽取的影响.在多...
26. 基于维基百科类别的文本特征表示

作者：张俐王会珍王锦

刊名：中文信息学报

发表期刊： 2011年2期

页码: 27-31

摘要：该文提出了基于维基百科类别体系的文本特征表示方法,方法是将文本中的词映射到维基百科的类别体系中,使用类别作为特征来对文本进行表示.基于维基类别的文本特征表示方法可以增强文本特征表示能力,降低...
27. 基于相似度的网页标题抽取方法

作者：昝红英李国华

刊名：中文信息学报

发表期刊： 2011年2期

页码: 32-37

摘要：目前网页标题的抽取方法大多结合HTML结构和标签特征进行抽取,但是这些方法并没有考虑标题与正文信息之间内容上的联系.该文提出一种基于相似度的网页标题抽取方法,该方法利用网页标题与正文信息之间...
28. 基于流形排序的查询推荐方法

作者：朱小飞杜攀程学旗郭嘉丰

刊名：中文信息学报

发表期刊： 2011年2期

页码: 38-43

摘要：针对传统查询推荐方法中存在的相关性度量问题和冗余性问题,该文中提出了一种新的基于流形排序的查询推荐方法.该方法利用查询数据内在的全局流形结构来获得查询之间的相关性,可以有效避免传统方法中相关...
29. 基于日志分析的中文输入法用户行为研究

作者：刘奕群岑荣伟杨磊茹立云许丹青马少平

刊名：中文信息学报

发表期刊： 2011年2期

页码: 44-48,71

摘要：与拼音文字不同,用户在进行中文输入时需要借助输入法软件完成从拼音串到汉字串的转换过程,输入法因此成为中文用户进行人机交互的基础性工具,而输入法的相关技术研发也一直是学术界与产业界的关注热点....
30. 题录信息的机器翻译方法

作者：于淼吕雅娟李贤华苏劲松

刊名：中文信息学报

发表期刊： 2011年2期

页码: 49-54

摘要：该文针对题录信息中的人名、地址、机构名和公司名的不同特征,分别设计了不同的翻译方法,并依靠词典和翻译规则,实现了大部分内容的翻译.对于人名翻译,该文设计了拼音转换、假名转换和同音转换的翻译方...

中文信息学报基本信息

刊名	中文信息学报	主编	孙茂松
曾用名
主办单位	中国中文信息学会中国科学院软件研究所	主管单位	中国科学技术协会
出版周期	月刊	语种	chi
ISSN	1003-0077	CN	11-2325/N
邮编	100190	电子邮箱	cips@iscas.ac.cn
电话	010-62562916	网址	www.cipsc.org.cn
地址	北京海淀区中关村南四街4号