中文信息学报期刊
出版文献量(篇)
2723
总下载数(次)
5
总被引数(次)
45413

中文信息学报

Journal of Chinese Information Processing

CSCDJSTCSTPCD

影响因子 0.8079
本刊于1986年创刊,是经国家科委批准,由中国科学技术协会主管,中国中文信息学会和中国科学院软件研究所合办的学术性刊物,是中国中文信息学会会刊。《中文信息学报》是《中文核心期刊要目总览》自动化、计算机技术类的核心刊物。国内外公开发行。它及时反映我国中文信息处理的学术水平,重点刊登我国中文信息处理基础理论与应用技术研究的学术论文,以及相关的综述、研究成果、技术报告、书刊评论、专题讨论、国内外学... 更多
主办单位:
中国中文信息学会 中国科学院软件研究所
ISSN:
1003-0077
CN:
11-2325/N
出版周期:
月刊
邮编:
100190
地址:
北京海淀区中关村南四街4号
出版文献量(篇)
2723
总下载数(次)
5
总被引数(次)
45413
文章浏览
目录
  • 作者: 刘奕群 孔维泽 张敏 马少平
    刊名: 中文信息学报
    发表期刊: 2011年1期
    页码:  3-8
    摘要: 问答社区已经成为网络信息获取的一种重要渠道,但其信息质量差异较大.该文研究了问答社区中回答质量的评价方法.具体考察了百度知道的问答社区环境,并对其构建了大规模的语料数据.针对百度知道的特点,...
  • 作者: 王斌 蒋在帆
    刊名: 中文信息学报
    发表期刊: 2011年1期
    页码:  9-14,122
    摘要: 个人信息检索是指个人计算机上用户搜索个人信息(通常是文档)的过程,与互联网检索相比,个人信息检索能够利用的信息很少,这使得其检索结果的排序更加困难.该文通过考察计算机上的用户行为,对个人信息...
  • 作者: 刘全升 姚天昉
    刊名: 中文信息学报
    发表期刊: 2011年1期
    页码:  15-19
    摘要: 该文在研究了信息检索理论与文本倾向性分析技术等的基础上,结合国内外关于观点检索的相关研究,提出了基于关联度的文本观点检索算法.它综合考虑了主题检索过程中的查询扩展、文本检索相关度、文本倾向性...
  • 作者: 刘悦 曹鹏 李静远 满彤 程学旗
    刊名: 中文信息学报
    发表期刊: 2011年1期
    页码:  20-27
    摘要: 微博客是Web2.0出现以来的一个新生概念.著名的Twitter系统是微博客中具有代表性的一个.其全球用户已经超过1.6亿,在世界范围内具有重要影响力:目前知名政治家、社会名流和大企业几乎都...
  • 作者: 林原 林鸿飞 马云龙
    刊名: 中文信息学报
    发表期刊: 2011年1期
    页码:  28-34
    摘要: 查询扩展是信息检索中的一项重要技术.传统的局部分析查询扩展方法利用伪相关文档作为候选词集合,然而部分伪相关文档并不具有很高的相关性.该文利用真实的搜索引擎查询日志.建立了查询点击图,经过多次...
  • 作者: 刘奕群 张敏 方奇 茹立云 马少平
    刊名: 中文信息学报
    发表期刊: 2011年1期
    页码:  35-40
    摘要: Web访问日志中的会话(session)是指特定用户在一定时间范围内的访问行为的连续序列.会话主题(topic)是指会话中具有相同用户意图的部分.从会话中进一步识别出能体现用户意图的处理单元...
  • 作者: 刁宇峰 杨亮 林鸿飞
    刊名: 中文信息学报
    发表期刊: 2011年1期
    页码:  41-47
    摘要: Blog(博客)作为一种新兴的网络媒体,在很大程度上增强了互联网的开放性,Blog已经成为互联网上的主要信息源之一,这也使得Blog空间中的垃圾评论成倍增长,因此如何识别垃圾评论成为面临的重...
  • 作者: 孙丽华 李渝勤
    刊名: 中文信息学报
    发表期刊: 2011年1期
    页码:  48-53,59
    摘要: 热词是一种网络词汇现象,反映了某一特定时空范围内人们普遍关注的问题.该文对热词分析的两项关键技术——热词发现和热词关联技术进行了深入的研究.在热词发现阶段,首先采用命名实体识别技术和高频串统...
  • 作者: 俞晓明 刘春阳 彭泽映 许洪波
    刊名: 中文信息学报
    发表期刊: 2011年1期
    页码:  54-59
    摘要: 聚类分析是数据挖掘的一个重要手段,人们可以通过聚类发现信息中潜在的热点或规律.至今,已经有大量聚类算法被研究和提出.随着互联网的日益普及,查询日志、Twitter等短文本信息逐渐在人们生活中...
  • 作者: 冯时 刘振鹿 张一飞 方东昊 王大玲
    刊名: 中文信息学报
    发表期刊: 2011年1期
    页码:  60-65,70
    摘要: 该文应用LDA模型进行文档的潜在语义分析,将语义分布划分成低频、中频、高频语义区,以低频语义区的语义进行Web游离文档检测,以中、高频语义区的语义作为文档特征进行文档聚类,采用文档类别与语义...
  • 作者: 李生 杨沐昀 韩中元 齐浩亮
    刊名: 中文信息学报
    发表期刊: 2011年1期
    页码:  66-70
    摘要: 面向信息检索的语言模型对单篇文档构建语言模型,存在较严重的数据稀疏问题.该文认为利用文档的近邻信息能够更合理地反映词在文档中的分布,有助于数据稀疏问题的解决,因此将文档的近邻信息加入语言模型...
  • 作者: 冯艳卉 姚建民 朱巧明 洪宇 颜振祥
    刊名: 中文信息学报
    发表期刊: 2011年1期
    页码:  71-78
    摘要: 该文提出了一种从搜索引擎返回的结果网页中获取双语网页的新方法,该方法分为两个任务.第一个任务是自动地检测并收集搜索引擎返回的结果网页中的数据记录.该步骤通过聚类的方法识别出有用的记录摘要并且...
  • 作者: 邱立坤 邵艳秋
    刊名: 中文信息学报
    发表期刊: 2011年1期
    页码:  79-84
    摘要: 平行周遍原则是陈保亚(1999)提出的一种用于区分词与短语的理论,将词语分为既平行又周遍、平行不周遍和不平行不周遍三类,既平行又周遍的是短语,不宜收入词典.由于汉语语叉词典在收词时并未严格遵...
  • 作者: 姚建民 朱巧明 洪宇 陆军 陆玉清
    刊名: 中文信息学报
    发表期刊: 2011年1期
    页码:  85-90
    摘要: 英文文本中的真词错误即输入的错词是和原词相似的另一个有效词.该文主要研究了对该类错误的检测.通过从所要检测的单词的上下文中提取句法和语义两个方面的特征,运用文档频率和信息增益进行特征筛选,实...
  • 作者: 俞昊旻 张奇 张玥 黄萱菁
    刊名: 中文信息学报
    发表期刊: 2011年1期
    页码:  91-97
    摘要: 如何对大规模文档集进行高效的拷贝检测是长期以来一直受到研究者们关注的问题.通常的拷贝检测算法都需要借助倒排索引.因此良好的索引结构对于算法性能至关重要.同时,随着文档集规模的增大,单机实现的...
  • 作者: 刘秉权 孙承杰 杨小锐 林磊
    刊名: 中文信息学报
    发表期刊: 2011年1期
    页码:  98-103,109
    摘要: 随着互联网的发展,网络论坛中蕴涵着数量巨大且质量较好的知识资源.因此对论坛信息进行有效地检索具有重要应用价值.该文研究适合于论坛数据的检索模型,以期能够充分利用论坛平台累积的海量数据来满足用...
  • 作者: 苗家 陈竹敏 马军
    刊名: 中文信息学报
    发表期刊: 2011年1期
    页码:  104-109
    摘要: Blog文章对应了大量评论信息,评论中又包含大量的噪声,因此如何结合Blog评论获取Blog文章的主要内容是许多基于Blog的应用所要面临的难题.以往提出的文摘方法大多是针对多文档文摘的通用...
  • 作者: 季铎 张桂平 王莹莹 罗阳
    刊名: 中文信息学报
    发表期刊: 2011年1期
    页码:  110-115
    摘要: 双语资源是机器翻译和跨语言信息检索等领域的重要资源,但是由于语料库真实性、时效性和语种灵活性等问题,使得现有的双语资源的规模很难满足实际应用的需要.该文提出一种面向单一双语网页的双语资源挖掘...
  • 作者: 孙薇薇 王鑫 穗志方
    刊名: 中文信息学报
    发表期刊: 2011年1期
    页码:  116-122
    摘要: 语义角色标注是获取语义信息的一种重要手段.许多现有的语义角色标注都是在完全句法分析的基础上进行的,但由于现阶段中文完全句法分析器性能比较低,基于自动完全句法分析的中文语义角色标注效果并不理想...
  • 作者: 俞昊旻 张奇 张玥 黄萱菁
    刊名: 中文信息学报
    发表期刊: 2011年1期
    页码:  123-128
    摘要: 随着互联网上数据的爆炸式增长,互联网上产生了大量的重复数据.这些重复数据给搜索引擎、观点挖掘等许多web应用带来了严峻的问题.目前绝大部分的重复检测的算法均着重考虑文档级别,不能有效地检测出...
  • 作者:
    刊名: 中文信息学报
    发表期刊: 2011年1期
    页码:  128
    摘要:
  • 作者: 常宝宝 杨敏
    刊名: 中文信息学报
    发表期刊: 2011年2期
    页码:  3-8
    摘要: 语义角色标注的研究方法中使用最频繁的一类是基于特征工程,将任务转化成分类问题使用机器学习的方法来解决,几乎所有的有指导语义角色标注采用的标注语料都是宾州大学命题库标注体系.近年来,北京大学开...
  • 作者: 何婷婷 李芳
    刊名: 中文信息学报
    发表期刊: 2011年2期
    页码:  9-14
    摘要: 的多种基础上,除传统的摘要模式外,该文又设计了概括摘要、局部摘要、全局摘要和详细摘要这四种摘要模式,并给出了各种摘要的生成方法.支持用户以主题为线索自主漫游,按照一定的逻辑顺序浏览信息.
  • 作者: 丁效 刘挺 宋凡 秦兵
    刊名: 中文信息学报
    发表期刊: 2011年2期
    页码:  15-20
    摘要: 事件抽取是信息抽取领域一个重要的研究方向.该文从音乐领域的事件抽取出发,通过领域事件词聚类的方法自动发现音乐领域具有代表性的事件,然后采用基于关键词与触发词相结合的过滤方法简化了事件类型的识...
  • 作者: 刘兵 周国栋 徐华 钱龙华
    刊名: 中文信息学报
    发表期刊: 2011年2期
    页码:  21-26
    摘要: 基于核函数的蛋白质关系(PPI)抽取可以捕获结构化信息,取得了较高的性能,但其计算复杂度过高.该文结合词汇、句法等信息,重点探讨了依存信息对基于特征向量的蛋白质关系(PPI)抽取的影响.在多...
  • 作者: 张俐 王会珍 王锦
    刊名: 中文信息学报
    发表期刊: 2011年2期
    页码:  27-31
    摘要: 该文提出了基于维基百科类别体系的文本特征表示方法,方法是将文本中的词映射到维基百科的类别体系中,使用类别作为特征来对文本进行表示.基于维基类别的文本特征表示方法可以增强文本特征表示能力,降低...
  • 作者: 昝红英 李国华
    刊名: 中文信息学报
    发表期刊: 2011年2期
    页码:  32-37
    摘要: 目前网页标题的抽取方法大多结合HTML结构和标签特征进行抽取,但是这些方法并没有考虑标题与正文信息之间内容上的联系.该文提出一种基于相似度的网页标题抽取方法,该方法利用网页标题与正文信息之间...
  • 作者: 朱小飞 杜攀 程学旗 郭嘉丰
    刊名: 中文信息学报
    发表期刊: 2011年2期
    页码:  38-43
    摘要: 针对传统查询推荐方法中存在的相关性度量问题和冗余性问题,该文中提出了一种新的基于流形排序的查询推荐方法.该方法利用查询数据内在的全局流形结构来获得查询之间的相关性,可以有效避免传统方法中相关...
  • 作者: 刘奕群 岑荣伟 杨磊 茹立云 许丹青 马少平
    刊名: 中文信息学报
    发表期刊: 2011年2期
    页码:  44-48,71
    摘要: 与拼音文字不同,用户在进行中文输入时需要借助输入法软件完成从拼音串到汉字串的转换过程,输入法因此成为中文用户进行人机交互的基础性工具,而输入法的相关技术研发也一直是学术界与产业界的关注热点....
  • 作者: 于淼 吕雅娟 李贤华 苏劲松
    刊名: 中文信息学报
    发表期刊: 2011年2期
    页码:  49-54
    摘要: 该文针对题录信息中的人名、地址、机构名和公司名的不同特征,分别设计了不同的翻译方法,并依靠词典和翻译规则,实现了大部分内容的翻译.对于人名翻译,该文设计了拼音转换、假名转换和同音转换的翻译方...

中文信息学报基本信息

刊名 中文信息学报 主编 孙茂松
曾用名
主办单位 中国中文信息学会 中国科学院软件研究所  主管单位 中国科学技术协会
出版周期 月刊 语种
chi
ISSN 1003-0077 CN 11-2325/N
邮编 100190 电子邮箱 cips@iscas.ac.cn
电话 010-62562916 网址 www.cipsc.org.cn
地址 北京海淀区中关村南四街4号

中文信息学报统计分析

被引趋势
(/次)
(/年)
学科分布
研究主题
推荐期刊