中文信息学报期刊
出版文献量(篇)
2723
总下载数(次)
5

中文信息学报

Journal of Chinese Information Processing

CSCDJSTCSTPCD

影响因子 0.8079
本刊于1986年创刊,是经国家科委批准,由中国科学技术协会主管,中国中文信息学会和中国科学院软件研究所合办的学术性刊物,是中国中文信息学会会刊。《中文信息学报》是《中文核心期刊要目总览》自动化、计算机技术类的核心刊物。国内外公开发行。它及时反映我国中文信息处理的学术水平,重点刊登我国中文信息处理基础理论与应用技术研究的学术论文,以及相关的综述、研究成果、技术报告、书刊评论、专题讨论、国内外学... 更多
主办单位:
中国中文信息学会 中国科学院软件研究所
ISSN:
1003-0077
CN:
11-2325/N
出版周期:
月刊
邮编:
100190
地址:
北京海淀区中关村南四街4号
出版文献量(篇)
2723
总下载数(次)
5
文章浏览
目录
  • 作者: 傅间莲 陈群秀
    刊名: 中文信息学报
    发表期刊: 2006年5期
    页码:  10-16
    摘要: 自动文摘是自然语言处理领域里一个重要课题,本文在传统方法基础上提出了一种中文自动文摘的方法.在篇章结构分析里,我们提出了基于连续段落相似度的主题划分算法,使生成的文摘更具内容全面性与结构平衡...
  • 作者: 刘华
    刊名: 中文信息学报
    发表期刊: 2006年5期
    页码:  17-23
    摘要: 本文提出一种新词语识别新方法.该方法直接抽取分类网页上人工标引的关键词,并按照其网页栏目所属类目存储进各分类词表,从而快速完成新词语识别和聚类任务.该方法简单快捷.我们利用该方法从15类6亿...
  • 作者: 张华平 王思力 王斌
    刊名: 中文信息学报
    发表期刊: 2006年5期
    页码:  24-30
    摘要: 本文对双数组Trie树(Double-Array Trie)算法提出了一种优化策略,即在采用Trie树构造数组的过程中,优先处理分支结点数更多的结点.这种优化策略可以在保证该算法数据查找效率...
  • 作者: 周强 李江波 陈祖舜
    刊名: 中文信息学报
    发表期刊: 2006年5期
    页码:  31-39
    摘要: 汉语词典查询是中文信息处理系统的重要基础部分,对系统效率有重要的影响.本文对汉语词典查询算法研究作了简要回顾,设计实现了基于双数组TRIE机制的汉语词典查询算法,并提出了基于双编码机制的词典...
  • 作者: 任禾 曾隽芳
    刊名: 中文信息学报
    发表期刊: 2006年5期
    页码:  40-43,90
    摘要: 为扩展分词词典,提高分词的准确率,本文提出了一种基于信息熵的中文高频词抽取算法,其结果可以用来识别未登录词并扩充现有词典.我们首先对文本进行预处理,将文本中的噪音字和非中文字符转化为分隔符,...
  • 作者: 刘颖 李中国
    刊名: 中文信息学报
    发表期刊: 2006年5期
    页码:  44-50
    摘要: 本文提出了一种基于篇章信息的中国人名识别算法.我们从标注语料中提取人名左右边界词语及人名用字频度作为系统知识源.识别过程是:首先利用带有频度的边界模板识别出可能的人名,并把识别结果扩散到整篇...
  • 作者: 李丽双 杨元生 陈春荣 黄德根
    刊名: 中文信息学报
    发表期刊: 2006年5期
    页码:  51-57
    摘要: 在分析中文文本中地名特点的基础上,提出了一种支持向量机(SVM)与规则相结合的中文地名自动识别方法:按字抽取特征向量的属性,然后将这些属性转换成二进制向量并建立训练集,采用多项式Kernel...
  • 作者: 刘家锋 唐降龙 李春娣 赵巍
    刊名: 中文信息学报
    发表期刊: 2006年5期
    页码:  58-64
    摘要: 本文面向手写字符序列输入信号连续识别研究,分析了汉字及联机手写文本的特点,提出并构建了手写汉字部件集.基于该部件集,完成了GB2312-80的6,763个汉字的部件拆分编码和部件集的测试.统...
  • 作者: 杨静宇 马瑞
    刊名: 中文信息学报
    发表期刊: 2006年5期
    页码:  65-70
    摘要: 针对传统弹性匹配法在手写字符识别中存在着由于过匹配而造成误识别的不足,提出一种基于高阶统计的形变弹性匹配法.根据高阶统计量包含字符形状上的细节变化信息,采用独立分量分析抽取出每个字符类的内在...
  • 作者: 吴义坚 郭武
    刊名: 中文信息学报
    发表期刊: 2006年5期
    页码:  71-76
    摘要: 针对基于大语料库的拼接合成系统中经常出现的拼接单元不匹配问题,特别是浊音拼接处不匹配对合成效果会产生较大的损伤,本文提出一种基于时域单元融合技术的平滑算法.它通过模板匹配选取合适的过渡段模板...
  • 作者: 沈兆勇 顾明亮
    刊名: 中文信息学报
    发表期刊: 2006年5期
    页码:  77-82
    摘要: 本文首先讨论了汉语方言辨识的依据及特征选取的基本原则,并由此导出了区间差分倒谱特征.然后利用GMM符号发生器和N元语言模型及ANN建立了一个方言辨识系统,该系统与传统的语种识别系统相比,具有...
  • 作者: 吴健 芮建武 谢谦
    刊名: 中文信息学报
    发表期刊: 2006年5期
    页码:  83-90
    摘要: 编码字符集标准是计算机处理文字信息的基础,本文提出了编码字符集三元组抽象,对现有编码字符集标准进行了简单回顾和总结,深入剖析了影响巨大的ISO 2022标准及其派生标准,对ISO 2022编...
  • 作者: 朱巧明 李培峰 钱培德
    刊名: 中文信息学报
    发表期刊: 2006年5期
    页码:  91-96
    摘要: 计算机中各国文字编码的统一是必然趋势,而ISO/IEC 10646正是顺应这种趋势而诞生的一个国际标准.现有的输入法绝大多数是基于本地代码页(ANSI CODE),存在着移植困难、不能跨语言...
  • 作者: 孙基寿
    刊名: 中文信息学报
    发表期刊: 2006年5期
    页码:  97-104
    摘要: 字形编码的优劣必须进行科学的评测.编码规则的轻松性和速度潜力是评价字形编码优劣的两个关键指标.本文共分四部分,第一部分简单地陈述了什么是简单、规范、易学、轻松,提出了选择轻松的理由;第二部分...
  • 作者: 张巍 王仁华 胡国平
    刊名: 中文信息学报
    发表期刊: 2006年6期
    页码:  1-9,103
    摘要: 本文提出了基于双层决策的新闻网页正文的精确抽取算法,双层决策是指对新闻网页正文所在区域的全局范围决策和对正文范围内每段文字是否确是正文的局部内容决策.首先根据实际应用的需要给出了新闻网页正文...
  • 作者: 王树梅 章舜仲 陈肇雄 黄河燕
    刊名: 中文信息学报
    发表期刊: 2006年6期
    页码:  10-16
    摘要: 提出了一种基于变动邻域搜索的长频繁集挖掘方法(VNS-GA),利用遗传算法的高效搜索性能快速挖掘最大频繁集.在遗传算法的适应度函数设计中,综合考虑项集支持度、长度以及项集支持度和邻域中心支持...
  • 作者: 王莹莹 黄德根
    刊名: 中文信息学报
    发表期刊: 2006年6期
    页码:  17-24
    摘要: 给出了一种错误驱动学习机制与SVM相结合的汉语组块识别方法.该方法在SVM组块识别的基础上,对SVM识别结果中的错误词语序列的词性、组块标注信息等进行分析,获得候选校正规则集;之后按照阈值条...
  • 作者: 刘玉树 曹淑英 索红光
    刊名: 中文信息学报
    发表期刊: 2006年6期
    页码:  25-30
    摘要: 关键词在文献检索、自动文摘、文本聚类/分类等方面有十分重要的作用.词汇链是由一系列词义相关的词语组成,最初被用于分析文本的结构.本文提出了利用词汇链进行中文文本关键词自动标引的方法,并给出了...
  • 作者: 张武 杨军玲 王素格
    刊名: 中文信息学报
    发表期刊: 2006年6期
    页码:  31-37
    摘要: 作为一种词汇现象,词语搭配在自然语言处理的许多领域具有重要的应用.本文对4种词语相关性度量和3种词语结构分布度量分别进行了比较分析,并提出了一种基于互信息与熵融合的获取词语搭配的方法.实验结...
  • 作者: 任函 何婷婷 张勇 朱薏
    刊名: 中文信息学报
    发表期刊: 2006年6期
    页码:  38-45
    摘要: 本文以2005年的1月1日至6月25日新浪网上下载的各类页面上的文本内容为研究资源集合,从中提取出有效词语,对词语的流行程度的判定属性做了定性定量的分析研究,对词语的流行特性进行了定义,在此...
  • 作者: 何炎祥 刘德喜 姬东鸿 杨华
    刊名: 中文信息学报
    发表期刊: 2006年6期
    页码:  46-53
    摘要: SBGA系统将多文档自动摘要过程视为一个从源文档集中抽取句子的组合优化过程,并用演化算法来求得近似最优解.与基于聚类的句子抽取方法相比,基于演化算法进行句子抽取的方法是面向摘要整体的,因此能...
  • 作者: 刘万春 朱玉文 耿增民 贾云得
    刊名: 中文信息学报
    发表期刊: 2006年6期
    页码:  54-60,108
    摘要: Web文档的迅猛增长使Web文摘技术成了当今的一个研究热点.由于Web文档的特殊性,使得Web文摘不同于传统的文本自动文摘.本文分析了Web文档的特点;给出了Web文摘的定义;提出了基于句子...
  • 作者: 吴立德 武晓春 黄萱菁
    刊名: 中文信息学报
    发表期刊: 2006年6期
    页码:  61-68
    摘要: 作者身份识别是一项应用广泛的研究,身份识别的关键问题是从作品中提取出代表语体风格的识别特征,并根据这些风格特征,评估作品与作品之间的风格相似度.传统的身份识别方法,主要考察作者遣词造句、段落...
  • 作者: 堀田悦伸 孙俊 庄丽 朱小燕 直井聡 黄开竹 龙翀
    刊名: 中文信息学报
    发表期刊: 2006年6期
    页码:  69-74
    摘要: OCR(光学字符识别技术)作为方便有效的字体识别技术,在办公自动化、信息恢复、数字图书馆等方面发挥着日益重要的作用.语言模型在OCR后处理,特别是在中文的文字识别后处理方面有着广泛的应用.本...
  • 作者: 张树武 徐波 郑榕
    刊名: 中文信息学报
    发表期刊: 2006年6期
    页码:  75-82
    摘要: 在说话人确认系统中,训练和测试的声学环境不匹配将造成性能急剧下降.本文提出了从特征规整和评分规整两个方面进行补偿的方法.首先,改进了基于分段的倒谱均值方差规整(SCMVN)方法,将倒谱系数都...
  • 作者: 何珏 刘加
    刊名: 中文信息学报
    发表期刊: 2006年6期
    页码:  83-88
    摘要: 为了优化汉语连续语音中HMM模型系统以提高识别性能,提出了分别为每个声母和韵母半音节声学模型选择最优的状态数的方法.通过综合考虑每个声母和韵母半音节声学模型在不同状态数下的段长均值、方差以及...
  • 作者: 刘庆升 王仁华 胡郁 魏思
    刊名: 中文信息学报
    发表期刊: 2006年6期
    页码:  89-96
    摘要: 普通话水平测试电子化系统有助于高效地进行普通话水平测试.本文在100小时标准发音人数据库的基础上,针对汉语发音特点,利用语言学专家知识,引入语料选择的自适应算法改进了传统的语音评测算法.在5...
  • 作者: 吴健 芮建武 谢谦
    刊名: 中文信息学报
    发表期刊: 2006年6期
    页码:  97-103
    摘要: ISO 2022编码体系对字符集国家标准的制订有很大影响,然而标准条款存在不确定性,有时难于理解.本文引入有限状态机(FSM)模型来形式化地刻画ISO 2022的特征.针对FSM五元组,详细...
  • 作者: 刁红军 朱巧明 朱晓旭 李培峰
    刊名: 中文信息学报
    发表期刊: 2006年6期
    页码:  104-108
    摘要: 随着以PDA和智能手机为代表的手持设备快速发展,汉字输入法选择余地小的缺点已经成为影响其普及的障碍之一.究其原因是手持设备中的操作系统和物理设备类型多,而开发的汉字输入法在不同手持设备中不通...
  • 作者:
    刊名: 中文信息学报
    发表期刊: 2006年3期
    页码:  封三
    摘要:

中文信息学报基本信息

刊名 中文信息学报 主编 孙茂松
曾用名
主办单位 中国中文信息学会 中国科学院软件研究所  主管单位 中国科学技术协会
出版周期 月刊 语种
chi
ISSN 1003-0077 CN 11-2325/N
邮编 100190 电子邮箱 cips@iscas.ac.cn
电话 010-62562916 网址 www.cipsc.org.cn
地址 北京海淀区中关村南四街4号

中文信息学报统计分析

被引趋势
(/次)
(/年)
学科分布
研究主题
推荐期刊