第3页_中文信息学报2006年出版文献-钛学术文献服务平台

文献导航

检索期刊

出版文献量（篇）

2723

总下载数（次）

中文信息学报

投稿

Journal of Chinese Information Processing

CSCD JST CSTPCD

影响因子 0.8079

本刊于1986年创刊，是经国家科委批准，由中国科学技术协会主管，中国中文信息学会和中国科学院软件研究所合办的学术性刊物，是中国中文信息学会会刊。《中文信息学报》是《中文核心期刊要目总览》自动化、计算机技术类的核心刊物。国内外公开发行。它及时反映我国中文信息处理的学术水平，重点刊登我国中文信息处理基础理论与应用技术研究的学术论文，以及相关的综述、研究成果、技术报告、书刊评论、专题讨论、国内外学... 更多

主办单位：

中国中文信息学会 中国科学院软件研究所

ISSN：

1003-0077

CN：

11-2325/N

出版周期：

月刊

邮编：

100190

地址：

北京海淀区中关村南四街4号

出版文献量（篇）

2723

总下载数（次）

文章浏览

热门刊内文献

年度刊次

61. 基于规则和统计的中文自动文摘系统

作者：傅间莲陈群秀

刊名：中文信息学报

发表期刊： 2006年5期

页码: 10-16

摘要：自动文摘是自然语言处理领域里一个重要课题,本文在传统方法基础上提出了一种中文自动文摘的方法.在篇章结构分析里,我们提出了基于连续段落相似度的主题划分算法,使生成的文摘更具内容全面性与结构平衡...
62. 一种快速获取领域新词语的新方法

作者：刘华

刊名：中文信息学报

发表期刊： 2006年5期

页码: 17-23

摘要：本文提出一种新词语识别新方法.该方法直接抽取分类网页上人工标引的关键词,并按照其网页栏目所属类目存储进各分类词表,从而快速完成新词语识别和聚类任务.该方法简单快捷.我们利用该方法从15类6亿...
63. 双数组Trie树算法优化及其应用研究

作者：张华平王思力王斌

刊名：中文信息学报

发表期刊： 2006年5期

页码: 24-30

摘要：本文对双数组Trie树(Double-Array Trie)算法提出了一种优化策略,即在采用Trie树构造数组的过程中,优先处理分支结点数更多的结点.这种优化策略可以在保证该算法数据查找效率...
64. 汉语词典的快速查询算法研究

作者：周强李江波陈祖舜

刊名：中文信息学报

发表期刊： 2006年5期

页码: 31-39

摘要：汉语词典查询是中文信息处理系统的重要基础部分,对系统效率有重要的影响.本文对汉语词典查询算法研究作了简要回顾,设计实现了基于双数组TRIE机制的汉语词典查询算法,并提出了基于双编码机制的词典...
65. 一种基于信息熵的中文高频词抽取算法

作者：任禾曾隽芳

刊名：中文信息学报

发表期刊： 2006年5期

页码: 40-43,90

摘要：为扩展分词词典,提高分词的准确率,本文提出了一种基于信息熵的中文高频词抽取算法,其结果可以用来识别未登录词并扩充现有词典.我们首先对文本进行预处理,将文本中的噪音字和非中文字符转化为分隔符,...
66. 边界模板和局部统计相结合的中国人名识别

作者：刘颖李中国

刊名：中文信息学报

发表期刊： 2006年5期

页码: 44-50

摘要：本文提出了一种基于篇章信息的中国人名识别算法.我们从标注语料中提取人名左右边界词语及人名用字频度作为系统知识源.识别过程是:首先利用带有频度的边界模板识别出可能的人名,并把识别结果扩散到整篇...
67. SVM与规则相结合的中文地名自动识别

作者：李丽双杨元生陈春荣黄德根

刊名：中文信息学报

发表期刊： 2006年5期

页码: 51-57

摘要：在分析中文文本中地名特点的基础上,提出了一种支持向量机(SVM)与规则相结合的中文地名自动识别方法:按字抽取特征向量的属性,然后将这些属性转换成二进制向量并建立训练集,采用多项式Kernel...
68. 面向连续字符识别的手写汉字部件集及统计规律

作者：刘家锋唐降龙李春娣赵巍

刊名：中文信息学报

发表期刊： 2006年5期

页码: 58-64

摘要：本文面向手写字符序列输入信号连续识别研究,分析了汉字及联机手写文本的特点,提出并构建了手写汉字部件集.基于该部件集,完成了GB2312-80的6,763个汉字的部件拆分编码和部件集的测试.统...
69. 基于高阶统计的手写字符形变弹性匹配法

作者：杨静宇马瑞

刊名：中文信息学报

发表期刊： 2006年5期

页码: 65-70

摘要：针对传统弹性匹配法在手写字符识别中存在着由于过匹配而造成误识别的不足,提出一种基于高阶统计的形变弹性匹配法.根据高阶统计量包含字符形状上的细节变化信息,采用独立分量分析抽取出每个字符类的内在...
70. 基于时域单元融合的拼接平滑算法

作者：吴义坚郭武

刊名：中文信息学报

发表期刊： 2006年5期

页码: 71-76

摘要：针对基于大语料库的拼接合成系统中经常出现的拼接单元不匹配问题,特别是浊音拼接处不匹配对合成效果会产生较大的损伤,本文提出一种基于时域单元融合技术的平滑算法.它通过模板匹配选取合适的过渡段模板...
71. 基于语音配列的汉语方言自动辨识

作者：沈兆勇顾明亮

刊名：中文信息学报

发表期刊： 2006年5期

页码: 77-82

摘要：本文首先讨论了汉语方言辨识的依据及特征选取的基本原则,并由此导出了区间差分倒谱特征.然后利用GMM符号发生器和N元语言模型及ANN建立了一个方言辨识系统,该系统与传统的语种识别系统相比,具有...
72. 编码字符集标准及分类研究

作者：吴健芮建武谢谦

刊名：中文信息学报

发表期刊： 2006年5期

页码: 83-90

摘要：编码字符集标准是计算机处理文字信息的基础,本文提出了编码字符集三元组抽象,对现有编码字符集标准进行了简单回顾和总结,深入剖析了影响巨大的ISO 2022标准及其派生标准,对ISO 2022编...
73. 一个基于ISO/IEC10646的汉字输入模型

作者：朱巧明李培峰钱培德

刊名：中文信息学报

发表期刊： 2006年5期

页码: 91-96

摘要：计算机中各国文字编码的统一是必然趋势,而ISO/IEC 10646正是顺应这种趋势而诞生的一个国际标准.现有的输入法绝大多数是基于本地代码页(ANSI CODE),存在着移植困难、不能跨语言...
74. 汉字输入编码优劣评测方法的探讨

作者：孙基寿

刊名：中文信息学报

发表期刊： 2006年5期

页码: 97-104

摘要：字形编码的优劣必须进行科学的评测.编码规则的轻松性和速度潜力是评价字形编码优劣的两个关键指标.本文共分四部分,第一部分简单地陈述了什么是简单、规范、易学、轻松,提出了选择轻松的理由;第二部分...
75. 基于双层决策的新闻网页正文精确抽取

作者：张巍王仁华胡国平

刊名：中文信息学报

发表期刊： 2006年6期

页码: 1-9,103

摘要：本文提出了基于双层决策的新闻网页正文的精确抽取算法,双层决策是指对新闻网页正文所在区域的全局范围决策和对正文范围内每段文字是否确是正文的局部内容决策.首先根据实际应用的需要给出了新闻网页正文...
76. 应用于长频繁集挖掘的基于变动邻域搜索的遗传算法设计

作者：王树梅章舜仲陈肇雄黄河燕

刊名：中文信息学报

发表期刊： 2006年6期

页码: 10-16

摘要：提出了一种基于变动邻域搜索的长频繁集挖掘方法(VNS-GA),利用遗传算法的高效搜索性能快速挖掘最大频繁集.在遗传算法的适应度函数设计中,综合考虑项集支持度、长度以及项集支持度和邻域中心支持...
77. 基于SVM的组块识别及其错误驱动学习方法

作者：王莹莹黄德根

刊名：中文信息学报

发表期刊： 2006年6期

页码: 17-24

摘要：给出了一种错误驱动学习机制与SVM相结合的汉语组块识别方法.该方法在SVM组块识别的基础上,对SVM识别结果中的错误词语序列的词性、组块标注信息等进行分析,获得候选校正规则集;之后按照阈值条...
78. 一种基于词汇链的关键词抽取方法

作者：刘玉树曹淑英索红光

刊名：中文信息学报

发表期刊： 2006年6期

页码: 25-30

摘要：关键词在文献检索、自动文摘、文本聚类/分类等方面有十分重要的作用.词汇链是由一系列词义相关的词语组成,最初被用于分析文本的结构.本文提出了利用词汇链进行中文文本关键词自动标引的方法,并给出了...
79. 自动获取汉语词语搭配

作者：张武杨军玲王素格

刊名：中文信息学报

发表期刊： 2006年6期

页码: 31-37

摘要：作为一种词汇现象,词语搭配在自然语言处理的许多领域具有重要的应用.本文对4种词语相关性度量和3种词语结构分布度量分别进行了比较分析,并提出了一种基于互信息与熵融合的获取词语搭配的方法.实验结...
80. 基于词语属性的计算机辅助获取流行词语研究

作者：任函何婷婷张勇朱薏

刊名：中文信息学报

发表期刊： 2006年6期

页码: 38-45

摘要：本文以2005年的1月1日至6月25日新浪网上下载的各类页面上的文本内容为研究资源集合,从中提取出有效词语,对词语的流行程度的判定属性做了定性定量的分析研究,对词语的流行特性进行了定义,在此...
81. 一种基于演化算法进行句子抽取的多文档自动摘要系统SBGA

作者：何炎祥刘德喜姬东鸿杨华

刊名：中文信息学报

发表期刊： 2006年6期

页码: 46-53

摘要： SBGA系统将多文档自动摘要过程视为一个从源文档集中抽取句子的组合优化过程,并用演化算法来求得近似最优解.与基于聚类的句子抽取方法相比,基于演化算法进行句子抽取的方法是面向摘要整体的,因此能...
82. 基于Web的文摘技术研究

作者：刘万春朱玉文耿增民贾云得

刊名：中文信息学报

发表期刊： 2006年6期

页码: 54-60,108

摘要： Web文档的迅猛增长使Web文摘技术成了当今的一个研究热点.由于Web文档的特殊性,使得Web文摘不同于传统的文本自动文摘.本文分析了Web文档的特点;给出了Web文摘的定义;提出了基于句子...
83. 基于语义分析的作者身份识别方法研究

作者：吴立德武晓春黄萱菁

刊名：中文信息学报

发表期刊： 2006年6期

页码: 61-68

摘要：作者身份识别是一项应用广泛的研究,身份识别的关键问题是从作品中提取出代表语体风格的识别特征,并根据这些风格特征,评估作品与作品之间的风格相似度.传统的身份识别方法,主要考察作者遣词造句、段落...
84. 手写中文地址识别后处理方法的研究

作者：堀田悦伸孙俊庄丽朱小燕直井聡黄开竹龙翀

刊名：中文信息学报

发表期刊： 2006年6期

页码: 69-74

摘要： OCR(光学字符识别技术)作为方便有效的字体识别技术,在办公自动化、信息恢复、数字图书馆等方面发挥着日益重要的作用.语言模型在OCR后处理,特别是在中文的文字识别后处理方面有着广泛的应用.本...
85. 基于特征规整和评分规整的说话人确认研究

作者：张树武徐波郑榕

刊名：中文信息学报

发表期刊： 2006年6期

页码: 75-82

摘要：在说话人确认系统中,训练和测试的声学环境不匹配将造成性能急剧下降.本文提出了从特征规整和评分规整两个方面进行补偿的方法.首先,改进了基于分段的倒谱均值方差规整(SCMVN)方法,将倒谱系数都...
86. 汉语连续语音中HMM模型状态数优化方法研究

作者：何珏刘加

刊名：中文信息学报

发表期刊： 2006年6期

页码: 83-88

摘要：为了优化汉语连续语音中HMM模型系统以提高识别性能,提出了分别为每个声母和韵母半音节声学模型选择最优的状态数的方法.通过综合考虑每个声母和韵母半音节声学模型在不同状态数下的段长均值、方差以及...
87. 普通话水平测试电子化系统

作者：刘庆升王仁华胡郁魏思

刊名：中文信息学报

发表期刊： 2006年6期

页码: 89-96

摘要：普通话水平测试电子化系统有助于高效地进行普通话水平测试.本文在100小时标准发音人数据库的基础上,针对汉语发音特点,利用语言学专家知识,引入语料选择的自适应算法改进了传统的语音评测算法.在5...
88. ISO 2022的有限状态机描述

作者：吴健芮建武谢谦

刊名：中文信息学报

发表期刊： 2006年6期

页码: 97-103

摘要： ISO 2022编码体系对字符集国家标准的制订有很大影响,然而标准条款存在不确定性,有时难于理解.本文引入有限状态机(FSM)模型来形式化地刻画ISO 2022的特征.针对FSM五元组,详细...
89. 一个适用于手持设备的多层汉字输入法模型

作者：刁红军朱巧明朱晓旭李培峰

刊名：中文信息学报

发表期刊： 2006年6期

页码: 104-108

摘要：随着以PDA和智能手机为代表的手持设备快速发展,汉字输入法选择余地小的缺点已经成为影响其普及的障碍之一.究其原因是手持设备中的操作系统和物理设备类型多,而开发的汉字输入法在不同手持设备中不通...
90. 《中文信息学报》征稿简则

作者：

刊名：中文信息学报

发表期刊： 2006年3期

页码: 封三

摘要：

中文信息学报基本信息

刊名	中文信息学报	主编	孙茂松
曾用名
主办单位	中国中文信息学会中国科学院软件研究所	主管单位	中国科学技术协会
出版周期	月刊	语种	chi
ISSN	1003-0077	CN	11-2325/N
邮编	100190	电子邮箱	cips@iscas.ac.cn
电话	010-62562916	网址	www.cipsc.org.cn
地址	北京海淀区中关村南四街4号