中文信息学报期刊
出版文献量(篇)
2723
总下载数(次)
5

中文信息学报

Journal of Chinese Information Processing

CSCDJSTCSTPCD

影响因子 0.8079
本刊于1986年创刊,是经国家科委批准,由中国科学技术协会主管,中国中文信息学会和中国科学院软件研究所合办的学术性刊物,是中国中文信息学会会刊。《中文信息学报》是《中文核心期刊要目总览》自动化、计算机技术类的核心刊物。国内外公开发行。它及时反映我国中文信息处理的学术水平,重点刊登我国中文信息处理基础理论与应用技术研究的学术论文,以及相关的综述、研究成果、技术报告、书刊评论、专题讨论、国内外学... 更多
主办单位:
中国中文信息学会 中国科学院软件研究所
ISSN:
1003-0077
CN:
11-2325/N
出版周期:
月刊
邮编:
100190
地址:
北京海淀区中关村南四街4号
出版文献量(篇)
2723
总下载数(次)
5
文章浏览
目录
  • 作者: 孟遥 杨沐昀 赵铁军 韩习武 齐浩亮
    刊名: 中文信息学报
    发表期刊: 2004年1期
    页码:  1-5,13
    摘要: 本文提出了一种面向特定领域的汉语句法主干分析方法.该方法中包括浅层句法分析、模板匹配两个关键环节,形成用模板表示的句法主干.在浅层句法分析中,本文使用了级联的隐马尔可夫模型进行了短语的归并;...
  • 作者: 于浩 徐国伟 瞿有利 西野文人
    刊名: 中文信息学报
    发表期刊: 2004年1期
    页码:  6-13
    摘要: 随着Internet的发展,Web页面数量的急剧增加,如何快速有效地获取信息变得越来越重要.一类Web页面往往包含着多个信息单元,它们在展现上排列紧凑、风格相似,在HTML语法上具有类似的模...
  • 作者: 秦文 苑春法
    刊名: 中文信息学报
    发表期刊: 2004年1期
    页码:  14-19
    摘要: 未登录词识别是汉语分词处理中的一个难点.在大规模中文文本的自动分词处理中,未登录词是造成分词错识误的一个重要原因.本文首先把未登录词识别问题看成一种分类问题.即分词程序处理后产生的分词碎片分...
  • 作者: 侯敏 刘海涛 安娜
    刊名: 中文信息学报
    发表期刊: 2004年1期
    页码:  20-25,41
    摘要: 熟语是自然语言中普遍存在的语言现象.本文分析了国内现有语料库对熟语的标注方式,发现这种方式对语料库的进一步加工是有问题的.为了在语料库标注阶段把熟语问题处理好,本文从信息处理的角度将熟语中的...
  • 作者: 代六玲 陈肇雄 黄河燕
    刊名: 中文信息学报
    发表期刊: 2004年1期
    页码:  26-32
    摘要: 本文比较研究了在中文文本分类中特征选取方法对分类效果的影响.考察了文档频率DF、信息增益IG、互信息MI、χ2分布CHI四种不同的特征选取方法.采用支持向量机(SVM)和KNN两种不同的分类...
  • 作者: 胡运发 陶晓鹏
    刊名: 中文信息学报
    发表期刊: 2004年1期
    页码:  33-41
    摘要: 基于不定长单词的压缩模型的压缩效率高于基于字符的压缩模型,但是它的最优符号集的寻找算法是NP完全问题,本文提出了一种基于贪心算法的计算最小汉字平均熵的方法,发现一个局部最优的单词表.这种方法...
  • 作者: 卢军 吴科 牛小飞 石冰
    刊名: 中文信息学报
    发表期刊: 2004年1期
    页码:  42-47
    摘要: 在信息检索的向量空间模型中,文本被形式化表示为由词语权重组成的向量.因此如何让这种向量尽量准确的有效的表示出文本内容一直是该模型中的基础性问题.在这篇论文中,我们提出了一种基于文本集密度的特...
  • 作者: 李飞 王兴义 郑家恒
    刊名: 中文信息学报
    发表期刊: 2004年1期
    页码:  48-54
    摘要: 模式匹配是信息抽取系统通常使用的方法,如何生成信息抽取模式就成为信息抽取的关键问题.由于手工编写模式的代价太大,本文尝试采用聚类方法自动生成针对中文文本的信息抽取模式.通过计算模式实例间的相...
  • 作者: 杜利民 程洁
    刊名: 中文信息学报
    发表期刊: 2004年1期
    页码:  55-61
    摘要: EBMT系统是一种基于语料库的机器翻译方法,其主要思想是通过类比原理进行翻译.如何从语料库中提取出一个实用的翻译词典进行系统的辅助翻译已经越来越多的引起关注.本文探讨了如何结合阈值和关联度提...
  • 作者: 丁晓青 刘长松 卜飞宇
    刊名: 中文信息学报
    发表期刊: 2004年1期
    页码:  62-69
    摘要: 本文针对名片OCR系统的要求,提出了一种新的根据图像扫描时产生的黑色边缘来检测灰度名片图像倾斜角度的方法.该方法先检测出名片的四条边缘拟合直线,由四条边缘拟合直线的倾斜角度来确定名片图像倾斜...
  • 作者: 刘文举 张翼燕 徐波
    刊名: 中文信息学报
    发表期刊: 2004年1期
    页码:  70-77
    摘要: 本文主要研究了分段模型(以参数轨迹模型为例)在解码假设检验中的应用.分段模型与传统的HMM相比,具有更加精确的建模能力.多年来人们一直致力于研究它对语音识别性能的提高,而忽视了其它方面的应用...
  • 作者: 刘文举 左国玉 阮晓钢
    刊名: 中文信息学报
    发表期刊: 2004年1期
    页码:  78-84
    摘要: 声音转换技术可以将一个人的语音模式转换为与其特性不同的另一个人语音模式,使转换语音保持源说话人原有语音信息内容不变,而具有目标说话人的声音特点.本文研究了由遗传算法训练的RBF神经网络捕获说...
  • 作者: 姚天顺 朱靖波 李珩
    刊名: 中文信息学报
    发表期刊: 2004年2期
    页码:  1-7
    摘要: 基于SVM(support vector machine)理论的分类算法,由于其完善的理论基础和良好的实验结果,目前已逐渐引起国内外研究者的关注.和其他分类算法相比,基于结构风险最小化原则的...
  • 作者: 张敏 金奕江 马少平
    刊名: 中文信息学报
    发表期刊: 2004年2期
    页码:  8-14
    摘要: 在Internet中,由于海量数据的多样性,在分布式数据集合上进行有效的检索就成为Web信息检索的一种必要方式.由此,引出多个检索结果的融合问题.对不同检索结果的相似度评分可能完全不可比的情...
  • 作者: 姚天顺 孙连恒 杨莹
    刊名: 中文信息学报
    发表期刊: 2004年2期
    页码:  15-22
    摘要: 在机器翻译研究领域中,评测工作发挥着重要的作用,它不仅仅是简单地对各个系统输出结果进行比较,它还对关键技术的发展起到了促进作用.译文质量的评测工作长期以来一直以人工的方式进行.随着机器翻译研...
  • 作者: 孙乐 孙玉芳 张俊林 曲为民
    刊名: 中文信息学报
    发表期刊: 2004年2期
    页码:  23-29,43
    摘要: 最近几年提出的语言模型检索系统将语音识别领域的语言模型技术引入信息检索领域并改善了检索系统的性能,但是其隐含的词汇间相互独立的假设并不符合实际情况.尽管统计翻译模型考虑了词汇间的同义词因素,...
  • 作者: 郑家恒 钱揖丽
    刊名: 中文信息学报
    发表期刊: 2004年2期
    页码:  30-35
    摘要: 兼类词的词类排歧是汉语语料词性标注中的难点问题,它严重影响语料的词性标注质量.针对这一难点问题,本文提出了一种兼类词词性标注的自动校对方法.它利用数据挖掘的方法从正确标注的训练语料中挖掘获取...
  • 作者: 周曦 戴蓓倩 李辉 陈雁翔
    刊名: 中文信息学报
    发表期刊: 2004年2期
    页码:  36-43
    摘要: 本文建立了一个基于对话语音的与文本无关的说话人确认系统,它和传统的与文本无关的说话人确认系统的关键不同在于,训练及测试语音不再只包含一个人而都是对话语音,因此需要分割出属于不同说话人的语音段...
  • 作者: 吴志勇 蔡莲红
    刊名: 中文信息学报
    发表期刊: 2004年2期
    页码:  44-50
    摘要: 基于大规模语音数据库的文语转换系统(Text-to-Speech, TTS)中,如何选取合适的语音基元是提高合成语音自然度的重要因素.本文研究了连续语流中的韵律关联现象,提出了包含韵律关联参...
  • 作者: 孙羽菲 张玉志 陈艳
    刊名: 中文信息学报
    发表期刊: 2004年2期
    页码:  51-57
    摘要: 相似字识别的正确与否对整个识别系统的准确性和可用性都有着极大的影响.在实际应用中,我们发现相似汉字之间的误识存在不对称性,并对这种不对称现象的成因进行了细致的探讨和分析.基于这种不对称性,本...
  • 作者: 彭志威 赵洁 陈开渠
    刊名: 中文信息学报
    发表期刊: 2004年2期
    页码:  58-65
    摘要: 本文解决了中文字符串模糊匹配的两个主要问题:空间问题和时间问题.目前字符串模糊匹配的两个主要方法是位向量方法和过滤方法.由于汉字众多,应用位向量方法时,需要大量空间.对于某些内存很少的小型计...
  • 作者: 吴健 董治江 钟义信
    刊名: 中文信息学报
    发表期刊: 2004年2期
    页码:  66-72
    摘要: 基于ISO/ IEC 10646和UNICODE国际标准,用传统的字体技术(如TrueType)来实现少数民族文字处理所面临的一个"瓶颈"问题是:"变形显现字符"不存在确定的码位.这也是多年...
  • 作者: 朱巧明 李培峰 钱培德
    刊名: 中文信息学报
    发表期刊: 2004年2期
    页码:  73-79
    摘要: 汉字内码向ISO/ IEC 10646过渡是实现计算机用文字编码统一的必然趋势,但目前在一段时间内仍将存在多种汉字内码并存的情况,所以实现汉字内码的自动识别是保证汉字多内码并存的关键.本文主...
  • 作者: 王有志 赵敏 陈俊峰
    刊名: 中文信息学报
    发表期刊: 2004年2期
    页码:  80-85
    摘要: 在多年学习、使用、翻译与参与评审几种规范IT名词集的基础上,本文将系统分析方法用于对此类名词集的定名与评价.其基本方法,一是从名词集中拆分出基础要素--名词元;二是提出八项量化指标:印误率,...
  • 作者: 张振亚 王煦法 王进 陈恩红
    刊名: 中文信息学报
    发表期刊: 2004年3期
    页码:  1-8,60
    摘要: 随着网络信息的日益丰富和用户需求的提高,人们已经不能满足于仅仅在同一语种中进行检索,跨语言的信息检索(CLIR)因而受到人们越来越多的关注.为此,本文提出了一种新的基于语义的跨语言信息检索模...
  • 作者: 陈群秀 魏勇鹏
    刊名: 中文信息学报
    发表期刊: 2004年3期
    页码:  9-16
    摘要: 在日汉机器翻译系统由DOS移植到Windows环境后,针对进一步扩充资源和调试开发过程中遇到的词典管理不便、工具使用麻烦、翻译及编辑界面不友好、日志维护不完善等问题,我们开发了面向多语言的机...
  • 作者: 周茜 扈旻 赵明生
    刊名: 中文信息学报
    发表期刊: 2004年3期
    页码:  17-23
    摘要: 本文介绍和比较了八种用于文本分类的特征选择方法,其中把应用于二元分类器中的优势率改造成适用于多类问题的形式,并提出了一种新的类别区分词的特征选择方法,结合两种不同的分类方法:文本相似度方法和...
  • 作者: 崔桓 苗雪雷 蔡东风
    刊名: 中文信息学报
    发表期刊: 2004年3期
    页码:  24-31
    摘要: 问答系统(Question Answering System)能用准确、简洁的答案回答用户用自然语言提出的问题.目前多数问答系统利用大规模文本作为抽取答案的知识库,而网络上丰富的资源为问答系...
  • 作者: 刘根辉 李德华
    刊名: 中文信息学报
    发表期刊: 2004年3期
    页码:  32-38
    摘要: 在自然语言处理研究领域中,句法研究已经取得了可喜的进展,语义研究也日益受到重视.但要真正实现计算机理解自然语言的目标,还必须进一步深入开展语用分析研究,目前还很少有这方面的研究成果.语境是语...
  • 作者: 李颖 池毓焕
    刊名: 中文信息学报
    发表期刊: 2004年3期
    页码:  39-46
    摘要: 本文首先从计算语言学的角度对传统语义学和古典哲学进行了反思,提出了对偶性概念思想,并指出,区分两类对偶(黑氏对偶与非黑氏对偶)对自然语言处理中揭示概念之间关联性有重要意义;然后对两类对偶的内...

中文信息学报基本信息

刊名 中文信息学报 主编 孙茂松
曾用名
主办单位 中国中文信息学会 中国科学院软件研究所  主管单位 中国科学技术协会
出版周期 月刊 语种
chi
ISSN 1003-0077 CN 11-2325/N
邮编 100190 电子邮箱 cips@iscas.ac.cn
电话 010-62562916 网址 www.cipsc.org.cn
地址 北京海淀区中关村南四街4号

中文信息学报统计分析

被引趋势
(/次)
(/年)
学科分布
研究主题
推荐期刊