基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着社会的飞速发展,新词语不断地在日常生活中涌现出来.搜集和整理这些新词语,是中文信息处理中的一个重要研究课题.本文提出了一种自动检测新词语的方法,通过大规模地分析从Internet上采集而来的网页,建立巨大的词和字串的集合,从中自动检测新词语,而后再根据构词规则对自动检测的结果进行进一步的过滤,最终抽取出采集语料中存在的新词语.根据该方法实现的系统,可以寻找不限长度和不限领域的新词语,目前正应用于<现代汉语新词语信息(电子)词典>的编纂,在实用中大大的减轻了人工查找新词语的负担.
推荐文章
新词语构词特点初探
新词语
多音节词
缩略语
构词能力
复合式构词
关于新词语的认识
新词语
认识
网络新词语的构成形式及其成因
网络新词语
网络文化
构成形式
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向Internet的中文新词语检测
来源期刊 中文信息学报 学科 工学
关键词 计算机应用 中文信息处理 新词语 自动检测
年,卷(期) 2004,(6) 所属期刊栏目
研究方向 页码范围 1-9
页数 9页 分类号 TP391
字数 6220字 语种 中文
DOI 10.3969/j.issn.1003-0077.2004.06.001
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 于浩 7 335 5.0 7.0
2 孟遥 4 177 3.0 4.0
3 邹纲 中科院计算技术研究所数字化实验室 1 144 1.0 1.0
4 刘洋 中科院计算技术研究所数字化实验室 1 144 1.0 1.0
5 刘群 中科院计算技术研究所数字化实验室 1 144 1.0 1.0
6 西野文人 烟台师范学院中文系 1 144 1.0 1.0
7 亢世勇 1 144 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (19)
共引文献  (115)
参考文献  (7)
节点文献
引证文献  (144)
同被引文献  (144)
二级引证文献  (586)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(2)
  • 参考文献(1)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(2)
  • 参考文献(1)
  • 二级参考文献(1)
1999(3)
  • 参考文献(0)
  • 二级参考文献(3)
2000(2)
  • 参考文献(1)
  • 二级参考文献(1)
2001(2)
  • 参考文献(2)
  • 二级参考文献(0)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(2)
  • 参考文献(0)
  • 二级参考文献(2)
2016(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2005(2)
  • 引证文献(2)
  • 二级引证文献(0)
2006(8)
  • 引证文献(6)
  • 二级引证文献(2)
2007(24)
  • 引证文献(13)
  • 二级引证文献(11)
2008(39)
  • 引证文献(12)
  • 二级引证文献(27)
2009(40)
  • 引证文献(12)
  • 二级引证文献(28)
2010(26)
  • 引证文献(9)
  • 二级引证文献(17)
2011(43)
  • 引证文献(9)
  • 二级引证文献(34)
2012(52)
  • 引证文献(10)
  • 二级引证文献(42)
2013(47)
  • 引证文献(8)
  • 二级引证文献(39)
2014(78)
  • 引证文献(16)
  • 二级引证文献(62)
2015(79)
  • 引证文献(10)
  • 二级引证文献(69)
2016(67)
  • 引证文献(8)
  • 二级引证文献(59)
2017(75)
  • 引证文献(13)
  • 二级引证文献(62)
2018(80)
  • 引证文献(14)
  • 二级引证文献(66)
2019(53)
  • 引证文献(2)
  • 二级引证文献(51)
2020(17)
  • 引证文献(0)
  • 二级引证文献(17)
研究主题发展历程
节点文献
计算机应用
中文信息处理
新词语
自动检测
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中文信息学报
月刊
1003-0077
11-2325/N
16开
北京海淀区中关村南四街4号
1986
chi
出版文献量(篇)
2723
总下载数(次)
5
总被引数(次)
45413
论文1v1指导