基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
大规模未标注语料中蕴含了丰富的词汇信息,有助于提高中文分词词性标注模型效果.该文从未标注语料中抽取词汇的分布信息,表示为高维向量,进一步使用自动编码器神经网络,无监督地学习对高维向量的编码算法,最终得到可直接用于分词词性标注模型的低维特征表示.在宾州中文树库5.0数据集上的实验表明,所得到的词汇特征对分词词性标注模型效果有较大帮助,在词性标注上优于主成分分析与k均值聚类结合的无监督特征学习方法.
推荐文章
稀疏和标签约束半监督自动编码器的分类算法
分类
稀疏约束
标签约束
自动编码器
极限学习机
基于无监督学习的行人检测算法
行人检测
无监督
稀疏编码
非线性变换
非极大值抑制
基于循环自动编码器的间歇过程故障监测
算法
动态建模
神经网络
LSTM
过程监测
循环自动编码器
基于降噪自动编码器及其改进模型的微博情感分析
降噪自动编码器
微博
情感分析
深度学习
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于自动编码器的中文词汇特征无监督学习
来源期刊 中文信息学报 学科 工学
关键词 无监督特征学习 中文分词 词性标注
年,卷(期) 2013,(5) 所属期刊栏目
研究方向 页码范围 1-7,92
页数 8页 分类号 TP391
字数 7232字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 周昌乐 厦门大学信息科学与技术学院 148 1475 22.0 30.0
2 张开旭 厦门大学信息科学与技术学院 1 37 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (37)
同被引文献  (83)
二级引证文献  (287)
2013(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(3)
  • 引证文献(3)
  • 二级引证文献(0)
2015(15)
  • 引证文献(6)
  • 二级引证文献(9)
2016(33)
  • 引证文献(6)
  • 二级引证文献(27)
2017(65)
  • 引证文献(7)
  • 二级引证文献(58)
2018(86)
  • 引证文献(11)
  • 二级引证文献(75)
2019(101)
  • 引证文献(4)
  • 二级引证文献(97)
2020(21)
  • 引证文献(0)
  • 二级引证文献(21)
研究主题发展历程
节点文献
无监督特征学习
中文分词
词性标注
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中文信息学报
月刊
1003-0077
11-2325/N
16开
北京海淀区中关村南四街4号
1986
chi
出版文献量(篇)
2723
总下载数(次)
5
总被引数(次)
45413
论文1v1指导