作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
文章用GOOGLE开源的Word2Vec工具把藏文文本《贤者喜宴》经过分词后的语料作为输入,将文本中的词映射到一个K维空间,利用词汇的上下文信息将词转变为词向量.Word2Vec工具再通过学习得到一个向量模型,每一个词都用一个独特的词向量来表示.训练文本数据构造一个词表,然后学习词的向量表示.词向量能够捕获许多语言的规律,从而得出词与词之间的距离即相似度.进一步通过高频词汇作为输入,通过训练即可输出与高频词汇距离最近的词汇,以高频词和与其相近的词汇作为重要信息去预测文本的大致语义.实验结果表明基于Word2Vec训练模型的准确率和召回率都很高.
推荐文章
基于word2vec和双向LSTM的情感分类深度模型
文本分类
情感分析
双向长短时记忆循环神经网络
词向量
社交网络
基于LDA和word2vec的英文作文跑题检测
作文跑题检测
向量空间模型
潜在狄利克雷分配
词语间语义关系
基于语义空间的藏文微博情感分析方法
藏语微博
情感分类
语义空间
文本聚类
语义簇
基于word2vec的数字图书馆本体构建技术研究
本体构建
领域本体
概念抽取
关系抽取
数字图书馆现状
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Word2Vec的藏文文本语义预测分析研究
来源期刊 西北民族大学学报(自然科学版) 学科
关键词 Word2Vec 藏文文本 语义 分析
年,卷(期) 2021,(1) 所属期刊栏目 信息技术|Information Technology
研究方向 页码范围 15-21
页数 7页 分类号 TP309.2
字数 语种 中文
DOI 10.3969/j.issn.1009-2102.2021.01.005
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (8)
共引文献  (63)
参考文献  (2)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(1)
  • 参考文献(0)
  • 二级参考文献(1)
2015(1)
  • 参考文献(0)
  • 二级参考文献(1)
2016(3)
  • 参考文献(1)
  • 二级参考文献(2)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Word2Vec
藏文文本
语义
分析
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
西北民族大学学报(自然科学版)
季刊
1009-2102
62-1188/N
大16开
兰州市西北新村1号
1980
chi
出版文献量(篇)
1696
总下载数(次)
3
总被引数(次)
5175
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导