基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
淘宝网每天产生千万级的用户输入文本(简称UGC),它们是无结构的,因此与结构化数据相比,更难通过语义分析技术进行信息挖掘。然而,UGC的无结构化,又使得其能够挖掘的信息是无限的。本文将讲述如何利用文本语义分析技术来挖掘有价值的信息,并介绍该技术在淘宝网的应用情况。
推荐文章
基于语义的文本特征加权分类算法
语义分析
降维
语义相关度
分类
基于语义依存分析的图网络文本分类模型
语义依存分析
词嵌入
语义图网络块
文本分类
基于语义角色标注的文本水印算法
文本水印
自然语言处理
语义角色标注
映射
基于语义倾向性的文本过滤研究
倾向性识别
文本过滤
语义
关联词
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 文本语义分析的实现及应用
来源期刊 程序员 学科 工学
关键词 语义分析 文本 应用 结构化数据 信息挖掘 淘宝网 技术 输入
年,卷(期) 2013,(7) 所属期刊栏目
研究方向 页码范围 105-109
页数 5页 分类号 TP391.12
字数 语种
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 郑波 1 0 0.0 0.0
2 胡其 1 0 0.0 0.0
3 林君 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2013(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
语义分析
文本
应用
结构化数据
信息挖掘
淘宝网
技术
输入
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
程序员
月刊
1672-3252
11-5038/G2
16开
北京市朝阳区广顺北大街33号院1号楼福码
2-665
2000
chi
出版文献量(篇)
10184
总下载数(次)
35
总被引数(次)
6420
论文1v1指导