钛学术
文献服务平台
学术出版新技术应用与公共服务实验室出品
首页
论文降重
免费查重
学术期刊
学术导航
任务中心
论文润色
登录
文献导航
学科分类
>
综合
工业技术
科教文艺
医药卫生
基础科学
经济财经
社会科学
农业科学
哲学政法
社会科学II
哲学与人文科学
社会科学I
经济与管理科学
工程科技I
工程科技II
医药卫生科技
信息科技
农业科技
学科分类
>
综合
工业技术
科教文艺
医药卫生
基础科学
经济财经
社会科学
农业科学
哲学政法
社会科学II
哲学与人文科学
社会科学I
经济与管理科学
工程科技I
工程科技II
医药卫生科技
信息科技
农业科技
数据库索引
>
cscd
ei
jst
aj
sa
ca
cstpcd
cssci
sci
cpku
cscd
ei
jst
aj
sa
ca
cstpcd
cssci
sci
cpku
cscd
ei
jst
aj
sa
ca
cstpcd
cssci
sci
cpku
默认
篇关摘
篇名
关键词
摘要
全文
作者
作者单位
基金
分类号
搜索文章
搜索思路
钛学术文献服务平台
\
学术期刊
\
工业技术期刊
\
无线电电子学与电信技术期刊
\
计算机与数字工程期刊
\
一种基于文本样式的Web主题信息提取方法研究
一种基于文本样式的Web主题信息提取方法研究
作者:
李佩
谢刚
顾韵华
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取
文本样式
主题提取
算法
摘要:
考虑Web页面表现形式对主题相关度的影响,提出了一个基于文本样式的Web主题提取算法.该算法解析Web页面中的文本样式,根据不同的文本样式来计算文本的重要度,选取重要度较高的文本作为该页面的主题.算法无须对页面进行复杂的结构分析,也避免了模板需要人工手动配置或训练的繁琐问题,具有较强的通用性.通过对十大类网站的一百个网页的测试,结果表明该算法具有较高的准确度.
暂无资源
收藏
引用
分享
推荐文章
一种基于主题的Web文本聚类算法
HTBC算法
Web文本聚类
主题
搜索引擎
互信息
基于C#的SWF文本信息提取方法研究
信息提取
资源检索
SWF
网络学习
一种垂直页面分割与信息提取方法的研究
页面分割
信息获取
垂直网站
内容聚集度
分割标签
前缀匹配
基于DOM的中文人物WEB信息提取
信息提取
文档对象模型
影响因子
中文人物
内容分析
文献信息
引文网络
相关学者/机构
相关基金
期刊文献
内容分析
关键词云
关键词热度
相关文献总数
(/次)
(/年)
文献信息
篇名
一种基于文本样式的Web主题信息提取方法研究
来源期刊
计算机与数字工程
学科
工学
关键词
文本样式
主题提取
算法
年,卷(期)
2009,(11)
所属期刊栏目
算法与分析
研究方向
页码范围
17-20,176
页数
5页
分类号
TP393
字数
4438字
语种
中文
DOI
10.3969/j.issn.1672-9722.2009.11.006
五维指标
作者信息
序号
姓名
单位
发文数
被引次数
H指数
G指数
1
顾韵华
南京信息工程大学计算机与软件学院
49
309
9.0
15.0
2
李佩
南京信息工程大学计算机与软件学院
3
26
2.0
3.0
3
谢刚
南京信息工程大学计算机与软件学院
1
1
1.0
1.0
传播情况
被引次数趋势
(/次)
(/年)
引文网络
引文网络
二级参考文献
(14)
共引文献
(135)
参考文献
(5)
节点文献
引证文献
(1)
同被引文献
(0)
二级引证文献
(0)
1999(2)
参考文献(0)
二级参考文献(2)
2000(2)
参考文献(1)
二级参考文献(1)
2002(1)
参考文献(0)
二级参考文献(1)
2004(5)
参考文献(1)
二级参考文献(4)
2005(3)
参考文献(1)
二级参考文献(2)
2006(1)
参考文献(0)
二级参考文献(1)
2007(3)
参考文献(0)
二级参考文献(3)
2008(1)
参考文献(1)
二级参考文献(0)
2009(1)
参考文献(1)
二级参考文献(0)
2009(1)
参考文献(1)
二级参考文献(0)
引证文献(0)
二级引证文献(0)
2015(1)
引证文献(1)
二级引证文献(0)
研究主题发展历程
节点文献
文本样式
主题提取
算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机与数字工程
主办单位:
中国船舶重工集团公司第七0九研究所
出版周期:
月刊
ISSN:
1672-9722
CN:
42-1372/TP
开本:
大16开
出版地:
武汉市东湖新技术开发区凤凰产业园藏龙北路1号
邮发代号:
创刊时间:
1973
语种:
chi
出版文献量(篇)
9945
总下载数(次)
28
总被引数(次)
47579
期刊文献
相关文献
1.
一种基于主题的Web文本聚类算法
2.
基于C#的SWF文本信息提取方法研究
3.
一种垂直页面分割与信息提取方法的研究
4.
基于DOM的中文人物WEB信息提取
5.
一种基于特征符号的网页主题信息抽取方法
6.
一种基于Web文本聚类的用户兴趣发现模型的研究
7.
基于模板的Web信息自动提取方法
8.
Web元数据信息提取技术的研究
9.
一种基于PCA的组合特征提取文本分类方法
10.
一种基于反向文本频率互信息的文本挖掘算法研究
11.
基于向量空间模型的多主题Web文本分类方法
12.
基于HTML树和模板的文献信息提取方法研究
13.
智能WEB信息提取系统的研究和设计
14.
粗集理论在Web信息提取中的应用
15.
一种改进的KNN Web文本分类方法
推荐文献
钛学术
文献服务平台
学术出版新技术应用与公共服务实验室出品
首页
论文降重
免费查重
学术期刊
学术导航
任务中心
论文润色
登录
根据相关规定,获取原文需跳转至原文服务方进行注册认证身份信息
完成下面三个步骤操作后即可获取文献,阅读后请
点击下方页面【继续获取】按钮
钛学术
文献服务平台
学术出版新技术应用与公共服务实验室出品
原文合作方
继续获取
获取文献流程
1.访问原文合作方请等待几秒系统会自动跳转至登录页,首次访问请先注册账号,填写基本信息后,点击【注册】
2.注册后进行实名认证,实名认证成功后点击【返回】
3.检查邮箱地址是否正确,若错误或未填写请填写正确邮箱地址,点击【确认支付】完成获取,文献将在1小时内发送至您的邮箱
*若已注册过原文合作方账号的用户,可跳过上述操作,直接登录后获取原文即可
点击
【获取原文】
按钮,跳转至合作网站。
首次获取需要在合作网站
进行注册。
注册并实名认证,认证后点击
【返回】按钮。
确认邮箱信息,点击
【确认支付】
, 订单将在一小时内发送至您的邮箱。
*
若已经注册过合作网站账号,请忽略第二、三步,直接登录即可。
期刊分类
期刊(年)
期刊(期)
期刊推荐
一般工业技术
交通运输
军事科技
冶金工业
动力工程
化学工业
原子能技术
大学学报
建筑科学
无线电电子学与电信技术
机械与仪表工业
水利工程
环境科学与安全科学
电工技术
石油与天然气工业
矿业工程
自动化技术与计算机技术
航空航天
轻工业与手工业
金属学与金属工艺
计算机与数字工程2022
计算机与数字工程2021
计算机与数字工程2020
计算机与数字工程2019
计算机与数字工程2018
计算机与数字工程2017
计算机与数字工程2016
计算机与数字工程2015
计算机与数字工程2014
计算机与数字工程2013
计算机与数字工程2012
计算机与数字工程2011
计算机与数字工程2010
计算机与数字工程2009
计算机与数字工程2008
计算机与数字工程2007
计算机与数字工程2006
计算机与数字工程2005
计算机与数字工程2004
计算机与数字工程2003
计算机与数字工程2002
计算机与数字工程2001
计算机与数字工程2009年第9期
计算机与数字工程2009年第8期
计算机与数字工程2009年第7期
计算机与数字工程2009年第6期
计算机与数字工程2009年第5期
计算机与数字工程2009年第4期
计算机与数字工程2009年第3期
计算机与数字工程2009年第2期
计算机与数字工程2009年第12期
计算机与数字工程2009年第11期
计算机与数字工程2009年第10期
计算机与数字工程2009年第1期
关于我们
用户协议
隐私政策
知识产权保护
期刊导航
免费查重
论文知识
钛学术官网
按字母查找期刊:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他
联系合作 广告推广: shenyukuan@paperpass.com
京ICP备2021016839号
营业执照
版物经营许可证:新出发 京零 字第 朝220126号