基于兴趣模型的WEB信息预测采集过滤方法
外文标题 | Forecast and Filter Method for Web Page Gathering Based on Interested Model |
文献类型 | 期刊 |
作者 | 李振星[1];徐泽平[2];唐卫清[3];唐荣锡[4] |
机构 | [1]北京航空航天大学机械工程及自动化学院,中国科学院计算所,中国科学院计算所,北京航空航天大学机械工程及自动化学院 北京100083,北京100080,北京100080,北京100083 [2]北京航空航天大学机械工程及自动化学院,中国科学院计算所,中国科学院计算所,北京航空航天大学机械工程及自动化学院 北京100083,北京100080,北京100080,北京100083 [3]北京航空航天大学机械工程及自动化学院,中国科学院计算所,中国科学院计算所,北京航空航天大学机械工程及自动化学院 北京100083,北京100080,北京100080,北京100083 [4]北京航空航天大学机械工程及自动化学院,中国科学院计算所,中国科学院计算所,北京航空航天大学机械工程及自动化学院 北京100083,北京100080,北京100080,北京100083 ↓ |
来源信息 | 年:2003卷:39期:5页码范围:3-5,16 |
期刊信息 | 计算机工程与应用ISSN:1002-8331 |
关键词 | 信息采集;兴趣模型;文本过滤 |
摘要 | Web网上海量信息急速膨胀使得有效定向采集相关信息检索成为网上信息查询一个日益重要的研究方向.该文提出一种基于用户兴趣模型的Web文本信息预测采集过滤方法.这种方法根据正反集文本过滤方法,设计出一种用户兴趣模型,并在对Web站点结构进行分析的基础上,通过对网页的相关度的预测来控制信息的采集.在保持定向采集精度的同时,缩短采集时间、减少存储、加快检索,节约了网络资源. |
收录情况 | PKU |
所属部门 | 机械工程及自动化学院 |
链接地址 | http://d.g.wanfangdata.com.cn/Periodical_jsjgcyyy200305002.aspx |
DOI | 10.3321/j.issn:1002-8331.2003.05.002 |
基金 | 国家技术创新项目; 中国技术创新网升级改造项目 |
全文
影响因子:
dc:title:基于兴趣模型的WEB信息预测采集过滤方法
dc:creator:李振星;徐泽平;唐卫清,等
dc:date: publishDate:2003-02-11
dc:type:期刊
dc:format: Media:计算机工程与应用
dc:identifier: LnterrelatedLiterature:计算机工程与应用.2003,39(5),3-5,16.
dc:identifier:DOI:10.3321/j.issn:1002-8331.2003.05.002
dc: identifier:ISBN:1002-8331