用数据挖掘技术进行中文地址解构的新方法
外文标题 | A New Method to Extract Structure from Chinese Addresses Using Data Mining Technology |
文献类型 | 期刊 |
作者 | 李宝林[1];王秀峰[2];兰芸[3];段菲[4] |
机构 | [1]南开大学信息技术科学学院,南开大学信息技术科学学院,北京航空航天大学高等教育研究所,南开大学信息技术科学学院 天津300071,天津300071,北京100083,天津300071 [2]南开大学信息技术科学学院,南开大学信息技术科学学院,北京航空航天大学高等教育研究所,南开大学信息技术科学学院 天津300071,天津300071,北京100083,天津300071 [3]南开大学信息技术科学学院,南开大学信息技术科学学院,北京航空航天大学高等教育研究所,南开大学信息技术科学学院 天津300071,天津300071,北京100083,天津300071 [4]南开大学信息技术科学学院,南开大学信息技术科学学院,北京航空航天大学高等教育研究所,南开大学信息技术科学学院 天津300071,天津300071,北京100083,天津300071 ↓ |
来源信息 | 年:2003卷:39期:13页码范围:72-74,87 |
期刊信息 | 计算机工程与应用ISSN:1002-8331 |
关键词 | 文本地址;地址解构;数据挖掘;序贯规则;数字查找树 |
摘要 | 从数据挖掘的角度对中文地址解构规则的获取与应用进行研究.该文提出了一种高效自动获取地址解构规则的方法:首先利用文本挖掘技术从训练数据集中挖掘出候选规则,然后生成最终的强规则,同时构建地址元素特征词典.最后,根据获取的知识进行地址解析,提取文本地址组成元素.试验结果证实了该方法的可行性. |
收录情况 | PKU |
所属部门 | 人文社会科学学院 |
链接地址 | http://d.g.wanfangdata.com.cn/Periodical_jsjgcyyy200313023.aspx |
DOI | 10.3321/j.issn:1002-8331.2003.13.023 |
基金 | 天津市21世纪青年科学基金 |
全文
影响因子:
dc:title:用数据挖掘技术进行中文地址解构的新方法
dc:creator:李宝林;王秀峰;兰芸,等
dc:date: publishDate:2003-05-01
dc:type:期刊
dc:format: Media:计算机工程与应用
dc:identifier: LnterrelatedLiterature:计算机工程与应用.2003,39(13),72-74,87.
dc:identifier:DOI:10.3321/j.issn:1002-8331.2003.13.023
dc: identifier:ISBN:1002-8331