电商商品嵌入表示分类方法
龙柏1,曾宪宇1,李徵1,2,刘淇1*1. 中国科学技术大学计算机科学与技术学院大数据分析与应用安徽省重点实验室, 安徽 合肥 230000;2. 中国科学技术大学软件学院, 安徽 合肥 230000
收稿日期:
2017-05-17出版日期:
2018-06-20发布日期:
2017-05-17通讯作者:
刘淇(1986— ),男,山东临沂人,副教授,博士,主要研究方向为数据挖掘与知识发现、机器学习方法及其应用.E-mail: qiliuql@ustc.edu.cnE-mail:blong@ustc.edu.cn作者简介:
龙柏(1980— ),男,安徽桐城人,高级工程师,博士,主要研究方向为高性能计算,数据挖掘及其应用. E-mail: blong@ustc.edu.cn基金资助:
国家自然科学基金资助项目(No61403358,61672483,U1605251);中科院青年创新促进会会员专项基金资助项目(会员编号2014299)Item embedding classification method for E-commerce
LONG Bai1, ZENG Xianyu1, LI Zhi1,2, LIU Qi1*1. Anhui Province Key Laboratory of Big Data Analysis and Application, School of Computer Science and Technology, University of Science and Technology of China, Hefei 230000, Anhui, China;
2. School of Software Engineering, University of Science and Technology of China, Hefei 230000, Anhui, China
Received:
2017-05-17Online:
2018-06-20Published:
2017-05-17摘要/Abstract
摘要: 借鉴近些年来在自然语言处理领域卓有成效的一种词嵌入模型word2vec,提出两种商品嵌入表示模型item2vec和w-item2vec。提出的两种模型通过对用户在每次购买时对商品的比较和选择行为进行建模,将商品表示为一个低维空间的向量,该向量可以有效地对不同商品之间的关系和性质进行度量。应用这一性质,使用item2vec和w-item2vec得到的向量对商品进行分类,试验结果表明:在仅使用10%数据训练的基础上,w-item2vec对商品分类的准确率可以接近50%。两种模型分类准确性均显著优于其他模型。
PDF全文下载地址:
http://gxbwk.njournal.sdu.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=1732