删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

西安交通大学电子与信息工程学院导师教师师资介绍简介-钱 学明

本站小编 Free考研考试/2021-06-26

钱学明的个人主页空间 - 钱 学明基本信息
2004.9~2008.1在西安交通大学攻读博士学位
2006年获微软****
2008年3月获西安交通大学电信学院信息与通信工程系工学博士学位
2008.4月起任教于西安交通大学电信学院信息与通信工程系
2009年获西安交通大学优秀博士论文培育基金
2009年获西安交通大学优秀博士论文
2010年获陕西省优秀博士论文
2010年入选西安交通大学青年骨干教师(副教授)培养计划
2010年入选微软亚洲研究院“铸星计划”
2011年西安交通大学副教授
2012年入选西安交通大学青年骨干教师(教授)培养计划
2014年破格为教授
钱学明 教授、博士、博导
CCF Senior member,IEEE member, ACMmember
中国图像图像图形学会专委会委员
计算机学会多媒体专委会委员
国家自然科学基金委通信评委, 科技部重点研发计划评委,陕西省科技奖评委,
陕西省创业创新大赛评委,陕西省科技项目评委,云南省创业创新大赛评委
担任VIE08国际会议分会主席, ICME, ICIMCS, MMM等国际会议技术委员会成员
担任ICME2014,MMM2014,MMM2015, Speical SessionOrganizers/Chairs

研究方向: 社会媒体大数据挖掘与检索,
基于社会媒体的用户个性化服务推荐;

图像视频内容理解与检索
人工智能与计算机视觉

更多信息参见: http://www.smiles-xjtu.com/






主要科研项目

----------------------2020----------------------------
上海箱云物流科技有限公司,基于图像识别的智能集装箱验箱,负责人,2020.7.1-2020.10.31.
西安深蓝电工技术有限公司,基于图像分析的桥梁振幅观测系统研制,负责人,2020.7.1-2020.10.31.
XX研究所,基于智能硬件的SAR目标检测,参与,2020.7.1-2020.10.31.
----------------------2019----------------------------
山东新北洋,基于人工智能的商品识别,负责人,2019.5.20-2019.12.31.
XXXXX,XXX智能核心技术及其发展路径研究,负责人,2019.10.1-2020.12.31.
艾耕,基于AI的自然语言处理技术,负责人,2019.12.20-2020.12.31.
亿阳信通,基于AI的无线网优服务,负责人,2019.12.20-2020.12.31.
杭州柯西公司,基于视觉的垃圾分类方法,负责人,2018.5-2018.10.
----------------------2018----------------------------
XXXXX,XXX智能技术发展研究,负责人,2018.4.15-2018.10.31.
Microsoft Research Asia,Food recognition and health management for standardized canteen,负责人,2018.12-2019.12.
西安普睿泰信息科技有限公司,大数据服务推荐项目(网络爬虫、文本分析), 负责人,2018.6.1-2018.10.
腾讯公司,新闻配图(基于学习的图文匹配),负责人,2018.6.1-2019.5.
陕西西驱电子科技有限公司,图像识别数据处理系统(基于AI的智慧管廊运维),负责人,2018.5-2018.10.
XX,基于视觉的智慧工地安全预警,负责人,2018.5-2018.10.
----------------------2017----------------------------
国家自然科学基金面上项目,基于对象的监控视频检索方法研究, 负责人,2018.1-2021.12.No.**
国家自然科学基金重点项目,面向复杂查询的异质媒体搜索, 子课题负责人,2018.1-2022.12.No.**
热工院合作项目,智能化颗粒物分析装置大数据分析软件设计与开发,负责人,2017.9-2017.12.。
----------------------2016----------------------------
腾讯公司,“新闻、视频封面生成方法研究”,负责人,2016.11,
宇航动力学重点实验室,“基于光学图像目标卫星三维重构方法研究”,负责人,,2016.3~2016.12
亿阳信通集团股份有限公司,“以图搜图算法”,负责人,016.3~2016.12
Microsoft Research Asia,Learning salient feature to enhance the mobile image retrieval负责人,2016.3-2016.12.
中美计算机科学研究中心, 社会网络媒体分析与检索,负责人,2016.3-2016.12.
广东省科技厅,基于媒体大数据的景点及位置相关服务推荐,负责人,2016.1-2016.12.
中电54所,基于无人机的环境重构,参与人,
中车集团,音视频编码、调制、解调器,参与人
中车集团,液晶屏控制器,参与人
----------------------2015及其之前----------------------------
2011太空信息协同创新中心, 基于多观测站空间目标序列融合的空间目标描述和识别方法研究负责人,2013.12-2014.12
微软亚洲研究院, Schedule Travel Life by Exploring Spectrums of Social User and City Services, 负责人,2013.12-2015.12
国家自然科学基金面上项目,基于移动互联网的网络图标广告推荐方法研究,负责人,2012.1-2015.12.
微软亚洲研究院,Mobile Sensing based Travel Guide and Travelogue Generation,负责人,2011.5-2014.5.
国家自然科学基金青年项目,一种统一的具有可分级的体育视频内容理解方法研究,负责人,2010.1-2012.12.
西安交通大学自然科学基金,图象视频内容理解与分类方法研究,负责人,2010.1-2011.12.
863计划项目,基于可分级和特征空间聚类的网络环境下视频媒体复制检测、定位和追踪技术,副组长,2009.1-2010.12.





发明专利
已授权专利
[1].钱学明,韩振,张宇奇,邹屹洋,侯兴松,一种卷积神经网络特征融合的多尺度快速人脸检测方法,申 请 号:20**,申 请 日:2018-03-30
[2].钱学明,周澎,一种以图快速检索景点的方法及导游系统,8.4,授权2019年11月29日
[3].钱学明*,杨锡玉,从多相关图片中挖掘显著特征实现图像检索的方法,8.6,申请日期2015-7-8,授权日期:2018-04-17
[4].钱学明*,赵一斯,一种基于区域挖掘和空间编码的图像位置估计方法,.9,申请日期2015-4-24,授权日期2018-3-2
[5] 蒋舒卉,钱学明,李婧等, 一种可视化的网络用户多媒体管理方法,ZL.4.4.






发表论文
2020录用
Yuxia Wu, Ke Li, Guoshuai Zhao, Xueming Qian*, “Personalized Long- and Short-term Preference Learning for Next POI Recommendation,”IEEE Trans.Knowledge and Data Engineering,(2020),DOI:10.1109/TKDE.2020.**
Guoshuai Zhao, Zhidan Liu, Yulu Chao, Xueming Qian*, “CAPER: Context-Aware Personalized Emoji Recommendation,”IEEE Trans.Knowledge and Data Engineering,(2020),DOI:10.1109/TKDE.2020.**
Guoshuai Zhao, Peiliang Lou, Xueming Qian*, Xingsong Hou, “Personalized Location Recommendation by Fusing Sentimental and Spatial Context,”Knowledge-Based Systems,196: 105849(2020).
Xueming Qian*, Yuxia Wu, Mingdi Li, Yayun Ren, Shuhui Jiang, Zechao Li,“LAST:Location-Appearance-Semantic-Temporal Clustering based POI Summarization,”IEEE Trans.Multimedia,xx(xx):xx-xx(2020).DOI: 10.1109/TMM.2020.**
Ke Li, Yuxia Wu, Yao Xue, Xueming Qian*, “Viewpoint Recommendation Based on Object Oriented 3D Scene Reconstruction,”IEEE Trans.Multimedia,xx(xx):xx-xx(2020).
Yuanzhi Liang, Xueming Qian*, Li Zhu, "Towards Better Railway Service: Passengers Counting in Railway Compartment"IEEE Trans.Circuits and Systems forVideo Technology,xx(xx):xx-xx(2020).
Hongjia Zhai, Shenqi Lai, Hanyang Jin, Xueming Qian*, Tao Mei,"Deep Transfer Hashing for Image Retrieval"IEEE Trans.Circuits and Systems forVideo Technology,xx(xx):xx-xx(2020).DOI: 10.1109/TCSVT.2020.**.
Luo Wang, Xueming Qian*, Yuting Zhang, Jialie Shen, Xiaochun Cao,Enhancing Sketch-based Image Retrieval by CNN Semantic Re-ranking,IEEE Trans. Cybern. 50(7): 3330-3342 (2020)
Xuxiao Bu, Jihua Zhu, Xueming Qian,Personalized product search based on user transaction history and Hypergraph learning, Multimedia Tools and Applications, 2020.
Bu Xuxiao Li, Bingfeng; Wang, Yaxiong; Zhu, Jihua; Qian, Xueming; Zhao, Marco, Semantic Gated Network for Efficient News Representation, ICMR, 2020: 251-255.

2019录用
Luo Wang, Xueming Qian*, Xingjun Zhang, Xiongsong Hou,Sketch-based Image Retrieval with Multi-clustering Re-ranking, IEEE Trans.Circuits and Systems forVideo Technology, 2020, vol.xx, no.xx, pp.xx-xx. DOI:10.1109/TCSVT.2019.**
Cheng Kang, Li Zhu, Xueming Qian*, Junwei Han, Meng Wang, Yuan Yan Tang, Geometry and Topology Preserving Hashing for SIFT Feature, IEEE Trans. Multimedia,vol.26, no.6, pp.1563-1576,2019.
Xiaoxia Shi, Xueming Qian*, Exploring Spatial and Channel Contribution for Object based Image Retrieval, Knowledge-Based Systems, 164: 107-121(2019).
Xueming Qian*, Mingdi Li, Yayun Ren, Shuhui Jiang, Social Media based Event Summarization by User-Text-Image Co-clustering, Knowledge-Based Systems, 164:107-121(2019).
Guoshuai Zhao, Xiaojiang Lei, Xueming Qian*,TaoMei:Exploring Users’Internal Influence from Reviews for Social Recommendation.IEEE Trans. Multimedia, 21(3):771-781(2019).
G.Zhao, H.Fu, R.Song, T.Sakai, Z.Chen, X.Xie,Xueming Qian*,Personalized Reason Generation for Explainable Song Recommendation.ACM TIST, 10(4):41:1-41:21(2019)
Yaxiong Wang, Lin Ma, Xueming Qian, Hao Yang, Jing Lu, Biao Li, Xin Fan,Position Focused Attention Network for Image-Text Matching, IJCAI2019, pp.3792-3798.
Yuanzhi Liang,Yalong Bai,Wei Zhang,Xueming Qian,Li Zhu,Tao Mei:VrR-VG: Refocusing Visually-Relevant Relationships,ICCV 2019: 10402-10411.
Yuanzhi Liang,Yalong Bai,Wei Zhang,Xueming Qian,Li Zhu,Tao Mei: Rethinking Visual Relationships for High-level Image Understanding.CoRRabs/1902.00313(2019)
Yuxia Wu, Guoshuai Zhao, and Xueming Qian, Long- and Short-term Preference Learning for Next POI Recommendation,CIKM2019, pp.2301-2304.

2018录用
Yaxiong Wang,Li Zhu,Xueming Qian*,Junwei Han:Joint Hypergraph Learning for Tag-Based Image Retrieval.IEEE Trans. Image Processing27(9):4437-4451(2018).
Hanyu Wang,Ping Wang,Xueming Qian*:MPNET: An End-to-End Deep Neural Network for Object Detection in Surveillance Video.IEEE Access 6:30296-30308(2018).
Xueming Qian*,Cheng Li, Ke Lan, Xingsong Hou,Zhetao Li, Junwei Han:POI Summarization by Aesthetics Evaluation from Crowd Source Social Media.IEEE Trans. Image Processing27(3):1178-1189(2018).
Zan Chen,Xingsong Hou,Xueming Qian,Chen Gong:Efficient and Robust Image Coding and Transmission Based on Scrambled Block Compressive Sensing.IEEE Trans. Multimedia 20(7):1610-1621(2018).
Rong Quan,Junwei Han,Dingwen Zhang,Feiping Nie,Xueming Qian*,Xuelong Li:Unsupervised Salient Object Detection via Inferring From Imperfect Saliency Models.IEEE Trans. Multimedia 20(5):1101-1112(2018).
Fan Li,Fu Shuang,Ziyi Liu,Xueming Qian:A Cost-Constrained Video Quality Satisfaction Study on Mobile Devices.IEEE Trans. Multimedia 20(5):1154-1168(2018).
Guoshuai Zhao, Tianlei Liu, Xueming Qian*,Tao Hou, Huan Wang, Xingsong Hou,Zhetao Li:Location Recommendation for Enterprises by Multi-Source Urban Big Data Analysis.IEEE Trans. Services Computing,x(x):xx-xx(2018)online.
2017录用
Xueming Qian,Xiaoqiang Lu, Junwei Han,BoDu:On Combining Social Media and Spatial Technology for Personalized Recommendation.Proceedings of theIEEE105(10):1937-1952(2017).
Xueming Qian,Dan Lu,Yaxiong Wang, Li Zhu,YuanyanTang,Meng Wang:Image Re-ranking based on Topic Diversity.IEEE Trans. Image Processing26(8):3734-3747(2017)
Xueming Qian,Huan Wang,Yisi Zhao,Xingsong Hou,Richang Hong,Meng Wang,Yuan Yan Tang: Image Location Inference by Multisaliency Enhancement.IEEE Trans. Multimedia19(4):813-821(2017)
Guoshuai Zhao,Xueming Qian,Chen Kang: Service Rating Prediction by Exploring Social Mobile Users' Geographical Locations.IEEE Trans. Big Data3(1):67-78(2017)
YaoXue,Xueming Qian: VEHICLE DETECTION AND POSE ESTIMATION BY PROBABILISTIC REPRESENTATION.ICIP 2017, pp.3355-3359.
2016录用
Guoshuai Zhao, Xueming Qian*, Xiaojiang Lei, Tao, Mei, “Service Quality Evaluation by Exploring Social Users' Contextual Information,”IEEE Trans.Knowledge and Data Engineering,28(12):3382-3394(2016).
Xiaojiang Lei,Xueming Qian*, Guoshuai Zhao, “Rating Prediction based on Social Sentiment from Textual Reviews,”IEEE Trans.Multimedia, 2016, vol.18, no.9, pp.1910-1921.
Dan Lu,Xiaoxiao Liu, Xueming Qian*, “Tag based Image Search by Social Re-Ranking,”IEEE Trans.Multimedia, 2016, vol.18, no.8, pp.1628-1639.
Guoshuai Zhao, Xueming Qian*, Xing Xie, “User-Service Rating Prediction by Exploring Social Users’ Rating Behaviors,”IEEE Trans. Multimedia, 2016, vol.18, no.3,pp.496-506.入选2017年度ESI论文
Xueming Qian*, Xiaoxiao Liu, Xiang Ma, Dan Lu, Chengyang Xu, “What Is Happening in The Video? Annotate Video by Sentence,”IEEE Trans.Circuits and Systems forVideo Technology, 2016, vol.26, no.9, pp.1746-1757.
Xueming Qian*, Xianglong Tan, Yuting Zhang, Richang Hong, Meng Wang, “Enhancing Sketch-Based Image Retrieval by Re-ranking and Relevance Feedback ”,IEEE Trans. Image Processing, vol.25, no.1, 2016, pp.195-208.
Xiwen Yao, JunweiHan, Gong Cheng, Xueming Qian, Lei Guo, “Semantic Annotation of High-Resolution Satellite Images via Weakly Supervised Learning,”IEEE Trans. Geoscience and Remote Sensing, 2016, vol.54, no.6,pp.3660-3671.
Yuting Zhang, Xueming Qian, Xianglong Tan, Junwei Han, Yuan Yan Tang, “Sketch-based Image Retrieval by Salient Contour Reinforcement,”IEEE Trans. Multimedia, 2016, vol.18, no.8,pp.1604-1615.
Shuhui Jiang, Xueming Qian*, Yun Fu, Tao Mei, “Personalized Travel Sequence Recommendation on Multi-Source Big Social Media,”IEEE Trans. Big Data, 2016, vol.1, no.2,pp.43-56.

2015
Xueming Qian*, Yisi Zhao, andJunwei Han, “Image Location Estimation by Salient Region Matching,”IEEE Trans.Image Processing, vol.24, no.6, 2015, pp.4348-4358.
Yun Gu, Xueming Qian*, Qing Li, Meng Wang, Richang Hong, andQiTian, “Image Annotation by Latent Community Detection and Multi-Kernel Learning,”IEEE Trans.Image Processing,vol.24,no.11, 2015, pp.3450-3463.
Shuhui Jiang, Xueming Qian*, Jialie Shen, Yun Fu, andTao Mei, “Author Topic Model-Based Collaborative Filtering for Personalized POI Recommendations”, IEEE Trans. Multimedia, 2015, vol.17, no.6,pp.907-918.ESI 高引论文
Xueming Qian,Yao Xue, Yuan Yan Tang, Xingsong Hou, and Tao Mei,“Landmark Summarization with Diverse Viewpoints”, IEEE Trans.Circuits and Systems forVideo Technology,vol.25, no.11, 2015, pp.1857-1869.
Xiang Ma, Huansheng Song,andXueming Qian, “Robust Framework of Single-Frame FaceSuperresolution Across Head Pose, FacialExpression, and Illumination Variations,”IEEE Trans. Human-Machine Systems, 2015, vol.45, no.2,pp.238-250.
Xiyu Yang, Xueming Qian*, andYao Xue, “Scalable Mobile ImageRetrieval by Exploring Contextual Saliency,”IEEE Trans.Image Processing,vol.24, no.6, 2015, pp.1709-1721.
Xiyu Yang, Xueming Qian*, andTao Mei, “Learning Salient Visual Word for Scalable Mobile Image Retrieval,”Pattern Recognition, 2015, vol.48, no.10,pp.3093-3101.
Xingsong Hou,Min Han,Chen Gong,Xueming Qian:SAR complex image data compression based on quadtree and zerotree Coding in Discrete Wavelet Transform Domain: A Comparative Study.Neurocomputing148: 561-568 (2015).
MengWang,Chenyang Xu, Jianguo Jiang, Xueming Qian:Image Classification Based on Low-Rank Matrix Recovery and Naive Bayes Sparse Coding.Neurocomputing169: 110-118 (2015).
Jing Li, Xueming Qian*,Qing Li, Yisi Zhao, Liejun Wang, and Yuan Yan Tang,“Ming Near Duplicate Image Groups”, Multimedia Tools and Applications,vol.74, no.2,2015, pp.655-669.
Jing Li, Xueming Qian*,et al.,“Improved Image GPS Location Estimation by MiningSalient Features”, Signal Processing: Image Communication,vol.38, 2015, pp.141-150.


2014 发表
Xueming Qian,He Feng, Guoshuai Zhao, and Tao Mei,“Personalized Recommendation Combining User Interest and Social Circle”, IEEE Trans. Knowledge and Data Engineering, vol.26, no.7, 2014, pp.1487-1502. ESI 高引论文
Xueming Qian,Xian-Sheng Hua, Yuan Yan Tang,and Tao Mei,“Social Image Tagging with Diverse Semantics”,IEEE Trans. Cybernetics, vol.44, no.12, 2014, pp.2493-2508.
Xueming Qian,HuanWang,andXingsongHou, “Video Text Detection and Localization in Intra-Frames of H.264/AVC Compressed Video”, Multimedia Tools and Applications, vol. 70, no.3, pp.1487-1502, 2014.
Xueming Qian, D.Guo, Huan Wang, Guizhong Liu, and XingsongHou, “HWVP: Hierarchical Wavelet Packet Texture Descriptors and Their Applications in Scene Categorization and Semantic Concept Retrieval”,Multimedia Tools and Applications, vol.69, no.3, pp.897-920, 2014.
He Feng, and Xueming Qian*,“Mining User-Contributed Photos for Personalized Product Recommendation”, Neurocomputing, vol.129, 2014, pp.409-420. (ESI数据库收录)
Xingsong Hou, Lan Zhang, Chen Gong, Lin Xiao, Jingqiang Sun, Xueming Qian,“SAR image Bayesiancompressive sensing exploiting the interscale and intrascale dependencies in directional lifting wavelet transform domain”Neurocomputing, vol.133, 2014, pp.358-368.
X. Liu, X. Qian, et al., “Personalized Tag Recommendation for Flickr Users”, In Proc. ICME, 2014, pp.xx-yy.
X. Yang, L. Liu, X. Qian, et al, “Mobile Visual Search via Hierarchical Sparse Coding”, In Proc. ICME, 2014, pp.xx-yy.
J.Li, X. Qian, Q. Li, et al., “Ming Near Duplicate Image Groups”, Multimedia Tools and Applications, vol.xx, no.y, 2014, pp.xx-xx. .
X.Yang, X. Qian, “Spatial Verification for Scalable Mobile Image Retrieval”, ACM CIKM, vol.xx, no.y, 2014, pp.xx-xx. Accepted.


2013
X. Qian, H. Feng, G. Zhao, and T. Mei, “Personalized Recommendation Combining User Interest and Social Circle”, IEEE Trans. Knowledge and Data Engineering, vol.x, no.y, 2013, pp.xx-yy. Accepted
X. Qian, X. Hua, Y. Tang, and T. Mei, “Social Image Tagging with Diverse Semantics”, IEEE Trans. Cybernetics, vol.x, no.y, 2013, pp.xx-yy. Accepted
J. Li, X. Qian*, Y. Tang, L. Yang, and T. Mei, “GPS estimation for places of interest from social users’ uploaded photos”, IEEE Trans. Multimedia 2013.
X. Hou, Jing Yang, G. Jiang, and X. Qian*, “Sparse representation and compression of complex SAR images using directional lifting wavelet transform”, IEEE Trans.Geoscience and Remote Sensing, vol.51, no.1, 2013, pp.527-538.
X. Qian, Y. Tang, Z. Yan, and K., “ISABoost: A weak classifier inner structure adjusting based adaboost algorithm - ISABoost based application in scene categorization”, Neurocomputing, vol.103, 2013, pp.104-113.
X. Qian, X. Liu, C. Zheng, Y. Du, and X. Hou, “Tagging photos using users’ vocabularies”, Neurocomputing, vol.111, 2013, pp.144-153.
H. Feng, and X. Qian*, “Mining User-Contributed Photos for Personalized Product Recommendation”, Neurocomputing, accepted.
Y. Du, Feng Chen, Wenli Xu, and X. Qian*, “Video content categorization using the double decomposition”, Multimedia Tools and Applications, vol.66, no.3, 2013, pp.545-572.
L. Ke, Z. Xu, Z. Feng, and X. Qian. Proportion based robust optimization and team orienteering problem with interval data. European Journal of Operational Research,vol.2226,no.1,2013,pp.19-31.
X. Hou, L. Zhang, C. Gong, L. Xiao, J. Sun, X. Qian, “SAR image Bayesian compressive sensing exploiting the interscale and intrascale dependencies in directional lifting wavelet transform domain” Neurocomputing, accepted.
Q. Li, Y. Gu, and X. Qian*, “LCMKL: Latent-community and multi-kernel learning based image annotation”, ACM CIKM 2013.
H. Feng, and X. Qian*, “Recommendation via user’s personality and social contextual”, ACM CIKM 2013.
H. Feng, and X. Qian*, “Recommend Social Network Users Favorite Brands”, PCM 2013.
Y. Xue, X. Qian*, and B. Zhang, “Mobile image retrieval using multi-photos as query”, In Proc. ICME, 2013, pp.xx-yy.
S. Jiang, X. Qian*, Y.Xue, F. Li and X. Hou, “Generating Representative Images for Landmark by Discovering High Frequency Shooting Locations from Community-Contributed Photos”, In Proc. ICME, 2013, pp.xx-yy.
S. Jiang, X. Qian*, T. Mei, K. Lan, and L. Zhang, “Mobile multimedia travelogue generation by exploring geo-locations and image tags”, In Proc. ISCAS, 2013, pp.881-884.
J. Li, X. Qian*, Y. Tang, L. Yang, and C. Liu, “GPS estimation from users’ photos”, In Proc. MMM 2013, pp.118-129.
G. Zhao, X. Qian*, and H. Feng, “Personalized Recommendation by Exploring Social Users’ Behaviors”, In Proc. MMM 2014.

2012
X. Qian, X. Hou, Y. Tang, H. Wang, and Z. Li, “Hidden Conditional Random Fields based Soccer Video Events Detection”, IET Image Processing, vol.6, no.9, 2012, pp.1338-1347.
X. Qian, and H. Wang, “Video Text Detection and Localization in Intra-Frames of H.264/AVC Compressed Video”, Multimedia Tools and Applications, June 2012.
X. Qian, H. Wang, G. Liu, and X. Hou, “HWVP: Hierarchical Wavelet Packet Texture Descriptors and Their Applications in Scene Categorization and Semantic Concept Retrieval”, Multimedia Tools and Applications, May 2012.
X. Qian, and G. Liu, “An Effective GM/LM Based Video Error Concealment”, Signal Image and Video Processing, 2012, vol.6,no.1, pp.9-17.
X. Qian, H. Wang, G. Liu, and X. Hou, “HMM Based Soccer Video Event Detection Using Enhanced Mid-Level Semantic”, Multimedia Tools and Applications, vol.60, no.1, 2012,pp.233-255.
X. Qian, X. Hua, and X. Hou, “Tag Filtering based on Similar Compatible Principle”, In Proc. ICIP, 2012,pp. 2349-2352.
Y. Xue, and X. Qian, “Visual Summarization of Landmarks via Viewpoint Modeling”, In Proc. ICIP, 2012, pp.2873-2876.
蒋舒卉, 钱学明, “一种重要区域重采样的人脸检索方法”, 西安交通大学学报,2012.

2011
X. Qian, H. Wang, G. Liu, and X. Hou, “HMM Based Soccer Video Event Detection Using Enhanced Mid-Level Semantic”, Multimedia Tools and Applications, 2011. (online)
X. Qian, X. Hua, “Graph-Cut based Tag Enrichment”, in Proc. SIGIR 2011,pp.1111-1112.
X. Qian, X. Hua, P. Chen, and L. Ke, “PLBP: An Effective Local Binary Patterns Texture Descriptor with Pyramid Representation”, Pattern Recognition, 2011, vol.44, pp. 2502-2515.
Z. Li, G. Liu, X. Qian, D. Guo, and H. Jiang, “Effective and Efficient Video Text Extraction Using Key Text Points”, IET Image Processing, 2011, vol.5, no.8, pp.671-683.
X. Qian, Z. Yan, and K. Hang, “Boosted Scene Categorization Approach by Adjusting Inner Structures and Outer Weights of Weak Classifiers”, in Proc. MMM, 2011, pp.413-423.
2010
X. Qian, G.Liu, Z. Li, Z. Wang, and H. Wang “Highlight Events Detection in Soccer Video using HCRF”, in Proc. ICIMCS, 2010,pp.171-174.
X. Qian, and G.Liu, “An Effective GM/LM Based Video Error Concealment”, Signal Image and Video Processing, 2010.
H. Wang, X. Qian, and G.Liu, “Inter Mode Decision Based on Just Noticeable Difference Profile”, in Proc. ICIP 2010.
X. Qian, H. Wang, G.Liu, Z. Li, and Z. Wang, “Soccer Video Event Detection by Fusing Middle Level Visual Semantics of an Event Clip”, in Proc. PCM 2010.
X. Qian, Z. Yan, K, Hang, G.Liu, H. Wang, Z. Wang and Z. Li, “Scene Categorization Using Boosted Back-Propagation Neural Networks”, in Proc. PCM 2010.
Z. Wang, G.Liu, Y. Ma, X. Qian, and Y. Yang, “An Improved Fusion Method Based on Adaboost Algorithm for Semantic Concept Extraction”, in Proc. ICIMCS, 2010, pp.19-22.
Z. Wang, G.Liu, X. Qian, and D. Guo, “An Approach to the Compact and Efficient Visual Codebook Based on SIFT Descriptor”, in Proc. PCM 2010.
Z. Li, G. Liu, X. Qian, C. Wang, Y. Ma and Y. Yang, “A Video Text Detection Method based on Key Text Points”, PCM2010.
Z. Li, G.Liu, X. Qian, and C.Wang, “Scale and Rotation Invariant Gabor Texture Descriptor for texture Classification”, in Proc. VCIP2010.
王喆,刘贵忠,钱学明, “基于H.264/AVC压缩域信息的全局运动估计方法,” 电子学报, 2010.
2009
X. Qian, G. Liu, and H. Wang.Recovering Connected Error Region Based on Adaptive Error Concealment Order Determination. IEEE Trans. Multimedia, vol.11, no.4, pp.683-695, 2009.
X. Qian, G. Liu, D. Guo, Z. Li, Z. Wang, and H. Wang, “Object Categorization using Hierarchical Wavelet Packet Texture Descriptors,” in Proc. ISM 2009, pp.44-51.
L. Sun, G. Liu, X. Qian, and D. Guo, “A Novel Text Detection and Localization Method Based on Corner Response,” in Proc. ICME 2009.
Z. Li, G. Liu, H. Jiang, and X. Qian, “Image Copy Detection Using a Robust Gabor Texture Descriptor,”in Proc. ACMLSMM 2009.
Y. Li, G. Liu, and X. Qian, “Ball and Field Line Detection for Placed Kick Refinement,”in Proc. WRI Global Congress on Intelligent Systems, GCIS 2009.
王喆,刘贵忠,钱学明, “基于H.264/AVC压缩域信息的全局运动估计方法,”in Proc. HHME 2009.
2008
X. Qian, G. Liu, and H. Wang, “GMLM based Error Concealment for MPEG-4 Video Transmission over High Lossy and Noisy Networks,” IIHMSP, 2008.
N. Nan, G. Liu, X. Qian, and C. Wang, “An SVM-Based Soccer Video Shot Classification Scheme Using Projection Histograms,” in Proc. PCM 2008.
H. Jiang, G. Liu, X. Qian, et al., “A Fast and Effective Text Tracking in Compressed Video,” in Proc. ISM 2008.
2007
X. Qian, G. Liu, H. Wang, R. Su, “Text detection, localization, and tracking in compressed video,” Signal Processing: Image Communication, vo.22, pp.752-768, 2007.
X. Qian, G Liu, “Global motion estimation from randomly selected motion vector groups and GM/LM based applications,” Signal, Image and Video Processing, 2007, pp.179-189.
X. Qian, G. Liu, and H. Wang, “Texture based Selective Block Matching Algorithm for Error Concealment,” in Proc. ICME, 2007, pp.739-742.
2006
X. Qian, G. Liu, R. Su, “Effective Fades and Flashlight Detection Based on Accumulating Histogram Difference,” IEEE Trans. Circuits and Systems for Video Technology. vol.16, no.10, pp.1245-1258, 2006.
X. Qian, G. Liu, “Text Detection, Localization and Segmentation in Compressed Videos,” in Proc. ICASSP, 2006, vol.2, pp.385-388.
钱学明,刘贵忠, “基于GA的压缩域中全局运动估计及在字幕遮挡区域恢复中的应用,”电子学报, vol.34, no.10, pp.1920-1924, 2006.





联系方式

Add: 西安市咸宁西路28号电信学部信通学院彭康楼134,创新港4-7107
Email: qianxm@mail.xjtu.edu.cn







钱学明的个人主页空间 - 钱 学明基本信息
2004.9~2008.1在西安交通大学攻读博士学位
2006年获微软****
2008年3月获西安交通大学电信学院信息与通信工程系工学博士学位
2008.4月起任教于西安交通大学电信学院信息与通信工程系
2009年获西安交通大学优秀博士论文培育基金
2009年获西安交通大学优秀博士论文
2010年获陕西省优秀博士论文
2010年入选西安交通大学青年骨干教师(副教授)培养计划
2010年入选微软亚洲研究院“铸星计划”
2011年西安交通大学副教授
2012年入选西安交通大学青年骨干教师(教授)培养计划
2014年破格为教授
钱学明 教授、博士、博导
CCF Senior member,IEEE member, ACMmember
中国图像图像图形学会专委会委员
计算机学会多媒体专委会委员
国家自然科学基金委通信评委, 科技部重点研发计划评委,陕西省科技奖评委,
陕西省创业创新大赛评委,陕西省科技项目评委,云南省创业创新大赛评委
担任VIE08国际会议分会主席, ICME, ICIMCS, MMM等国际会议技术委员会成员
担任ICME2014,MMM2014,MMM2015, Speical SessionOrganizers/Chairs

研究方向: 社会媒体大数据挖掘与检索,
基于社会媒体的用户个性化服务推荐;

图像视频内容理解与检索
人工智能与计算机视觉

更多信息参见: http://www.smiles-xjtu.com/






主要科研项目

----------------------2020----------------------------
上海箱云物流科技有限公司,基于图像识别的智能集装箱验箱,负责人,2020.7.1-2020.10.31.
西安深蓝电工技术有限公司,基于图像分析的桥梁振幅观测系统研制,负责人,2020.7.1-2020.10.31.
XX研究所,基于智能硬件的SAR目标检测,参与,2020.7.1-2020.10.31.
----------------------2019----------------------------
山东新北洋,基于人工智能的商品识别,负责人,2019.5.20-2019.12.31.
XXXXX,XXX智能核心技术及其发展路径研究,负责人,2019.10.1-2020.12.31.
艾耕,基于AI的自然语言处理技术,负责人,2019.12.20-2020.12.31.
亿阳信通,基于AI的无线网优服务,负责人,2019.12.20-2020.12.31.
杭州柯西公司,基于视觉的垃圾分类方法,负责人,2018.5-2018.10.
----------------------2018----------------------------
XXXXX,XXX智能技术发展研究,负责人,2018.4.15-2018.10.31.
Microsoft Research Asia,Food recognition and health management for standardized canteen,负责人,2018.12-2019.12.
西安普睿泰信息科技有限公司,大数据服务推荐项目(网络爬虫、文本分析), 负责人,2018.6.1-2018.10.
腾讯公司,新闻配图(基于学习的图文匹配),负责人,2018.6.1-2019.5.
陕西西驱电子科技有限公司,图像识别数据处理系统(基于AI的智慧管廊运维),负责人,2018.5-2018.10.
XX,基于视觉的智慧工地安全预警,负责人,2018.5-2018.10.
----------------------2017----------------------------
国家自然科学基金面上项目,基于对象的监控视频检索方法研究, 负责人,2018.1-2021.12.No.**
国家自然科学基金重点项目,面向复杂查询的异质媒体搜索, 子课题负责人,2018.1-2022.12.No.**
热工院合作项目,智能化颗粒物分析装置大数据分析软件设计与开发,负责人,2017.9-2017.12.。
----------------------2016----------------------------
腾讯公司,“新闻、视频封面生成方法研究”,负责人,2016.11,
宇航动力学重点实验室,“基于光学图像目标卫星三维重构方法研究”,负责人,,2016.3~2016.12
亿阳信通集团股份有限公司,“以图搜图算法”,负责人,016.3~2016.12
Microsoft Research Asia,Learning salient feature to enhance the mobile image retrieval负责人,2016.3-2016.12.
中美计算机科学研究中心, 社会网络媒体分析与检索,负责人,2016.3-2016.12.
广东省科技厅,基于媒体大数据的景点及位置相关服务推荐,负责人,2016.1-2016.12.
中电54所,基于无人机的环境重构,参与人,
中车集团,音视频编码、调制、解调器,参与人
中车集团,液晶屏控制器,参与人
----------------------2015及其之前----------------------------
2011太空信息协同创新中心, 基于多观测站空间目标序列融合的空间目标描述和识别方法研究负责人,2013.12-2014.12
微软亚洲研究院, Schedule Travel Life by Exploring Spectrums of Social User and City Services, 负责人,2013.12-2015.12
国家自然科学基金面上项目,基于移动互联网的网络图标广告推荐方法研究,负责人,2012.1-2015.12.
微软亚洲研究院,Mobile Sensing based Travel Guide and Travelogue Generation,负责人,2011.5-2014.5.
国家自然科学基金青年项目,一种统一的具有可分级的体育视频内容理解方法研究,负责人,2010.1-2012.12.
西安交通大学自然科学基金,图象视频内容理解与分类方法研究,负责人,2010.1-2011.12.
863计划项目,基于可分级和特征空间聚类的网络环境下视频媒体复制检测、定位和追踪技术,副组长,2009.1-2010.12.





发明专利
已授权专利
[1].钱学明,韩振,张宇奇,邹屹洋,侯兴松,一种卷积神经网络特征融合的多尺度快速人脸检测方法,申 请 号:20**,申 请 日:2018-03-30
[2].钱学明,周澎,一种以图快速检索景点的方法及导游系统,8.4,授权2019年11月29日
[3].钱学明*,杨锡玉,从多相关图片中挖掘显著特征实现图像检索的方法,8.6,申请日期2015-7-8,授权日期:2018-04-17
[4].钱学明*,赵一斯,一种基于区域挖掘和空间编码的图像位置估计方法,.9,申请日期2015-4-24,授权日期2018-3-2
[5] 蒋舒卉,钱学明,李婧等, 一种可视化的网络用户多媒体管理方法,ZL.4.4.






发表论文
2020录用
Yuxia Wu, Ke Li, Guoshuai Zhao, Xueming Qian*, “Personalized Long- and Short-term Preference Learning for Next POI Recommendation,”IEEE Trans.Knowledge and Data Engineering,(2020),DOI:10.1109/TKDE.2020.**
Guoshuai Zhao, Zhidan Liu, Yulu Chao, Xueming Qian*, “CAPER: Context-Aware Personalized Emoji Recommendation,”IEEE Trans.Knowledge and Data Engineering,(2020),DOI:10.1109/TKDE.2020.**
Guoshuai Zhao, Peiliang Lou, Xueming Qian*, Xingsong Hou, “Personalized Location Recommendation by Fusing Sentimental and Spatial Context,”Knowledge-Based Systems,196: 105849(2020).
Xueming Qian*, Yuxia Wu, Mingdi Li, Yayun Ren, Shuhui Jiang, Zechao Li,“LAST:Location-Appearance-Semantic-Temporal Clustering based POI Summarization,”IEEE Trans.Multimedia,xx(xx):xx-xx(2020).DOI: 10.1109/TMM.2020.**
Ke Li, Yuxia Wu, Yao Xue, Xueming Qian*, “Viewpoint Recommendation Based on Object Oriented 3D Scene Reconstruction,”IEEE Trans.Multimedia,xx(xx):xx-xx(2020).
Yuanzhi Liang, Xueming Qian*, Li Zhu, "Towards Better Railway Service: Passengers Counting in Railway Compartment"IEEE Trans.Circuits and Systems forVideo Technology,xx(xx):xx-xx(2020).
Hongjia Zhai, Shenqi Lai, Hanyang Jin, Xueming Qian*, Tao Mei,"Deep Transfer Hashing for Image Retrieval"IEEE Trans.Circuits and Systems forVideo Technology,xx(xx):xx-xx(2020).DOI: 10.1109/TCSVT.2020.**.
Luo Wang, Xueming Qian*, Yuting Zhang, Jialie Shen, Xiaochun Cao,Enhancing Sketch-based Image Retrieval by CNN Semantic Re-ranking,IEEE Trans. Cybern. 50(7): 3330-3342 (2020)
Xuxiao Bu, Jihua Zhu, Xueming Qian,Personalized product search based on user transaction history and Hypergraph learning, Multimedia Tools and Applications, 2020.
Bu Xuxiao Li, Bingfeng; Wang, Yaxiong; Zhu, Jihua; Qian, Xueming; Zhao, Marco, Semantic Gated Network for Efficient News Representation, ICMR, 2020: 251-255.

2019录用
Luo Wang, Xueming Qian*, Xingjun Zhang, Xiongsong Hou,Sketch-based Image Retrieval with Multi-clustering Re-ranking, IEEE Trans.Circuits and Systems forVideo Technology, 2020, vol.xx, no.xx, pp.xx-xx. DOI:10.1109/TCSVT.2019.**
Cheng Kang, Li Zhu, Xueming Qian*, Junwei Han, Meng Wang, Yuan Yan Tang, Geometry and Topology Preserving Hashing for SIFT Feature, IEEE Trans. Multimedia,vol.26, no.6, pp.1563-1576,2019.
Xiaoxia Shi, Xueming Qian*, Exploring Spatial and Channel Contribution for Object based Image Retrieval, Knowledge-Based Systems, 164: 107-121(2019).
Xueming Qian*, Mingdi Li, Yayun Ren, Shuhui Jiang, Social Media based Event Summarization by User-Text-Image Co-clustering, Knowledge-Based Systems, 164:107-121(2019).
Guoshuai Zhao, Xiaojiang Lei, Xueming Qian*,TaoMei:Exploring Users’Internal Influence from Reviews for Social Recommendation.IEEE Trans. Multimedia, 21(3):771-781(2019).
G.Zhao, H.Fu, R.Song, T.Sakai, Z.Chen, X.Xie,Xueming Qian*,Personalized Reason Generation for Explainable Song Recommendation.ACM TIST, 10(4):41:1-41:21(2019)
Yaxiong Wang, Lin Ma, Xueming Qian, Hao Yang, Jing Lu, Biao Li, Xin Fan,Position Focused Attention Network for Image-Text Matching, IJCAI2019, pp.3792-3798.
Yuanzhi Liang,Yalong Bai,Wei Zhang,Xueming Qian,Li Zhu,Tao Mei:VrR-VG: Refocusing Visually-Relevant Relationships,ICCV 2019: 10402-10411.
Yuanzhi Liang,Yalong Bai,Wei Zhang,Xueming Qian,Li Zhu,Tao Mei: Rethinking Visual Relationships for High-level Image Understanding.CoRRabs/1902.00313(2019)
Yuxia Wu, Guoshuai Zhao, and Xueming Qian, Long- and Short-term Preference Learning for Next POI Recommendation,CIKM2019, pp.2301-2304.

2018录用
Yaxiong Wang,Li Zhu,Xueming Qian*,Junwei Han:Joint Hypergraph Learning for Tag-Based Image Retrieval.IEEE Trans. Image Processing27(9):4437-4451(2018).
Hanyu Wang,Ping Wang,Xueming Qian*:MPNET: An End-to-End Deep Neural Network for Object Detection in Surveillance Video.IEEE Access 6:30296-30308(2018).
Xueming Qian*,Cheng Li, Ke Lan, Xingsong Hou,Zhetao Li, Junwei Han:POI Summarization by Aesthetics Evaluation from Crowd Source Social Media.IEEE Trans. Image Processing27(3):1178-1189(2018).
Zan Chen,Xingsong Hou,Xueming Qian,Chen Gong:Efficient and Robust Image Coding and Transmission Based on Scrambled Block Compressive Sensing.IEEE Trans. Multimedia 20(7):1610-1621(2018).
Rong Quan,Junwei Han,Dingwen Zhang,Feiping Nie,Xueming Qian*,Xuelong Li:Unsupervised Salient Object Detection via Inferring From Imperfect Saliency Models.IEEE Trans. Multimedia 20(5):1101-1112(2018).
Fan Li,Fu Shuang,Ziyi Liu,Xueming Qian:A Cost-Constrained Video Quality Satisfaction Study on Mobile Devices.IEEE Trans. Multimedia 20(5):1154-1168(2018).
Guoshuai Zhao, Tianlei Liu, Xueming Qian*,Tao Hou, Huan Wang, Xingsong Hou,Zhetao Li:Location Recommendation for Enterprises by Multi-Source Urban Big Data Analysis.IEEE Trans. Services Computing,x(x):xx-xx(2018)online.
2017录用
Xueming Qian,Xiaoqiang Lu, Junwei Han,BoDu:On Combining Social Media and Spatial Technology for Personalized Recommendation.Proceedings of theIEEE105(10):1937-1952(2017).
Xueming Qian,Dan Lu,Yaxiong Wang, Li Zhu,YuanyanTang,Meng Wang:Image Re-ranking based on Topic Diversity.IEEE Trans. Image Processing26(8):3734-3747(2017)
Xueming Qian,Huan Wang,Yisi Zhao,Xingsong Hou,Richang Hong,Meng Wang,Yuan Yan Tang: Image Location Inference by Multisaliency Enhancement.IEEE Trans. Multimedia19(4):813-821(2017)
Guoshuai Zhao,Xueming Qian,Chen Kang: Service Rating Prediction by Exploring Social Mobile Users' Geographical Locations.IEEE Trans. Big Data3(1):67-78(2017)
YaoXue,Xueming Qian: VEHICLE DETECTION AND POSE ESTIMATION BY PROBABILISTIC REPRESENTATION.ICIP 2017, pp.3355-3359.
2016录用
Guoshuai Zhao, Xueming Qian*, Xiaojiang Lei, Tao, Mei, “Service Quality Evaluation by Exploring Social Users' Contextual Information,”IEEE Trans.Knowledge and Data Engineering,28(12):3382-3394(2016).
Xiaojiang Lei,Xueming Qian*, Guoshuai Zhao, “Rating Prediction based on Social Sentiment from Textual Reviews,”IEEE Trans.Multimedia, 2016, vol.18, no.9, pp.1910-1921.
Dan Lu,Xiaoxiao Liu, Xueming Qian*, “Tag based Image Search by Social Re-Ranking,”IEEE Trans.Multimedia, 2016, vol.18, no.8, pp.1628-1639.
Guoshuai Zhao, Xueming Qian*, Xing Xie, “User-Service Rating Prediction by Exploring Social Users’ Rating Behaviors,”IEEE Trans. Multimedia, 2016, vol.18, no.3,pp.496-506.入选2017年度ESI论文
Xueming Qian*, Xiaoxiao Liu, Xiang Ma, Dan Lu, Chengyang Xu, “What Is Happening in The Video? Annotate Video by Sentence,”IEEE Trans.Circuits and Systems forVideo Technology, 2016, vol.26, no.9, pp.1746-1757.
Xueming Qian*, Xianglong Tan, Yuting Zhang, Richang Hong, Meng Wang, “Enhancing Sketch-Based Image Retrieval by Re-ranking and Relevance Feedback ”,IEEE Trans. Image Processing, vol.25, no.1, 2016, pp.195-208.
Xiwen Yao, JunweiHan, Gong Cheng, Xueming Qian, Lei Guo, “Semantic Annotation of High-Resolution Satellite Images via Weakly Supervised Learning,”IEEE Trans. Geoscience and Remote Sensing, 2016, vol.54, no.6,pp.3660-3671.
Yuting Zhang, Xueming Qian, Xianglong Tan, Junwei Han, Yuan Yan Tang, “Sketch-based Image Retrieval by Salient Contour Reinforcement,”IEEE Trans. Multimedia, 2016, vol.18, no.8,pp.1604-1615.
Shuhui Jiang, Xueming Qian*, Yun Fu, Tao Mei, “Personalized Travel Sequence Recommendation on Multi-Source Big Social Media,”IEEE Trans. Big Data, 2016, vol.1, no.2,pp.43-56.

2015
Xueming Qian*, Yisi Zhao, andJunwei Han, “Image Location Estimation by Salient Region Matching,”IEEE Trans.Image Processing, vol.24, no.6, 2015, pp.4348-4358.
Yun Gu, Xueming Qian*, Qing Li, Meng Wang, Richang Hong, andQiTian, “Image Annotation by Latent Community Detection and Multi-Kernel Learning,”IEEE Trans.Image Processing,vol.24,no.11, 2015, pp.3450-3463.
Shuhui Jiang, Xueming Qian*, Jialie Shen, Yun Fu, andTao Mei, “Author Topic Model-Based Collaborative Filtering for Personalized POI Recommendations”, IEEE Trans. Multimedia, 2015, vol.17, no.6,pp.907-918.ESI 高引论文
Xueming Qian,Yao Xue, Yuan Yan Tang, Xingsong Hou, and Tao Mei,“Landmark Summarization with Diverse Viewpoints”, IEEE Trans.Circuits and Systems forVideo Technology,vol.25, no.11, 2015, pp.1857-1869.
Xiang Ma, Huansheng Song,andXueming Qian, “Robust Framework of Single-Frame FaceSuperresolution Across Head Pose, FacialExpression, and Illumination Variations,”IEEE Trans. Human-Machine Systems, 2015, vol.45, no.2,pp.238-250.
Xiyu Yang, Xueming Qian*, andYao Xue, “Scalable Mobile ImageRetrieval by Exploring Contextual Saliency,”IEEE Trans.Image Processing,vol.24, no.6, 2015, pp.1709-1721.
Xiyu Yang, Xueming Qian*, andTao Mei, “Learning Salient Visual Word for Scalable Mobile Image Retrieval,”Pattern Recognition, 2015, vol.48, no.10,pp.3093-3101.
Xingsong Hou,Min Han,Chen Gong,Xueming Qian:SAR complex image data compression based on quadtree and zerotree Coding in Discrete Wavelet Transform Domain: A Comparative Study.Neurocomputing148: 561-568 (2015).
MengWang,Chenyang Xu, Jianguo Jiang, Xueming Qian:Image Classification Based on Low-Rank Matrix Recovery and Naive Bayes Sparse Coding.Neurocomputing169: 110-118 (2015).
Jing Li, Xueming Qian*,Qing Li, Yisi Zhao, Liejun Wang, and Yuan Yan Tang,“Ming Near Duplicate Image Groups”, Multimedia Tools and Applications,vol.74, no.2,2015, pp.655-669.
Jing Li, Xueming Qian*,et al.,“Improved Image GPS Location Estimation by MiningSalient Features”, Signal Processing: Image Communication,vol.38, 2015, pp.141-150.


2014 发表
Xueming Qian,He Feng, Guoshuai Zhao, and Tao Mei,“Personalized Recommendation Combining User Interest and Social Circle”, IEEE Trans. Knowledge and Data Engineering, vol.26, no.7, 2014, pp.1487-1502. ESI 高引论文
Xueming Qian,Xian-Sheng Hua, Yuan Yan Tang,and Tao Mei,“Social Image Tagging with Diverse Semantics”,IEEE Trans. Cybernetics, vol.44, no.12, 2014, pp.2493-2508.
Xueming Qian,HuanWang,andXingsongHou, “Video Text Detection and Localization in Intra-Frames of H.264/AVC Compressed Video”, Multimedia Tools and Applications, vol. 70, no.3, pp.1487-1502, 2014.
Xueming Qian, D.Guo, Huan Wang, Guizhong Liu, and XingsongHou, “HWVP: Hierarchical Wavelet Packet Texture Descriptors and Their Applications in Scene Categorization and Semantic Concept Retrieval”,Multimedia Tools and Applications, vol.69, no.3, pp.897-920, 2014.
He Feng, and Xueming Qian*,“Mining User-Contributed Photos for Personalized Product Recommendation”, Neurocomputing, vol.129, 2014, pp.409-420. (ESI数据库收录)
Xingsong Hou, Lan Zhang, Chen Gong, Lin Xiao, Jingqiang Sun, Xueming Qian,“SAR image Bayesiancompressive sensing exploiting the interscale and intrascale dependencies in directional lifting wavelet transform domain”Neurocomputing, vol.133, 2014, pp.358-368.
X. Liu, X. Qian, et al., “Personalized Tag Recommendation for Flickr Users”, In Proc. ICME, 2014, pp.xx-yy.
X. Yang, L. Liu, X. Qian, et al, “Mobile Visual Search via Hierarchical Sparse Coding”, In Proc. ICME, 2014, pp.xx-yy.
J.Li, X. Qian, Q. Li, et al., “Ming Near Duplicate Image Groups”, Multimedia Tools and Applications, vol.xx, no.y, 2014, pp.xx-xx. .
X.Yang, X. Qian, “Spatial Verification for Scalable Mobile Image Retrieval”, ACM CIKM, vol.xx, no.y, 2014, pp.xx-xx. Accepted.


2013
X. Qian, H. Feng, G. Zhao, and T. Mei, “Personalized Recommendation Combining User Interest and Social Circle”, IEEE Trans. Knowledge and Data Engineering, vol.x, no.y, 2013, pp.xx-yy. Accepted
X. Qian, X. Hua, Y. Tang, and T. Mei, “Social Image Tagging with Diverse Semantics”, IEEE Trans. Cybernetics, vol.x, no.y, 2013, pp.xx-yy. Accepted
J. Li, X. Qian*, Y. Tang, L. Yang, and T. Mei, “GPS estimation for places of interest from social users’ uploaded photos”, IEEE Trans. Multimedia 2013.
X. Hou, Jing Yang, G. Jiang, and X. Qian*, “Sparse representation and compression of complex SAR images using directional lifting wavelet transform”, IEEE Trans.Geoscience and Remote Sensing, vol.51, no.1, 2013, pp.527-538.
X. Qian, Y. Tang, Z. Yan, and K., “ISABoost: A weak classifier inner structure adjusting based adaboost algorithm - ISABoost based application in scene categorization”, Neurocomputing, vol.103, 2013, pp.104-113.
X. Qian, X. Liu, C. Zheng, Y. Du, and X. Hou, “Tagging photos using users’ vocabularies”, Neurocomputing, vol.111, 2013, pp.144-153.
H. Feng, and X. Qian*, “Mining User-Contributed Photos for Personalized Product Recommendation”, Neurocomputing, accepted.
Y. Du, Feng Chen, Wenli Xu, and X. Qian*, “Video content categorization using the double decomposition”, Multimedia Tools and Applications, vol.66, no.3, 2013, pp.545-572.
L. Ke, Z. Xu, Z. Feng, and X. Qian. Proportion based robust optimization and team orienteering problem with interval data. European Journal of Operational Research,vol.2226,no.1,2013,pp.19-31.
X. Hou, L. Zhang, C. Gong, L. Xiao, J. Sun, X. Qian, “SAR image Bayesian compressive sensing exploiting the interscale and intrascale dependencies in directional lifting wavelet transform domain” Neurocomputing, accepted.
Q. Li, Y. Gu, and X. Qian*, “LCMKL: Latent-community and multi-kernel learning based image annotation”, ACM CIKM 2013.
H. Feng, and X. Qian*, “Recommendation via user’s personality and social contextual”, ACM CIKM 2013.
H. Feng, and X. Qian*, “Recommend Social Network Users Favorite Brands”, PCM 2013.
Y. Xue, X. Qian*, and B. Zhang, “Mobile image retrieval using multi-photos as query”, In Proc. ICME, 2013, pp.xx-yy.
S. Jiang, X. Qian*, Y.Xue, F. Li and X. Hou, “Generating Representative Images for Landmark by Discovering High Frequency Shooting Locations from Community-Contributed Photos”, In Proc. ICME, 2013, pp.xx-yy.
S. Jiang, X. Qian*, T. Mei, K. Lan, and L. Zhang, “Mobile multimedia travelogue generation by exploring geo-locations and image tags”, In Proc. ISCAS, 2013, pp.881-884.
J. Li, X. Qian*, Y. Tang, L. Yang, and C. Liu, “GPS estimation from users’ photos”, In Proc. MMM 2013, pp.118-129.
G. Zhao, X. Qian*, and H. Feng, “Personalized Recommendation by Exploring Social Users’ Behaviors”, In Proc. MMM 2014.

2012
X. Qian, X. Hou, Y. Tang, H. Wang, and Z. Li, “Hidden Conditional Random Fields based Soccer Video Events Detection”, IET Image Processing, vol.6, no.9, 2012, pp.1338-1347.
X. Qian, and H. Wang, “Video Text Detection and Localization in Intra-Frames of H.264/AVC Compressed Video”, Multimedia Tools and Applications, June 2012.
X. Qian, H. Wang, G. Liu, and X. Hou, “HWVP: Hierarchical Wavelet Packet Texture Descriptors and Their Applications in Scene Categorization and Semantic Concept Retrieval”, Multimedia Tools and Applications, May 2012.
X. Qian, and G. Liu, “An Effective GM/LM Based Video Error Concealment”, Signal Image and Video Processing, 2012, vol.6,no.1, pp.9-17.
X. Qian, H. Wang, G. Liu, and X. Hou, “HMM Based Soccer Video Event Detection Using Enhanced Mid-Level Semantic”, Multimedia Tools and Applications, vol.60, no.1, 2012,pp.233-255.
X. Qian, X. Hua, and X. Hou, “Tag Filtering based on Similar Compatible Principle”, In Proc. ICIP, 2012,pp. 2349-2352.
Y. Xue, and X. Qian, “Visual Summarization of Landmarks via Viewpoint Modeling”, In Proc. ICIP, 2012, pp.2873-2876.
蒋舒卉, 钱学明, “一种重要区域重采样的人脸检索方法”, 西安交通大学学报,2012.

2011
X. Qian, H. Wang, G. Liu, and X. Hou, “HMM Based Soccer Video Event Detection Using Enhanced Mid-Level Semantic”, Multimedia Tools and Applications, 2011. (online)
X. Qian, X. Hua, “Graph-Cut based Tag Enrichment”, in Proc. SIGIR 2011,pp.1111-1112.
X. Qian, X. Hua, P. Chen, and L. Ke, “PLBP: An Effective Local Binary Patterns Texture Descriptor with Pyramid Representation”, Pattern Recognition, 2011, vol.44, pp. 2502-2515.
Z. Li, G. Liu, X. Qian, D. Guo, and H. Jiang, “Effective and Efficient Video Text Extraction Using Key Text Points”, IET Image Processing, 2011, vol.5, no.8, pp.671-683.
X. Qian, Z. Yan, and K. Hang, “Boosted Scene Categorization Approach by Adjusting Inner Structures and Outer Weights of Weak Classifiers”, in Proc. MMM, 2011, pp.413-423.
2010
X. Qian, G.Liu, Z. Li, Z. Wang, and H. Wang “Highlight Events Detection in Soccer Video using HCRF”, in Proc. ICIMCS, 2010,pp.171-174.
X. Qian, and G.Liu, “An Effective GM/LM Based Video Error Concealment”, Signal Image and Video Processing, 2010.
H. Wang, X. Qian, and G.Liu, “Inter Mode Decision Based on Just Noticeable Difference Profile”, in Proc. ICIP 2010.
X. Qian, H. Wang, G.Liu, Z. Li, and Z. Wang, “Soccer Video Event Detection by Fusing Middle Level Visual Semantics of an Event Clip”, in Proc. PCM 2010.
X. Qian, Z. Yan, K, Hang, G.Liu, H. Wang, Z. Wang and Z. Li, “Scene Categorization Using Boosted Back-Propagation Neural Networks”, in Proc. PCM 2010.
Z. Wang, G.Liu, Y. Ma, X. Qian, and Y. Yang, “An Improved Fusion Method Based on Adaboost Algorithm for Semantic Concept Extraction”, in Proc. ICIMCS, 2010, pp.19-22.
Z. Wang, G.Liu, X. Qian, and D. Guo, “An Approach to the Compact and Efficient Visual Codebook Based on SIFT Descriptor”, in Proc. PCM 2010.
Z. Li, G. Liu, X. Qian, C. Wang, Y. Ma and Y. Yang, “A Video Text Detection Method based on Key Text Points”, PCM2010.
Z. Li, G.Liu, X. Qian, and C.Wang, “Scale and Rotation Invariant Gabor Texture Descriptor for texture Classification”, in Proc. VCIP2010.
王喆,刘贵忠,钱学明, “基于H.264/AVC压缩域信息的全局运动估计方法,” 电子学报, 2010.
2009
X. Qian, G. Liu, and H. Wang.Recovering Connected Error Region Based on Adaptive Error Concealment Order Determination. IEEE Trans. Multimedia, vol.11, no.4, pp.683-695, 2009.
X. Qian, G. Liu, D. Guo, Z. Li, Z. Wang, and H. Wang, “Object Categorization using Hierarchical Wavelet Packet Texture Descriptors,” in Proc. ISM 2009, pp.44-51.
L. Sun, G. Liu, X. Qian, and D. Guo, “A Novel Text Detection and Localization Method Based on Corner Response,” in Proc. ICME 2009.
Z. Li, G. Liu, H. Jiang, and X. Qian, “Image Copy Detection Using a Robust Gabor Texture Descriptor,”in Proc. ACMLSMM 2009.
Y. Li, G. Liu, and X. Qian, “Ball and Field Line Detection for Placed Kick Refinement,”in Proc. WRI Global Congress on Intelligent Systems, GCIS 2009.
王喆,刘贵忠,钱学明, “基于H.264/AVC压缩域信息的全局运动估计方法,”in Proc. HHME 2009.
2008
X. Qian, G. Liu, and H. Wang, “GMLM based Error Concealment for MPEG-4 Video Transmission over High Lossy and Noisy Networks,” IIHMSP, 2008.
N. Nan, G. Liu, X. Qian, and C. Wang, “An SVM-Based Soccer Video Shot Classification Scheme Using Projection Histograms,” in Proc. PCM 2008.
H. Jiang, G. Liu, X. Qian, et al., “A Fast and Effective Text Tracking in Compressed Video,” in Proc. ISM 2008.
2007
X. Qian, G. Liu, H. Wang, R. Su, “Text detection, localization, and tracking in compressed video,” Signal Processing: Image Communication, vo.22, pp.752-768, 2007.
X. Qian, G Liu, “Global motion estimation from randomly selected motion vector groups and GM/LM based applications,” Signal, Image and Video Processing, 2007, pp.179-189.
X. Qian, G. Liu, and H. Wang, “Texture based Selective Block Matching Algorithm for Error Concealment,” in Proc. ICME, 2007, pp.739-742.
2006
X. Qian, G. Liu, R. Su, “Effective Fades and Flashlight Detection Based on Accumulating Histogram Difference,” IEEE Trans. Circuits and Systems for Video Technology. vol.16, no.10, pp.1245-1258, 2006.
X. Qian, G. Liu, “Text Detection, Localization and Segmentation in Compressed Videos,” in Proc. ICASSP, 2006, vol.2, pp.385-388.
钱学明,刘贵忠, “基于GA的压缩域中全局运动估计及在字幕遮挡区域恢复中的应用,”电子学报, vol.34, no.10, pp.1920-1924, 2006.





联系方式

Add: 西安市咸宁西路28号电信学部信通学院彭康楼134,创新港4-7107
Email: qianxm@mail.xjtu.edu.cn







New Page - 钱 学明(5.)Scientific Research
欢迎报考!
本实验室 教师列表:
钱学明 (教授),qianxm@mail.xjtu.edu.cn
主要从事人工智能、深度学习的网络媒体挖掘与推荐,图像视频分析检索
侯兴松 (教授),houxs@mail.xjtu.edu.cn
主要从事基于人工智能的图像压缩等
顿玉洁(讲师), dunyj@mail.xjtu.edu.cn
主要从事深度学习的网络媒体挖掘与推荐,音视频分析等
赵国帅(讲师),guoshuai.zhao@mail.xjtu.edu.cn
主要从事人工智能、深度学习的网络媒体挖掘与推荐
薛尧(讲师), xueyao@mail.xjtu.edu.cn
主要从事人工智能深度学习的图像视频分析检索、医学图像处理

实验室长期从事网络媒体分析、图像分析检索方面的研究工作。
相关的研究成果在中车、腾讯、微软亚洲研究员等有上线应用。
硕士研究生主要从事基于人工智能+视觉信息的研究和系统研发






课题组信息快报

赵国帅获西安交通大学第六届“十大学术新人”
本实验室与微软合作研发的菜品识别项目--获得2019年度微软-高校合作最佳应用奖
本实验室与微软合作研发的菜品识别项目在微软亚洲研究院丹棱街食堂成功上线应用
陕西西驱公司委托开发的基于人工智能的智慧关联运维方法已成功服务于西咸新区智慧管廊24公里的运维--该系统是全国首家采用AI管廊运维的上线产品
腾讯新闻委托开发的自动新闻配图系统已成功上线应用
腾讯新闻委托开发的基于AI的新闻挑图系统已成功上线应用






成果简介

西安交通大学SMILES LAB研究成果简介

链接: https://pan.baidu.com/s/1aKgu_Mos157tvEbOR7A-EQ 提取码: wqq6
链接: https://pan.baidu.com/s/1z3GmeQeWb0QpkDI2_GYdXw 提取码: s6qv
链接: https://pan.baidu.com/s/1TIt2nGVj_7XlN_tY1jrDjw 提取码: cnk3

本项目组在目标检测算法方面的研究也取得了很大的进展。项目组采用深度神经网络的方法,对不同类型的物体目标(如受电弓、人脸、安全帽等)设计了针对性强,属性区别效果良好的目标检测方法。这些目标检测方法的准确性强,实时性好。在较难处理的小目标检测这一问题上,本项目组的目标检测方法也取得了良好的效果。另外,实验室已有工作的人脸检测算法、行人车辆检测算法和目标物体盗移检测算法更是能够为军事目标的识别与感知提供直接的帮助。例如,行人检测算法可用于检测敌方的士兵的行踪、车辆检测算法可辅助对敌方军用车辆的检测,而目标物品盗移检测算法则可对我方的重要军事目标予以保护。除此之外,上述课题组的许多研究基础是基于商用背景,出模型的识别性能以外,还需考虑模型的轻量化以及实时性,在此诸多难点下本课题仍然出色地完成了各项目所设定的目标。
本课题组以往已有许多成功的项目经验可供本课题的研究中参考与借用,具体的研究基础如下:
(1)受电弓受损异常、打火检测
以电能为牵引供给的高铁、地铁等列车在行驶时,其受电弓会从铁轨上方的高压电线上不断汲取电能。而当受电弓接触电线,二者在高速的行驶过程中发生摩擦,进一步产生火花。通过对受电弓与电线摩擦所产生的火花进行统计,分析异常火花频率,及时更换受电弓,可有效避免受电弓因使用过度而在列车行驶过程中断裂,为列车的安全行驶提供保障。通过对数据集进行预处理、模型训练、算法改进等一系列工作,本课题组针对高铁行驶过程中的受电弓火花检测问题进行了研究。提出了基于深度神经网络模型量化加速的受电弓和火花检测方法,方法具有实时高效,小目标检测率高的优点。如图所示,在不同的天气环境下,受电弓火花均可被准确地检测出来,除此之外,弓角异常、结构受损等情况也均可被检测出来,且检测精度达到了预期项目要求。
系统流程示意图:
检测结果示意图:
系统界面示意图:

方法优点:
1.采用两级检测方法大幅降低火花检测误检率,总体误检率不到5%
2.对检测算法的检测模型和系统代码进行大量优化,大幅提高检测速度,可以在日常I5级别CPU上实现每秒百帧的检测速度,在RK3399开发板CPU上实现实时检测。
3.本系统便于移植,可以工作于基于Linux内核的Ubuntu等系统和win7、win10等windows系统。
4.应用及成果:
基于深度网络与分级测试的电力机车受电弓及电弧检测方法(专利二审)
可在开发板实现的电力机车受电弓及电弧快速检测方法(专利受理)
基于深度学习的高铁受电装置安全状态快速检测方法(交大学报论文)
(2)安全帽佩戴情况检测
在建筑施工现场,为避免建材从高处坠落造成人员伤亡,所有进入施工区域的人都被要求佩戴安全帽。而常有工人不遵守安全规范,摘下或忘戴安全帽,有着严重的安全隐患。本课题组针对这一问题,基于监控视频对建筑工地上人员的安全帽佩戴情况进行检测识别。如图所示,佩戴安全帽与不佩戴安全帽、佩戴其他类型帽,分别以黄色、红色与蓝色框标出。该课题完成了对安全帽佩戴检测的自动识别。课题中采用深度神经网络的方法,对不同类型的带帽人员以及不戴帽人员进行检测和良好的属性区分,方法具有一定的实时性。

优点
1、实现对安全帽佩戴的自动检测,采用深度神经网络的方法,对不同类型的带帽人员以及不戴帽人员进行检测和良好的属性区分,实时性较强。
2、轻量化的模型,兼容国产人工智能处理芯片(海思,瑞芯微等),可达到实时处理的要求。
3、模型的mAP可以达到90%以上。
4、通过使用多线程完成对多路视频的并行处理。
应用及成果
1、开发的系统已经在杭州市江干区住建局成功使用。

(3)基于视觉的驾驶系统行人检测及测距
方法流程摘要:
保障行人安全是道路交通安全系统的重要目标之一,这使行人检测作为驾驶辅助
系统(advanced driver assistance systems,ADAS)中的核心组成部分。其中获取准确的行人距离十分关键,对此本系统在行人检测模型的基础上加入了行人距离预测分支,提出了一种基于车载视频的行人检测与测距方法,在使用单目摄像头的情况下,可以在检测行人的同时完成对行人与摄像头之间距离的预测。下图为行人检测测距系统流程示意图:

同时,本课题将该模型部署到了基于树莓派 3B 和 IntelNCS2 神经网络计算加速棒的嵌入式平台上,实现了一个简单的行人距离预警系统,系统从摄像头或者视频文件读取视频流,当行人距离摄像头的距离过近时,系统发出预警。实际运行结果如下图所示:

方法优点
1、同时完成行人检测和测距,采用深度神经网络的方法,对摄像头或视频文件获取的视频流进行处理,对于距离太近的行人发出预警信号。
2、相比传统使用激光雷达测距的方法,极大的降低了成本
3、轻量化的模型,兼容国产人工智能处理芯片(海思,瑞芯微等),可达到实时处理的要求。
4、行人检测mAP达到98%以上,距离预测误差小于5%。
应用及成果:申请发明专利:一种基于单目摄像头的行人距离预测方法(专利受理)

(4)人员口罩检测(或者特定服饰等)
方法流程摘要:
当前我国大范围爆发了新型冠状病毒(2019-nCoV)感染,我们在支持疫情一线的医护人员的同时,也要做好个人的防护措施。其中佩戴口罩对于防止疫情蔓延至关重要,但仅靠人工监督,效率太低且耗费大量人力。本项目基于这个问题,提出了一套对是否佩戴口罩自动检测和预警系统。如下图为口罩检测系统流程示意图。


方法优点:
1、实现对口罩佩戴的自动检测,采用深度神经网络的方法,对是否佩口罩进行检测和良好的属性区分,实时性较强。
2、轻量化的模型,兼容国产人工智能处理芯片(海思,瑞芯微等),可达到实时处理的要求。
3、识别性能达到99%以上。
5)人脸表情分类系统


该方法实现了基于深度神经网络的人脸检测、表情识别、人脸识别系统。如图为该系统流程图。监控摄像头采集的视频数据通过人脸检测网络进行特征提取,生成下采样的特征图,预测人脸位置和关键点。根据关键点坐标和标准人脸关键点进行人脸姿态的矫正。矫正过的人脸送入表情识别网络和身份识别网络进行身份识别和表情分类。
本系统可以从摄像头和本地视频中读取数据,对数据中的人脸表情进行happy(高兴)、sad(悲伤)、feared(害怕)、angry(生气)、disgusted(困惑)、surprise(惊喜)、nothing(无)七种表情的识别,并根据视频中的人脸实时统计出每种表情所占比例。系统演示效果如图所示。
优点
1)组合人脸检测、识别和表情识别三项功能,实现端到端的集成系统。以人脸检测和关键点配准为基础层,身份识别和表情识别为应用层,可灵活调用某层或某功能的结果。
2)面向多人场景,可以并行完成复杂场景多人脸检测和识别任务。
3)轻量化的模型,对摄像头采集的高分辨率视频帧进行实时处理。
4)应用及成果
专利在审:一种监控视频多人人脸检测和表情识别方法

6)行人检测、检索系统
本系统可从监控视频中检测出所有行人,使用截图功能设定目标人物,可自动定位到其他时段出现的该行人。如下图所示,截取行人正面照片,可定位到该行人被监控摄像拍到的侧面以及背影。可以看到,目标人物的其他时间点所拍摄到的照片,均在排列靠前的搜索结果中。该系统中,对象(行人、车辆等)采用深度特征描述,采用特征匹配和搜索的方法,可以在历史数据中找出当前对象相似的目标。

7)基于司机状态识别的辅助驾驶方法研究
方法流程摘要
本系统对司机状态识别来达到辅助驾驶的功能,通过对司机状态进行拍摄监测,通过检测模型来得到司机实时的面部区域和手部区域,进而对面部区域进行关键点检测和对手部区域进行分心状态识别,从而对司机是否疲劳驾驶和分心驾驶作出判断,并对司机进行提醒预警,起到辅助驾驶的作用。共实现了对司机闭眼、打哈欠两种疲劳状态以及玩手机分心状态的监测,其中,对唇部打哈欠、眼部睁闭眼状态识别的准确率分别达到99.07%、94.6%。如下图为驾驶员驾驶状态监测系统流程示意图。

本系统通过对当前摄像头前人物的眼部特征进行监测、处理识别,可判断出其是否处于疲劳状态,演示效果如图所示,右上角概率设为非疲劳的预测值,当人物闭眼时,标记框为红色并报警,当人物睁眼时标记框为绿色,判断其为非疲劳状态。
方法优点
1)在整个检测过程中,对面部和手部区域分别进行处理,当后续需要增加识别手部其他状态时,无需重新训练检测和面部关键点检测的模型,只需再次训练手部状态识别这一小部分模型,具有状态识别可扩展性。
2)轻量化模型,整个系统在GTX 1080显卡下可达每秒22帧,满足将来在人工智能芯片上布控的速度要求。
3)针对唇部状态的识别率达到了99%以上,眼部状态的识别率也高达94.6%
应用及成果
该算法可以较好地应用到司机辅助驾驶的功能使用中,来起到事故的主动防御作用,达到更安全的出行。

8)多菜品识别系统
本系统实现基于视觉的自动菜品结算系统,通过对菜品种类及食材的识别,获取具体的摄入菜品种类和数量,实现营养成分的估计,提供了一种基于细粒度识别的菜品自动结算及饮食健康管理方法。实现了共计百种食物的识别。如下图为自动菜品结账系统系统流程示意图。
优点:
1)检测和检测相结合,按照大类检测和细致类别检索相结合的识别,相对于现有人工智能的检测识别方法,具有速度优势并且具有识别类别扩展性。当识别的类别发生增补是无需重新训练模型。
2)轻量化的模型,兼容国产人工智能处理芯片(海思,瑞芯微等),可达到实时处理的要求。
3)200道菜的识别性能达到98%以上。
4)开发的系统已经在微软亚洲研究院试点应用
钱学明、彭豪、侯兴松、邹屹洋、李纬.一种基于细粒度识别的菜品自动结算及饮食健康管理方法:(专利受理)
9)单菜品属性识别系统
本系统通过计算机视觉技术提供了一种菜品食材等属性信息的识别方法。通过对菜品细粒度特征的识别,实现了百种预设菜品的主要食材、菜品口味特色、适宜人群推荐、相似菜品推荐、以及菜系、烹饪方式等属性信息的识别。如下图为自动菜品结账系统系统流程示意图。

优点
1)细粒度识别与多标签学习相结合,优化多属性学习,标签不均衡问题,相对于现有人工智能的细粒度菜品识别方法,拓展了菜品的口味特色、菜系、烹饪方式等多属性信息,提高了识别精度。
2)轻量化的模型,兼容国产人工智能处理芯片(海思,瑞芯微等),可达到实时处理的要求。
3)百种菜品的识别精度达到现存方法中最高,属性识别精度达到95%以上。
4)应用及成果
本项目获微软亚洲研究院2019学术日Real World Scenario Award奖

10)货柜商品识别系统
智能无人货柜得益于其体积小巧,售卖场景多样、用户购物交互体验强的优点,受到大众的欢迎。摈弃了现有基于计算机视觉技术的智能无人货柜识别商品类目少的缺点。本系统将计算机视觉的检测与检索技术相结合,共同实现了智能无人货柜的近百种商品识别系统。下图为本系统的实现流程示意图。

下图分别为真实场景智能货柜示意图,以及摄像头采集的商品图片示意图。
下图为货柜内摄像头采集的商品图片,以及其对应的识别结果。其中不同种类商品由不同颜色的检测框检出。
优点
1)检测和检测相结合,按照大类检测和细致类别检索相结合的识别,相对于现有人工智能的检测识别方法,具有速度优势并且具有识别类别扩展性。当识别的类别发生增补是无需重新训练模型。
2)轻量化的模型,兼容国产人工智能处理芯片(海思,瑞芯微等),可达到实时处理的要求。
3)高识别性能100类典型的商品识别性能达到99.5%,能够对人为产生商品倾倒、损毁和杂物入侵具有实时报警。
4)应用及成果
开发的系统已经在山东新北洋信息技术股份有限公司测上线应用。
11基于手势识别对旋翼无人机智能控制
系统给出了一种通过识别人体手势来对无人机进行智能控制的方法;提出了一种基于轻量化卷积神经网络和多尺度检测算法实现操控人员的身份识别,以及操控人员手势识别。通过使用机载摄像头采集图像,并且对图像进行识别无人机操作者及操作者的手势来控制无人机,实现无人机上、下、前、后、左、右,停等多种飞行姿态的控制。下图是该方案的整体流程图。
优点:
1)将轻量化网络和多尺度算法结合,对人体手势可以快速识别。在NVIDIA-TX2、树莓派等开发板可达实时效果。
2)对行人检测准确率可达98%,对手势识别准确率可达96.97%。
3)能有效地将人体手势动作与无人机飞控相结合,实现人与无人机良好的交互和协作,减少了传统无人机控制的复杂性。
12铁路沿线鸟巢检测、入侵检测
火车作为当代人常用的交通工具之一,铁路是我们生命安全的保障。针对铁路沿线鸟巢造成的鸟害事件,我们提出了鸟巢检测方法,可以对铁路沿线的鸟巢进行准确分类和定位。针对在铁路附近大型机器施工现象,为避免造成铁路破坏,保障火车正常运行,我们提出了入侵检测算法,对铁路沿线出现的大型机器进行入侵警告。下面是具体方案流程图。


方法优点:
1)将检测算法与attention机制相结合,针对铁路沿途出现的事件进行有效检测。
2)将人工智能算法应用到铁路运行中,可以对铁路沿途出现的鸟巢事件和大型机器入侵事件进行警告,保证火车安全运行。
13)高铁车厢内事件检测
针对高铁车厢内出现的拿或放行李、送餐、推餐车、收垃圾等事件进行检测,并将不同类别人员的相关属性信息进行存储。根据放置行李这一事件,将行李架进行区域划分,并将乘客与行李之间根据区域id建立检索关系。通过这种检索关系可以判断是否存在错拿行李等异常事件发生,保障了乘客的物品安全。
下面是整体的流程图。

优点:
1)将轻量化网络与多尺度检测算法结合,可以有效的对高铁车厢内出现的事件进行检测,其中检测的准确率达到94.75%。
2)将人工智能算法应用到实际的场景之中,对乘客的行李物品提供了安全保障,而且对高铁管理人员提供了便利。

14)超分辨率重建
数字图像在社会各个领域(包括工业、农业、医学、军事等)的应用越来越广泛。高分辨率图像在这些数字图像应用领域中能提供比低分辨率图像多的细节信息。在VR中,往往需要用计算机设备将同一场景的多幅图像融合在一起形成模拟复杂现实场景的图像。在医学影像中,结构清晰、细节信息丰富的高分辨率图像是关乎人们生命安全的重要元素。本课题组针对以上问题,通过对图像进行预处理、大量地模型训练和验证之后,提出了基于深度卷积神经网络的深度方法,并对此方法进行了优化。如图所示,此方法对于低分辨率图像进行超分辨率重建之后,对于细节信息比其他方法恢复得更加丰富。





(15)基于嵌入式硬件的SAR目标检测和识别
SAR目标检测在军事、民用领域有重大需求,无人机搭载的SAR图形对战场或者目标区域进行飞行成像,传统的方法需要后台人为在线干预,这样造成飞行速度慢,战场信息处理不及时的不足。而采用后台处理的方法,则离线,无法对实时的展开环境中的目标进行有效识别。无法得知目标类型(飞机、坦克、舰船、汽车等)、数量及分布信息。然而该任务难点是:数据量小、小目标、实时检测困难等。
本课题提供了一种基于嵌入式、轻量级深度网络的实时目标检测和分类方法
目标型号细粒度分类。相关的解决方案包括:小样本学习、数据增强、小目标检测、迁移学习等。
优点:在嵌入式硬件上可以达到实时处理的要求。









实验室成员 - 钱 学明研究方向与研究成员
欢迎报考!
本实验室 教师列表:
钱学明 (教授),qianxm@mail.xjtu.edu.cn
主要从事人工智能、深度学习的网络媒体挖掘与推荐,图像视频分析检索
侯兴松 (教授),houxs@mail.xjtu.edu.cn
主要从事基于人工智能的图像压缩等
顿玉洁(讲师), dunyj@mail.xjtu.edu.cn
主要从事深度学习的网络媒体挖掘与推荐,音视频分析等
赵国帅(讲师),guoshuai.zhao@mail.xjtu.edu.cn
主要从事人工智能、深度学习的网络媒体挖掘与推荐
薛尧(讲师), xueyao@mail.xjtu.edu.cn
主要从事人工智能深度学习的图像视频分析检索、医学图像处理

实验室长期从事网络媒体分析、图像分析检索方面的研究工作。
相关的研究成果在中车、腾讯、微软亚洲研究员等有上线应用。
硕士研究生主要从事基于人工智能+视觉信息的研究和系统研发









毕业学生去向 - 钱 学明团队成员

博士研究生:
赵国帅, 已毕业,西安交通大学软件学院
吴玉霞,博士在读,NUS联合培养(合作导师Tat-Seng Chua)
王亚雄,博士在读,悉尼科技大学联合培养(合作导师杨易)
靳寒阳,博士在读,悉尼科技大学联合培养(合作导师杨易)
王珞, 博士在读,匹兹堡大学联合培养
汤豪, 博士在读
郭毅, 博士在读
曹钰, 博士在读
李纬, 博士在读
王烨, 博士在读


硕士研究生:
2020年毕业生
卜旭晓, 百度
石晓霞,上海银行
杨帅, 北京银行
徐宁, 地平线
杨瑾, 地平线
宋天源,中国电信北京研究院
李子烁,百度
刘彪, 云丛科技
李柯, 小米
梁远智,悉尼科技大学读博

2019年毕业生
高侃妮,浦发银行
王妍, 成都xx
韩振, 阿里达摩院
彭豪, 爱奇艺
唐圣钦,地平线
李鸣镝,招商银行
高振贵,华为
种冲, 华为
徐伟, 深圳xx

2018年毕业生
汪寒雨,腾讯
刘玉婵,Facebook
朱碧莹,美团
周鑫, 美团
赖申其,美团
李巍豪,联影
张宇奇,三星

2017年毕业生
周澎, 华为
康晨, 法国攻读博士学位
李诚, 中科院电子所
2016年毕业生
任亚运,大华
张玉婷,搜狗
卢丹, 南京28所
雷小江,南京28所

2015年毕业生
赵一斯,华为
杨锡玉,搜狗
赵国帅,西安交通大学攻读博士学位

2014年毕业生
刘萧萧,大唐电信研究所
蒋舒卉,美国东北大学攻读博士学位
谭祥龙,华为
2013年毕业生
李婧, 普渡大学攻读博士学位
薛尧, 阿尔伯塔大学攻读博士学位
冯贺, 北方工业







课题组信息快报 - 钱 学明成果简介

赵国帅获西安交通大学第六届“十大学术新人”
本实验室与微软合作研发的菜品识别项目--获得2019年度微软-高校合作最佳应用奖
本实验室与微软合作研发的菜品识别项目在微软亚洲研究院丹棱街食堂成功上线应用
陕西西驱公司委托开发的基于人工智能的智慧关联运维方法已成功服务于西咸新区智慧管廊24公里的运维--该系统是全国首家采用AI管廊运维的上线产品
腾讯新闻委托开发的自动新闻配图系统已成功上线应用
腾讯新闻委托开发的基于AI的新闻挑图系统已成功上线应用







媒体库

在此文件夹中没有媒体文件。


122



dataset







您没有所需角色来访问此portlet。
文档与媒体

按导航筛选
所有

按……排序
大小
下载
被修改的日期
创建日期
名称






卡片
列表






主页文件夹
详细信息
条目数2


主页


这个文件夹中没有文件或媒体文件。

文件夹








{title}现在由




现在由 {title}












介绍 - 钱 学明


相关话题/西安交通大学 电子

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 西安交通大学材料学院导师教师师资介绍简介-憨?勇
    欢迎访问憨勇教师个人主页http://gr.xjtu.edu.cn/web/yonghan研究领域或方向先进薄膜与功能涂层,生物医用与仿生材料,多孔金属功能材料。工作简历1995年于西北工业大学获博士学位,1996.1-1998.1于西安交通大学从事博士后研究,1997.9-1997.12赴法国特鲁 ...
    本站小编 Free考研考试 2021-06-26
  • 西安交通大学电子与信息工程学院导师教师师资介绍简介-张 安学
    张安学的个人主页空间-张安学基本信息张安学,1972年出生,河南安阳人。西安交通大学教授,博士生导师,西安交通大学电磁与信息技术研究所所长,中国天线学会专业委员会委员,超高速电路设计与电磁兼容教育部重点实验室学术委员会委员。研究方向涉及新型天线与分集技术、移动通信微波射频技术、智能雷达信号处理、多天 ...
    本站小编 Free考研考试 2021-06-26
  • 西安交通大学材料学院导师教师师资介绍简介-郭大刚
    郭大刚,男,1975年生,博士,西安交通大学材料学院教授,博士生导师,先后入选“西安交通大学青年骨干教师培养计划”(2008)、“教育部新世纪优秀人才支持计划”(2008)。1994~1998年西北工业大学材料学院读本科,1998~2000年西北工业大学材料学院攻读硕士学位,2000~2005年西安 ...
    本站小编 Free考研考试 2021-06-26
  • 西安交通大学材料学院导师教师师资介绍简介-韩卫忠
    研究领域或方向极端服役环境下的金属结构材料;金属材料辐照和变形损伤机理工作经历2014.01-至今西安交通大学材料科学与工程学院教授2010.10-2013.12美国洛斯阿拉莫斯国家实验室博士后2008.09-2010.09澳大利亚莫纳什大学博士后教育经历2003.09-2008.08中国科学院金属 ...
    本站小编 Free考研考试 2021-06-26
  • 西安交通大学电子与信息工程学院导师教师师资介绍简介-廖 学文
    廖学文的个人主页空间-廖学文基本信息廖学文:1980年生,湖南长沙市人。信息与通信工程专业博士,教授,博士生导师,电磁与信息技术研究所副所长;1998年西安交通大学电信学院信息与通信工程系就读本科,2008年获得西安交通大学信息与通信工程专业博士学位,导师为朱世华教授,同年留校任教。2010年获聘西 ...
    本站小编 Free考研考试 2021-06-26
  • 西安交通大学材料学院导师教师师资介绍简介-SuckJooNa
    研究领域或方向电弧焊,激光焊接,激光电弧复合焊接,激光增材制造,基于CFD的激光加工过程"传热-冶金-力学"行为数字孪生研究。工作经历1.2018年8月-至今西安交通大学,教授2.1983年-2017年,韩国科学技术院机械工程系,教授教育经历1.1978-10至1983-03,TUBraunschw ...
    本站小编 Free考研考试 2021-06-26
  • 西安交通大学电子与信息工程学院导师教师师资介绍简介-张 超
    基本情况-张超基本信息张超,博士,副教授,博士生导师隶属于电磁与信息技术创新研究所——智能网络与信息技术团队信息与通信工程学院,电子信息学部目前研究兴趣领域:高能效通信、随机网络分析、空天地一体化网络(6G)、卫星通信与测控、智能通信技术等领域;人工智能、超材料、新天线技术等与通信技术的交叉领域。学 ...
    本站小编 Free考研考试 2021-06-26
  • 西安交通大学电子与信息工程学院导师教师师资介绍简介-王 慧明
    王慧明的个人主页空间-王慧明基本信息王慧明教授/博导电子与信息学部信息与通信工程学院网络空间安全学院智能网络与网络安全教育部重点实验室副主任荣誉与获奖2019年国家级青年人才2019年ESI全球高被引科学家2019年陕西省优秀博士学位论文指导教师(学生:郑通兴)2019年陕西省科技创新团队带头人20 ...
    本站小编 Free考研考试 2021-06-26
  • 西安交通大学材料学院导师教师师资介绍简介-贺?林
    研究领域或方向l研究领域一:块体金属玻璃的制备、力学行为及应用,主要研究工作涉及“基于低纯工业原料制备块体金属玻璃”、“通过微合金化提高块体金属玻璃的玻璃形成能力”、“块体金属玻璃复合材料”。l研究领域二:玻璃陶瓷的制备、力学行为、摩擦磨损特性及应用。主要研究工作涉及“齿科玻璃陶瓷与天然牙釉质的磨损 ...
    本站小编 Free考研考试 2021-06-26
  • 西安交通大学电子与信息工程学院导师教师师资介绍简介-黄 斌科
    基本信息-黄斌科个人信息黄斌科副教授博士生导师信息与通信工程学院联系方式西安交通大学信息与通信工程学院陕西省西安市碑林区咸宁西路28号邮编:710049电话:邮箱:bkhuang@mail.xjtu.edu.cn站点计数器个人简介黄斌科,1974年12月生,陕西岐山人。1998年7月、2004年6月 ...
    本站小编 Free考研考试 2021-06-26