王志
助理研究员 工程管理学院
学位:博士 职务:
联系电话: 电子邮箱:zhiwang@nju.edu.cn
办公地址:南大工程管理学院协鑫楼401
个人简介
研究方向
科研(教学)奖励
论文发表
专著出版
科研项目
社会兼职
荣誉称号
专利发明
教育及工作经历:2015年于南京大学工程管理学院获工学学士学位,2019年于香港城市大学系统工程及工程管理学系获哲学博士学位,2019年11月起加入南京大学工程管理学院控制与系统工程系任教,曾于2019年8月至10月赴澳大利亚新南威尔士大学做短期访问研究。
学术研究:研究方向为强化学习、机器学习与人工智能,及其在机器人学、机器人控制中的应用。研究成果发表在 IEEE Transactions on Neural Networks and Learning Systems, IEEE/ASME Transactions on Mechatronics, IEEE Transactions on Cybernetics, IEEE Transactions on Systems, Man, and Cybernetics: Systems 等国际期刊和 AAAI Conference on Artificial Intelligence 等国际会议上。
教学及人才培养:目前承担《深度强化学习》、《自动化导论》等本科生、研究生课程。
强化学习(Reinforcement Learning, RL)
1. 迁移强化学习(Transfer RL):运用贝叶斯推理(Bayesian inference)、分层贝叶斯模型(Hierarchical Bayesian model)、隐变量模型(Latent variable model)、自适应权重(Adaptive re-weighting)、元学习(Meta-learning)等原理和方法,实现强化学习智能体之间知识的有效迁移。与之相近或交叉的学习模式有增量式学习(Incremental learning)、多任务学习(Multi-task learning)、持续学习(continual learning)、终身学习(lifelong learning)等。
2. 分层强化学习(Hierarchical RL):运用模型集成(Model ensemble)、多专家模型(Mixture-of-experts)、贝叶斯推理(Bayesian inference)等原理和方法,在基于半马尔科夫决策过程(Semi-Markov decision process)的选项(Option)框架下实现高效而实用的决策分层机制。
3. 基于演化计算的强化学习(Evolutionary computation for RL):运用高度可并行化的演化算法,如演化策略(Evolution strategies, ES)、进化算法(Genetic algorithms, GA)等,为强化学习问题提供可扩展性强、运算时间短的解决方案。
4. 基于规则的强化学习(Rule-based RL):运用规则信息(Rules)、专家知识(Expert knowledge)、人类经验(Human demonstrations)等仿生学原理和方法,来改善强化学习的性能,使之更为接近人类学习的模式。
5. 多智能体强化学习(Multi-agent RL):运用深度卷积(Depthwise convolution)、平均场近似(Mean-field approximation)、博弈论(Game theory)等原理和方法,提高多智能体之间实时通信与协同决策能力。
强化学习可解决多种多样的任务,拥有广泛的算法验证平台,比如:MuJoCo机器人运动学控制、Atari视频游戏、3D视频游戏、星际争霸II(StarCraft II)策略游戏等。
MuJoCo Humanoid Robot
Atari 2600 Games
3D Game (Quake III Arena)
StarCraft II
机器人学(Robotics)、机器人控制系统(Robot control systems)
运用强化学习、机器学习(Machine learning)、控制理论(Control theory)等原理和方法,赋予机器人类似人的能力以流畅自然的方式执行各种运动技能与任务,例如:轮式机器人的智能导航任务、足式机器人在复杂路况中的步态控制、工业机械臂系统的精确轨迹规划与灵活手抓取任务、智能无人仓储中的自动货物运输、智能交通信号灯的控制任务等。
Journal Articles:
[1]Zhi Wang, Chunlin Chen, and Daoyi Dong, "Lifelong incremental reinforcement learning with online Bayesian inference," IEEE Transactions on Neural Networks and Learning Systems,DOI: 10.1109/TNNLS.2021.**, 2021. [pdf][code]
[2]Zhi Wang, Han-Xiong Li, andChunlin Chen, "Incremental reinforcement learning in continuous spaces via policy relaxation and importance weighting,"IEEE Transactions on Neural Networks and Learning Systems, vol. 31, no. 6, pp. 1870-1883, 2020. [pdf] [code]
[3]Zhi Wang,Chunlin Chen, Han-Xiong Li,Daoyi Dong, and Tzyh-Jong Tarn, "Incremental reinforcement learning with prioritized sweeping for dynamic environments,"IEEE/ASME Transactions on Mechatronics, vol. 24, no. 2, pp. 621-632, 2019. [pdf] [code]
[4]Zhi Wang, Han-Xiong Li, andChunlin Chen, "Reinforcement learning based optimal sensor placement for spatiotemporal modeling,"IEEE Transactions on Cybernetics, vol. 50, no. 6, pp. 2861-2871, 2020. [pdf]
[5]Zhi Wang, and Han-Xiong Li, "Incremental learning for online modeling of distributed parameter systems,"IEEE Transactions on Systems, Man, and Cybernetics: Systems, vol. 49, no. 12, pp. 2612-2622, 2019. [pdf]
[6]Zhi Wang, and Han-Xiong Li, "Dissimilarity analysis based multimode modeling for complex distributed parameter systems,"IEEE Transactions on Systems, Man, and Cybernetics: Systems, DOI: 10.1109/TSMC.2019.**, 2019. [pdf]
Conference Papers:
[1] Zhi Wang, Wei Bi, Yan Wang, and Xiaojiang Liu, "Better fine-tuning via instance weighting for text classification,"in:Proceedings of AAAI Conference on Artificial Intelligence (AAAI), 2019, pp. 7241-7248. [pdf] [supplementary materials]
[2]Donghan Xie, Zhi Wang, Chunlin Chen and Daoyi Dong, "IEDQN: Information exchange DQN with a centralized coordinator for traffic signal control," in:Proceedings of International Joint Conference on Neural Networks (IJCNN), 2020.
[3]Zhi Wang, and Han-Xiong Li, "Incremental learning based subspace modeling for distributed parameter systems,"in:Proceedings of International Joint Conference on Neural Networks (IJCNN), 2019.
[4]Zhi Wang,Chunlin Chen, Han-Xiong Li,Daoyi Dong, and Tzyh-Jong Tarn, "A novel incremental learning scheme for reinforcement learning in dynamic environments,"in:Proceedings of World Congress on Intelligent Control and Automation (WCICA), 2016.
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
南京大学工程管理学院导师教师师资介绍简介-王志
本站小编 Free考研考试/2021-02-16
相关话题/南京大学 工程
南京大学工程管理学院导师教师师资介绍简介-许鑫
许鑫助理研究员工程管理学院学位:博士职务:联系电话:电子邮箱:xinxu103@nju.edu.cn办公地址:协鑫楼405个人简介研究方向科研(教学)奖励论文发表专著出版科研项目社会兼职荣誉称号专利发明西北工业大学工学博士(2015.4),美国PrincetonUniversity博士后(2016. ...南京大学师资导师 本站小编 Free考研考试 2021-02-16南京大学工程管理学院导师教师师资介绍简介-罗晓鹏
罗晓鹏助理研究员工程管理学院学位:博士职务:联系电话:电子邮箱:xpluo@nju.edu.cn办公地址:协鑫楼405个人简介研究方向科研(教学)奖励论文发表专著出版科研项目社会兼职荣誉称号专利发明西北工业大学工学博士(2015.4),美国PrincetonUniversity博士后(2015.6- ...南京大学师资导师 本站小编 Free考研考试 2021-02-16南京大学工程管理学院导师教师师资介绍简介-魏婧雯
魏婧雯助理研究员工程管理学院学位:博士职务:联系电话:电子邮箱:jwwei@nju.edu.cn办公地址:协鑫楼401个人简介研究方向科研(教学)奖励论文发表专著出版科研项目社会兼职荣誉称号专利发明2019年6月于中国科学技术大学自动化系获得博士学位,同年12月加入南京大学工程管理学院任助理研究员。 ...南京大学师资导师 本站小编 Free考研考试 2021-02-16南京大学大气科学学院导师教师师资介绍简介-陈星
陈星性别:男出生年月:1957年4月籍贯:江苏镇江专业技术职务:教授、博士生导师行政职务:灾害性天气气候研究所副所长、气象学系副主任中国灾害防御协会理事主要学习工作经历:1978-1982:南京大学气象系本科,气候学学士学位1982-1985:南京大学大气科学系,气候学硕士学位1998-2001:南 ...南京大学师资导师 本站小编 Free考研考试 2021-02-16南京大学大气科学学院导师教师师资介绍简介-丁爱军
【个人简介】丁爱军,南京大学教授、博士生导师、大气科学学院院长、江苏省“气候变化”协同创新中心副主任。先后获国家自然科学基金****基金(2017)、国家自然科学基金优秀青年基金(2014)、江苏省自然科学基金****基金(2014)资助,担任首批国家重点研发计划“大气专项”项目负责人,入选“教育部 ...南京大学师资导师 本站小编 Free考研考试 2021-02-16南京大学大气科学学院导师教师师资介绍简介-方娟
FANGJuan方?娟fangjuan@nju.edu.cn86-SchoolofAtmosphericSciencesNanjingUniversity163XianlinRoad,NanjingEducation?Sep.1995–Mar.2000NanjingUniversityPh.D,Me ...南京大学师资导师 本站小编 Free考研考试 2021-02-16南京大学大气科学学院导师教师师资介绍简介-符淙斌
符淙斌院士、教授办公地址:大气楼A406办公电话:Email:fcb@nju.edu.cn符淙斌,男,气候学家,瑞典哥德堡大学名誉博士,南京大学大气科学学院教授,气候与全球变化研究院院长,“气候变化”江苏省协同创新中心科学指导委员会主任。1962年毕业于南京大学气象 ...南京大学师资导师 本站小编 Free考研考试 2021-02-16南京大学大气科学学院导师教师师资介绍简介-郭维栋
郭维栋,男,1972年生,理学博士,教授,博士生导师,南京大学气候与全球变化研究院院长助理。教育部“大气-地球系统科学”国际合作联合实验室副主任、“气候变化”江苏高校协同创新中心管理委员会副主任。iLEAPS(陆地生态系统与大气过程综合研究)中国委员会秘书长,GEWEX(国际能量与水循环试验)中国委 ...南京大学师资导师 本站小编 Free考研考试 2021-02-16南京大学大气科学学院导师教师师资介绍简介-黄安宁
黄安宁,男,汉族,1979年8月生,重庆大足人。现任南京大学大气科学学院教授、博导。1998年入云南大学大气科学系学习,2002年获气象学理学学士学位,同年进入南京大学大气科学学院学习,2007年获气象学理学博士学位并留校任教。2008-2010年间在加拿大环境部内陆水研究所(CCIW)进行了为期2 ...南京大学师资导师 本站小编 Free考研考试 2021-02-16南京大学大气科学学院导师教师师资介绍简介-江静
江静:1962年10月生,湖南桃江人。1983年获南京大学气候学专业学士学位,1986年获南京大学气候学专业理学硕士学位,2001年获南京大学理学博士学位。1986年留校任教,现任南京大学教授。主要从事区域气候变化与模拟的教学和科研工作。曾主持和参加国家重点基础研究发展规划项目(973项目)、国家自 ...南京大学师资导师 本站小编 Free考研考试 2021-02-16