3月28日下午,中国科学院自动化研究所副研究员罗彪博士在理科楼南205教室为物理与电子工程学院师生做了一场题为“Data-Driven Optimization Control with Off-policy Reinforcement Learning”的学术报告。报告会由物理与电子工程学院副院长汪新文教授主持。
罗彪博士从飞机飞行的平衡控制原理入手,引入数据驱动控制问题,重点就强化学习与最优控制的联系作了深入详细的报告。罗彪博士在报告中还分享他近几年来所取得的重要研究成果:提出了“脱策”强化学习方法并建立了相关收敛性理论——在系统模型未知的情况下,基于实际系统数据学习出优化控制策略——解决了无模型最优与H-inf控制问题。罗彪博士的报告虽然专业性较强,但他多次以生活中具体的实例来形象化地解释其中的思想与原理,使得报告生动有趣、通俗易懂、内容丰富、引人入胜,现场掌声不断。
报告结束后,罗彪博士还与现场师生进行了交流互动,详细、耐心地解答了师生们的提问。罗博士的报告和答疑对帮助电信、电工等专业的学生明确学习目标、端正学习态度、掌握正确的学习方法等方面均有示范作用和指导意义。
罗彪简介
罗彪,博士,中国科学院自动化研究所副研究员,2015年中国自动化学会优秀博士论文获得者。2013年,在香港城市大学担任过研究助理; 2013年、2014年和2015年在德州农工卡塔尔分校担任过研究助理。现担任国际重要期刊《Artificial Intelligence Review》与《IEEE Transactions on Emerging Topics in Computational Intelligence》的Associate Editor;担任中国自动化学会自适应动态规划与强化学习专业委员会(CAA ADPRL-TC)秘书长。主要研究兴趣:自适应动态规划与强化学习、分布参数系统、数据驱动控制、机器学习与计算智能。
近几年在国际顶级学术期刊发表学术论文20余篇,包括《Automatica》、《IEEE Transactions on Neural Networks and Learning Systems》、《IEEE Transactions on Cybernetics》、《Industrial & Engineering Chemistry Research》等。
low dose naltrexone lyme disease
peider.dk naltrexone implant removal
can naltrexone cause false positive
ldn 4.5 mg drinking while on naltrexone
naltrexone drug
charamin.com difference between naloxone and naltrexone
naltrexone nausea
click naltraxon
naltrexone how long does it take to work
link injectable naltrexone
low does naltrexone
sigridw.com how long does it take for naltrexone to work
low dose naltrexone sleep
read naltrexone withdrawal symptoms
starting naltrexone
link naltrexone ulcerative colitis
buy low dose naltrexone
go low dose naltrexone chronic fatigue