反馈控制

深度强化学习泡沫及路在何方?

泄露秘密 提交于 2020-01-10 15:52:00
一、深度强化学习的泡沫 2015年,DeepMind的Volodymyr Mnih等研究员在《自然》杂志上发表论文Human-level control through deep reinforcement learning[1],该论文提出了一个结合深度学习(DL)技术和强化学习(RL)思想的模型Deep Q-Network(DQN),在Atari游戏平台上展示出超越人类水平的表现。自此以后,结合DL与RL的深度强化学习(Deep Reinforcement Learning, DRL)迅速成为人工智能界的焦点。 过去三年间,DRL算法在不同领域大显神通:在视频游戏[1]、棋类游戏上打败人类顶尖高手[2,3];控制复杂的机械进行操作[4];调配网络资源[5];为数据中心大幅节能[6];甚至对机器学习算法自动调参[7]。各大高校和企业纷纷参与其中,提出了眼花缭乱的DRL算法和应用。可以说,过去三年是DRL的爆红期。DeepMind负责AlphaGo项目的研究员David Silver喊出“AI = RL + DL”,认为结合了DL的表示能力与RL的推理能力的DRL将会是人工智能的终极答案。 RL论文数量迅速增长[8] 1.1 DRL的可复现性危机 然而,研究人员在最近半年开始了对DRL的反思。由于发表的文献中往往不提供重要参数设置和工程解决方案的细节,很多算法都难以复现

控制装置与仪表(一)

て烟熏妆下的殇ゞ 提交于 2019-12-21 01:55:35
根据课上照片整理,照片不全,或有阙漏,欢迎留言补充. 文章目录 绪论 控制装置的主要构成 变送器的用途: 现场总线控制系统(FCS) 基础知识 基本概念 控制仪表的性能 信号制(☆☆) 两种模拟直流信号的区别(☆☆) 变送器与控制室仪表间的信号传输(☆☆) 量程与零点(☆☆) 供电技术 控制仪表的通信 控制装置的抗干扰 干扰的来源 干扰的形式 控制装置的防爆 齐纳式安全栅(☆☆) 变送器原理及应用 电容式变送器 扩散硅压力变送器 热电阻温度变送器 执行器 执行器概述 阀门定位器(☆☆) DEH控制系统 转速控制装置(☆☆) 转差电机调速系统的问题 液力耦合器(☆☆) 变频调速系统 控制器 PID调节 先进控制策略 现场总线控制仪表 现场总线控制系统FCS 现场总线控制系统(FCS)的组成(☆☆) FCS相对于DCS系统的优点(☆☆) 现场总线通信协议 FF总线 CAN总线 画两星(☆☆)的部分为随堂课后题中出现的部分,画一星(☆)的部分为根据其他途径获取的可能为重点的部分. 绪论 控制装置的主要构成 变送器: 将被测参数转换成标准输出信号的仪表 控制器 执行器 变送器的用途: 将被测参数的物理量转换成 4~20mA 或 0~10mA 直流信号.(记住两种标准信号的范围). 有模拟式与数字式 一般安装在现场 分为温度,压力,流量,液位等类型的变送器 现场总线控制系统(FCS)

深度强化学习泡沫及路在何方?

一笑奈何 提交于 2019-12-17 02:24:48
一、深度强化学习的泡沫 2015年,DeepMind的Volodymyr Mnih等研究员在《自然》杂志上发表论文Human-level control through deep reinforcement learning[1],该论文提出了一个结合深度学习(DL)技术和强化学习(RL)思想的模型Deep Q-Network(DQN),在Atari游戏平台上展示出超越人类水平的表现。自此以后,结合DL与RL的深度强化学习(Deep Reinforcement Learning, DRL)迅速成为人工智能界的焦点。 过去三年间,DRL算法在不同领域大显神通:在视频游戏[1]、棋类游戏上打败人类顶尖高手[2,3];控制复杂的机械进行操作[4];调配网络资源[5];为数据中心大幅节能[6];甚至对机器学习算法自动调参[7]。各大高校和企业纷纷参与其中,提出了眼花缭乱的DRL算法和应用。可以说,过去三年是DRL的爆红期。DeepMind负责AlphaGo项目的研究员David Silver喊出“AI = RL + DL”,认为结合了DL的表示能力与RL的推理能力的DRL将会是人工智能的终极答案。 RL论文数量迅速增长[8] 1.1 DRL的可复现性危机 然而,研究人员在最近半年开始了对DRL的反思。由于发表的文献中往往不提供重要参数设置和工程解决方案的细节,很多算法都难以复现

基于STC12C5A60S2的内嵌A/D和内嵌PWM的PID参数整定

非 Y 不嫁゛ 提交于 2019-12-10 15:55:42
控制对象传递函数:Gp=20/(s(0.1s+1)(0.2s+1) 第一个实验主要是出现等幅震荡的波形(纯比例控制): #include <STC12C5A60S2.H> #include <absacc.h> typedef unsigned char u8; //无符号字符型变量新表示方法定义 typedef unsigned int u16; //无符号整型变量新表示方法定义 //#define AD0 XBYTE [0xF0FF] //给定量外部AD通道0的端口地址 //#define AD1 XBYTE [0xF1FF] //反馈量外部AD通道1的端口地址 //#define DA XBYTE [0xEFFF] //外部DA转换数据输入端口地址 #define D_port XBYTE [0x7FFF] //数码管段码锁存器端口地址 #define B_port XBYTE [0xBFFF] //数码管位码锁存器端口地址 #define A0_r -9.27 //实验五的4通道数据 #define Am_r 10.24 //实验五的4通道数据 #define N0_r 0x20 //实验五的4通道数据 #define Nm_r 0xe0 //实验五的4通道数据 #define A0_m -9.32 //实验五的5通道数据 #define Am_m 9.91 /