|
|
|
神经网络辨识的基本方法及神经网络控制的典型结构 |
|
发表评论(0) 作者:yingkong01 发布时间:2010年10月26日 |
|
|
1、神经网络辨识的基本方法
选择适当的神经网络作为被辨识系统P的模型、及逆模型。所选的网络结构确定后,在给定的被辨识系统输入输出观测数据下,网络通过学习(训练),不断的调整权系值,使得准则函数为最优。
(1)选择适当的神经网络作为被辨识系统的模型辨识系统P的模型 和被辨识系统P的逆模型 ,如下图所示:
图1 模型辨识结构 图2 逆模型辨识结构
从神经网络(模型)的输入输出,与被辨识系统的输入输出关系上,可分为两种辨识结构:并联型;串—并联型。它们分别对应:并联型(图3);串—并联模型(图4)(PM与SPM)。
并联模型PM由内时延反馈网络、输出反馈网络实现。串—并联模型SPM可由时延神经网络、PID神经网络实现。
(2)神经网络辨识主要分为线性动态系统模型辨识、非线性动态系统模型辨识、线性动态系统逆模型辨识和非线性动态系统逆模型辨识。由于非线性系统的特性多种多样,对于某一系统的辨识问题,网络的选择、网络结构的确定等,理论和实践上都有待于进一步探讨。本题仅讨论线性动态系统模型辨识以及线性动态系统逆模型辨识。
线性动态系统模型辨识是利用系统的输入/输出时间序列及最优化准则函数,求得系统参数的估计值。
对于线性动态系统逆模型辨识。其目的是用系统输入输出 ,最优化准则函数: (e(k):输入误差)
求得逆模型参数:
的估计:
设模型结构已知,用串-并联结构线性DTNN进行逆模型辨识,见图6:图
网络调整权系值:
得到逆模参数估计:
2、神经网络控制的典型结构
(1)神经网络监督控制
神经网络监督控制就是通过对人工或传统控制器进行学习,然后用神经网络控制器取代或逐渐取代原控制器的方法,也称为COPY控制。神经网络监督控制实际就是建立人工控制器的正向模型。经过训练,神经网络将记忆该控制器的动态特性,并且接受传感信息输入,最后输出与人工控制器相似的控制作用。但此法的缺点是,人工控制器是靠视觉反馈进行控制的,在用神经网络控制器进行控制后,由于缺乏视觉反馈,由此构成的控制系统实际是一个开环系统,这就使其稳定性和鲁棒性均得不到保证。
(2)神经网络直接逆控制
神经网络直接逆控制就是将被控对象的神经网络逆模型,直接与被控对象串联起来,以便使期望输出与对象实际输出之间的传递函数等于1,从而在将此网络作为前馈控制器后,使被控对象的输出为期望输出。
(3)神经网络自适应控制
与传统自适应控制相同,神经自适应控制也可分为自校正控制(STC)与模型参考控制(MRAC)两种。神经网络自校正控制也分为直接与间接控制。它们的根本区别在于,前者使用常规控制器,离线辨识的神经网络估计器需要足够高的建模精度;而后者则同时使用神经网络控制器和神经网络估计器,其中估计器可以在线修正。
(4)神经网络内模控制:
在内模控制中,系统的正向模型与实际系统并联,两者输出之差被用作反馈信号,此反馈信号又由前向通道的滤波器及控制器进行处理。由内模控制的性质可知,该控制器直接与系统的逆有关,而引入滤波器的目的则是为了获得期望的鲁棒性和跟踪响应。
(5)神经网络预测控制:
预测控制是一种基于模型的控制,它是70年代发展起来的一种新的控制算法,具有预测模型、滚动优化和反馈校正等特点。
(6)神经网络自适应评判:
由Barto等提出的,并由Anderson发展的,它应用强化学习的机理。这种控制系统通常由两个网络组成,即自适应判断网络AJN和控制选择网络CSN。
其中自适应评判网络的作用有二:一是通过不断的奖励、惩罚等再励学习,使自己逐渐成为一个“合格”的教师;二是在学习完成后,根据被控系统目前的状态及外部再励反馈信号r(t),产生一再励预测信号p(t),并进而给出内部再励信号,以期对目前控制作用的效果作出评价。控制选择网络的作用相当于一个在内部再励信号指导下进行学习的多层前馈神经网络控制器。该网络在进行上述学习后,将根据编码后的系统状态,在允许控制集中选择下一步的控制作用。控制选择网络也可以是一个模糊神经网络控制器。
|
|
|
|
相关技术论坛: |
|
相关技术论文: |
|
|