自动控制网—学习自动控制技术电气自动化技术从这里开始!

什么是学习控制

时间:2015-08-26 09:42来源:www.eadianqi.com 编辑:自动控制网
1.学习(learning)的定义 定义8.1 一个具有生存能力的动物在它的一生中能够被其经受的环境所改造。一个能够繁殖后代的动物至少能够生产出与自身相似的动物(后代),即使这种相似可能随着时间变化。如果这种变化是自我可遗传的,那么,就存在一种能受自然选择影响

1.学习(learning)的定义 本文来自www.eadianqi.com

定义8.1    一个具有生存能力的动物在它的一生中能够被其经受的环境所改造。一个能够繁殖后代的动物至少能够生产出与自身相似的动物(后代),即使这种相似可能随着时间变化。如果这种变化是自我可遗传的,那么,就存在一种能受自然选择影响的物质。如果该变化是以行为形式出现,并假定这种行为是无害的,那么这种变化就会世代相传下去。这种从一代至其下一代的变化形式称为种族学习(racial learning)或系统发育学习(system growth learning),而发生在特定个体上的这种行为变化或行为学习,则称为个体发育学习(individual growth learning)(Wiener, 1965)。
定义2    假设
    (1) 一个有机体或一部机器处在某类环境中,或者同该环境有联系;
    (2) 对该环境存在一种“成功的”度量或“自适应”度量;
    (3) 这种度量在时间上是比较局部的,也就是说,人们能够用一个比有机体生命期短的时间来测试这种成功的度量。

本文来自www.eadianqi.com

    对于所考虑的环境,如果这种全局的成功度量,能够随时间而改善,那么我们就说,对于所选择的成功度量,该有机体或机器正为适应这类环境而学习(C. Shannon, 1953)。
定义3  在同类特征的重复环境中,有机体依靠自己的适应性使自身行为及在竞争反应中的选择不断地改变和增强。这类由个体经验形成的选择变异即谓学习(Osgood,1953)。
定义4    学习是一种过程,通过对系统重复输入各种信号,并从外部校正该系统,从而系统对特定的输入作用具有特定的响应。自学习就是不具外来校正的学习,即不具奖罚的学习,它不给出系统响应正确与否的任何附加信息(Tsypkin)。
定义5    学习表示系统中的自适应变化,该变化能使系统比上一次更有效地完成同一群体所执行的同样任务(Simon)。
定义6    学习在于使我们的智力工作发生有益的变化(Minsky)。
定义7    学习系统(learning system)是一个能够学习有关过程的未知信息,并用所学信息作为进一步决策或控制的经验,从而逐步改善系统的性能。

本文来自www.eadianqi.com


定义8    如果一个系统能够学习某一过程或环境的未知特征固有信息,并用所得经验进行估计、分类、决策或控制,使系统的品质得到改善,那么称该系统为学习系统。
定义9    学习控制(learning control)能够在系统进行过程中估计未知信息,并据之进行最优控制,以便逐步改进系统性能。
定义10   学习控制是一种控制方法,其中的实际经验起到控制参数和算法类似的作用。
定义11   如果一个学习系统利用所学得的信息来控制某个具有未知特征的过程,则称该系统为学习控制系统。
自动控制网www.eadianqi.com版权所有

2.学习控制的定义的数学描述

自动控制网www.eadianqi.com版权所有

定义12  在有限时间域[0, T]内,给出受控对象的期望的响应,寻求某个给定输入,使得的响应,在某种意义上获得改善;其中,k为搜索次数,t∈[0, T]。称该搜索过程为学习控制过程。当k→∞时,该学习控制过程是收敛的。
    根据上述定义,可把学习控制的机理概括如下:
    (1) 寻找并求得动态控制系统输入与输出间的比较简单的关系。
    (2) 执行每个由前一步控制过程的学习结果更新了的控制过程。
    (3) 改善每个控制过程,使其性能优于前一个过程。
    希望通过重复执行这种学习过程和记录全过程的结果,能够稳步改善受控系统的性能。 自动控制网www.eadianqi.com版权所有

本文已影响