如何理解系统的可观测性
目录
系统的可观测性的定义为:
对于系统 在有限的时间区间里 内,对应初态 ,有
则称为不可观测状态,如果不存在这样的不可观测状态,那么系统完全可观测。
这个定义说的非常的抽象,但是可观测性这个概念最重要的是其在 状态观测器(state observer)的设计中发挥了关键作用,下面我就从这个角度进行一些对于状态可观性的介绍。
其实,状态可观性的概念是出自于卡尔曼,而著名的Kalman filter也实质上是state estimator for stochastic system[1]。
对于系统进行控制,首先我们需要确定要进行的控制的类型,一般而言,控制分为基于状态变量的控制和基于输出的控制,这其中最好的当然是状态控制,但是我们往往只有输出和输入,而难以直接得到系统的状态变量,这个时候就需要从前面所说的输出和输入还原出系统的状态变量,这就是所谓的状态观测[2]。
状态反馈和输出反馈
典型状态观测器结构
一言以蔽之,系统状态的可观测性是进行状态观测器设计的前提,也就是说,无论是用什么方法,只有当系统完全可观时,才有可能从状态观测器的设计得出系统的状态的观测。
以Full-Order Observers为例[3],其结构如下:
对于观测系统有:
跟踪误差为:
即: 和原始系统做差有:
跟踪误差可以求得:
写成矩阵形式:
我们希望跟踪误差趋近于0并且其衰减速度可以调控,显然这取决于矩阵 的特征根,这就是所谓的极点配置的问题:
- 选择一个合适的 ,使得
- 如果 就可以保证所有的初始值都可以按快于 的速度收敛
而根据对偶原理,对于矩阵 的极点配置的问题相当于利用状态反馈 对于系统 的极点配置问题,而这等价于系统 可控,那么即等价于系统 可观。这里就解释了可观和可控的对偶的用处以及系统可观性的实际含义。
参考
- ^段广仁. 线性系统理论. 哈尔滨工业大学出版社, 1996 https://item.jd.com/30834945675.html
- ^吴麒主编. 自动控制原理 (第2版, 下册). 清华大学出版社, 2006. http://www.tup.tsinghua.edu.cn/booksCenter/book_02284603.html
- ^Discrete Control System, Katsuhiko Ogata https://www.goodreads.com/book/show/241242.Discrete_Time_Control_Systems