Construction of program control with probability one for a dynamical system with Poisson perturbations
aa r X i v : . [ m a t h . P R ] N ov Построение программных управлений свероятностью 1 для динамической системы спуассоновскими возмущениями
Е. В. КарачанскаяТихоокеанский государственный университет, Россия, Хабаровск
Аннотация
В статье предлагается метод построения программных управлений с вероятно-стью 1 для динамической системы, подверженной пуассоновским возмущениям.
Введение
Одной из задач управления является организация управления динамической систе-мой таким образом, чтобы при ее эволюции важные характеристики системы (в томчисле и зависящие от положения системы), сохранялись. В реальном пространстве надинамическую систему оказывают влияние случайные факторы. Наиболее удачно этослучайное воздействие можно описать с помощью винеровских и пуассоновских процес-сов. В последнее время было предложено несколько способов построения управленийсистемой при наличии винеровских процессов. В данной работе предлагается методпостроения программного управления с вероятностью 1 для системы, подверженнойвозмущениям в виде винеровских и пуассоновских процессов. Предложенный метод ос-нован на понятии первого интеграла для системы стохастических дифференциальныхуравнений с винеровскими и пуассоновскими возмущениями [1, 2, 3] и алгоритме по-строения автоморфной функции [4].
Пусть x ∈ R n , x ( t ) – случайных процесс, являющийся решением системы стохасти-ческих дифференциальных уравнений dx i ( t ) = a i ( t ; x ( t )) dt + m X k =1 b ik ( t ; x ( t )) dw k ( t ) + Z R ( γ ) g i ( t ; x ( t ); γ ) ν ( dt ; dγ ) x ( t ) = x ( t, x o ) (cid:12)(cid:12)(cid:12) t =0 = x , i = 1 , n, t ≥ , (1)где w ( t )) – m -мерный винеровский процесс, ν ( t ; ∆ γ ) – однородная по t , нецентрирован-ная мера Пуассона [5]. Эту систему можно записать в векторной форме d x ( t ) = A ( t ; x ( t )) dt + B ( t ; x ( t )) d w ( t ) + Z R ( γ ) ν ( dt ; dγ ) · G ( t ; x ( t ); γ ) . a i ( t ; x ) , b ik ( t ; x ) и g i ( t ; x ; γ ) уравнения (1) будем предпола-гать, что они выбраны таким образом, чтобы были обеспечены условия существованияи единственности решения, как и во всех уравнениях, рассматриваемых ниже.В [1] было введено понятие первого интеграла для системы стохастических диффе-ренциальных уравнений Ито (без пуассоновской составляющей), в [3] – понятие сто-хастического первого интеграла для системы обобщенных стохастических дифферен-циальных уравнений Ито с центрированной пуассоновской мерой. Введем аналогичноепонятие для случая наличия нецентрированной меры Пуассона.Пусть u ( t ; x ; ω ) – случайная функция, определенная на том же вероятностном про-странстве, что и решение системы (1). Определение 1
Случайную функцию u ( t ; x ; ω ) назовем стохастическим первым ин-тегралом системы (1), если с вероятностью 1 u ( t ; x ( t ; x (0)); ω ) = u (0; x (0)) для любого решения x ( t ; x (0); ω ) системы (1). Чтобы функция u ( t ; x ; ω ) была первым интегралом системы (1), должны выполнять-ся условия L ) :1. n X i =1 b i k ( t ; x ) ∂u ( t ; x ) ∂x i = 0 , для всех k = 1 , m (компенсация винеровского возмуще-ния);2. ∂u ( t ; x ) ∂t + n X i =1 ∂u ( t ; x ) ∂x i h a i ( t ; x ) − m X k =1 n X j =1 b j k ( t ; x ) ∂b i k ( t ; x ) ∂x j i = 0 (независимость отвремени);3. u ( t ; x ) − u (cid:16) t ; x + G ( t ; x ; γ ) (cid:17) = 0 для любых γ ∈ R ( γ ) во всей области определенияпроцесса (компенсация пуассоновских скачков). Замечание 1
В случае, когда рассматриваем конкретную реализацию, т. е. пара-метр ω в дальнейшем не влияет, неслучайную функцию u ( t ; x ) можно считать де-терминированным первым интегралом стохастической системы. В [3] было введено понятие стохастического первого интеграла для центрированнойпуассоновской меры, и полученные условия для его существования учитывают необ-ходимость задания плотности интенсивности пуассоновского распределения в отличиеот предложенного в данной статье. Таким образом, безразлично, каков вероятностныйзакон имеют интенсивности пуассоновских скачков.
Определим вид системы обобщенных стохастических уравнений Ито с начальнымиданными, имеющей известный стохастический первый интеграл.2 еорема 1
Пусть функция u ( t, x ) – непрерывна вместе со своими производными посовокупности переменных ( t, x ) и случайная функция u ( t, x ; ω ) определена на том жевероятностном пространстве, что и решение системы стохастических дифференци-альных уравнений d x ( t ) = A ( t ; x ( t )) dt + B ( t ; x ( t )) d w ( t ) + Z R ( γ ) ν ( dt ; dγ ) · G ( t ; x ( t ); γ ) x ( t ) = x ( t, x o ) (cid:12)(cid:12)(cid:12) t =0 = x , t ≥ , (2) где x ∈ R n , n ≥ ; w ( t ) – m -мерный винеровский процесс; ν ( t ; ∆ γ ) – однородная по t ,нецентрированная мера Пуассона. Если u ( t, x ; ω ) является стохастическим первыминтегралом системы (2), то коэффициенты уравнения (2) и функция u ( t, x ) связаныследующими соотношениями:1. коэффициенты B k ( t ; x ) = n X i =1 b ik ( t ; x ) ~e i ( k = 1 , m ) – столбцы матрицы B ( t ; x ) , B k ( t ; x ) ∈ { q · M n +1 , } , M n +1 , – минор элемента h n +1 , матрицы H ( t ; x ) : H ( t ; x ) = ~e ~e . . . ~e n ∂u ( t ; x ) ∂t ∂u ( t ; x ) ∂x . . . ∂u ( t ; x ) ∂x n h h . . . h n . . . . . . . . . . . .h n +1 , h n +1 , . . . h n +1 ,n , (3)
2. коэффициент A ( t ; x ) принадлежит множеству функций, определяемых услови-ем A ( t ; x ) ∈ ( R ( t ; x ) + 12 n X k =1 (cid:20) ∂B k ( t ; x ) ∂ x (cid:21) · B k ( t ; x ) ) , (4) где (cid:20) ∂B k ( t ; x ) ∂ x (cid:21) – матрица Якоби для векторной функции B k ( t ; x ) ; C ( t ; x ) – алгеб-раическое дополнение элемента ~e матрицы H ( t ; x ) и det C ( t ; x ) = 0 ; матрица-столбец R ( t ; x ) , компоненты которой r i ( t ; x ) , i = 1 , n , определяются следующимобразом: C − ( t ; x ) · det H ( t ; x ) = ~e + n X i =1 r i ( t ; x ) ~e i ;
3. коэффициент G ( t ; x ; γ ) = n X i =1 g i ( t ; x ; γ ) ~e i при пуассоновской мере определяетсяпредставлением G ( t ; x ; γ ) = y ( t ; x ; γ ) − x , где y ( t ; x ; γ ) – решение системы диф-ференциальных уравнений ∂ y ( · ; γ ) ∂γ = det ~e ~e · · · ~e n ∂u ( t ; y ( · ; γ )) ∂y ∂u ( t ; y ( · ; γ )) ∂y · · · ∂u ( t ; y ( · ; γ )) ∂y n ϕ ( t ; y ( · ; γ )) ϕ ( t ; y ( · ; γ )) · · · ϕ n ( t ; y ( · ; γ )) · · · · · · · · · · · · ϕ n ( t ; y ( · ; γ )) ϕ n ( t ; y ( · ; γ )) · · · ϕ nn ( t ; y ( · ; γ )) (5)3 довлетворяющее начальному условию y ( t ; x ; γ ) (cid:12)(cid:12)(cid:12) γ =0 = x .Относительно произвольных функций h ij = h ij ( t, x ) , ϕ ij = ϕ ij ( t ; y ( · ; γ )) полагаем, чтоони выбраны таким образом, чтобы каждое семейство функций n h i o , n ϕ i o , опреде-ляемое условиями: h ij ( t, x ) = ∂h i ( t, x ) ∂x j , ϕ ij ( t ; y ( · ; γ )) = ∂ϕ i ( t ; y ( · ; γ )) ∂y j , составляло вместе с функцией u ( t ; x ) совокупность независимых функций. Доказательство.
Доказательство состоит из 3-х частей. . Воспользуемся первым из условий L ) : n X i =1 b i k ( t ; x ) ∂u ( t ; x ) ∂x i = 0 , для всех k = 1 , m .Если B k ( t ; x ) = n X i =1 b ik ( t ; x ) ~e i и ∇ x u ( t ; x ) = n X i =1 ∂u ( t ; x ) ∂x i ~e i , то это условие – есть условиеортогональности векторов B k ( t ; x ) и ∇ x u ( t ; x ) . Опираясь на определение векторногопроизведения в пространстве R n и его свойства, получаем утверждение для коэффици-ентов B k ( t ; x ) и, соответственно, матрицы B ( · ) = (cid:16) B ( · ) , . . . , B m ( · ) (cid:17) : B k ( t ; x ) ∈ q · det ~e . . . ~e n ∂u ( t ; x ) ∂x . . . ∂u ( t ; x ) ∂x n f . . . f n . . . . . . . . .f n . . . f nn ; где функции f i = f i ( t, x ) , i = 3 , n , такие, что f ij ( t, x ) = ∂f i ( t, x ) ∂x j вместе с функцией u ( t, x ) образуют совокупность независимых функций. . Воспользуемся вторым из условий L ) : ∂u ( t ; x ) ∂t + n X i =1 ∂u ( t ; x ) ∂x i h a i ( t ; x ) − m X k =1 n X j =1 b j k ( t ; x ) ∂b i k ( t ; x ) ∂x j i = 0 . Пусть Q ( t ; x ) = 1 + n X i =1 a i ( t ; x ) − n X i =1 m X k =1 n X j =1 b j k ( t ; x ) ∂b i k ( t ; x ) ∂x j . Следуя схеме, изложенной в работе [2], введем в рассмотрение векторы: обобщенныйградиент (cid:3) u ( t ; x ) = ∂u ( t ; x ) ∂t ~e + n X i =1 ∂u ( t ; x ) ∂x i ~e i и −→ Q ( t ; x ) = ~e + n X i =1 a i ( t ; x ) ~e i − n X i =1 m X k =1 n X j =1 b j k ( t ; x ) ∂b i k ( t ; x ) ∂x j ~e i . (cid:3) u ( t ; x ) и −→ Q ( t ; x ) ортогональны. Воспользо-вавшись снова определением векторного произведения и его свойства, получаем фор-мулу (3): −→ Q ( t ; x ) ∈ { det H } , где функции h i = f i ( t, x ) , i = 3 , n + 1 , такие, что h ij ( t, x ) = ∂h i ( t, x ) ∂x j вместе с функцией u ( t, x ) образуют совокупность независимыхфункций. Без ограничения общности, будем считать, что h ij ( t, x ) = f ij ( t, x . ) Введемвектор −→ e A ( t ; x ) = ~e o + n X i =1 a i ( t ; x ) ~e i = −→ Q ( t ; x ) + 12 n X i =1 m X k =1 n X j =1 b j k ( t ; x ) ∂b i k ( t ; x ) ∂x j ~e i и, в силу того, что коэффициент при ~e o должен быть равен 1, получаем: −→ e A ( t ; x ) ∈ ( C − ( t ; x ) · det H ( t ; x ) + 12 n X i =1 m X k =1 n X j =1 b j k ( t ; x ) ∂b i k ( t ; x ) ∂x j ~e i ) , где C ( t ; x ) – алгебраическое дополнение элемента ~e матрицы H ( t ; x ) , det C ( t ; x ) = 0 .Поскольку вектор C − ( t ; x ) · det H ( t ; x ) можно записать в виде: C − ( t ; x ) · det H = ~e + n X i =1 r i ( t ; x ) ~e i , то введем матрицу-столбец R ( t ; x ) с компонентами r i ( t ; x ) , i = 1 , n .Определение произведения матриц в данном случае допускает представление: n X i =1 m X k =1 n X j =1 b j k ( t ; x ) ∂b i k ( t ; x ) ∂x j = n X k =1 (cid:20) ∂B k ( t ; x ) ∂ x (cid:21) · B k ( t ; x ) , где (cid:20) ∂B k ( t ; x ) ∂ x (cid:21) – матрица Якоби для векторной функции B k ( t ; x ) . Следовательно, A ( t ; x ) определяется суммой матриц (4): A ( t ; x ) ∈ ( R ( t ; x ) + 12 m X k =1 n X k =1 (cid:20) ∂B k ( t ; x ) ∂ x (cid:21) · B k ( t ; x ) ) , . Исходя из третьего условия в L ) , для любых γ ∈ R ( γ ) должно выполнятьсяусловие: u ( t ; x ; ω ) − u (cid:16) t ; x + G ( t ; x ; γ ); ω (cid:17) = 0 . Это означает, что функция u ( t ; x ; ω ) является автоморфной при преобразовании ее ар-гумента x с помощью функции G ( t ; x ; γ ) . Определим условия, налагаемые на эту функ-цию. Следуя [3], положим: y ( t ; x ; γ ) = x + G ( t ; x ; γ ) . Для упрощения записи будем опус-кать параметр ω . Тогда u ( t ; x ) = u (cid:16) t ; y ( t ; x ; γ ) (cid:17) любых γ ∈ R ( γ ) или ∂u ( t ; x ) ∂γ = 0 и ∂u (cid:16) t ; y ( t ; x ; γ ) (cid:17) ∂γ ≡ n X i =1 ∂u (cid:16) t ; y ( t ; x ; γ ) (cid:17) ∂y i ∂y i ( t ; x ; γ ) ∂γ = 0 . ∇ y u (cid:16) t ; y ( · ; γ ) (cid:17) = n X i =1 ∂u (cid:16) t ; y ( · ; γ ) (cid:17) ∂y i ~e i и ∂ y ( · ; γ ) ∂γ = n X i =1 ∂y i ( · ; γ ) ∂γ ~e i ортогональны, и следовательно, связаны соотношением: ∂ y ( · ; γ ) ∂γ ∈ det ~e . . . ~e n ∂u (cid:16) t ; y ( · ; γ ) (cid:17) ∂y . . . ∂u (cid:16) t ; y ( · ; γ ) (cid:17) ∂y n ϕ . . . ϕ n . . . . . . . . .ϕ n . . . ϕ nn , (6)где функции ϕ i ( t ; y ) , i = 3 , n , такие что ϕ ij = ∂ϕ i ( t ; y ) ∂y j , составляют с функцией u (cid:16) t ; y ( · ; γ ) (cid:17) систему независимых функций. Поскольку y ( t ; x ; γ ) = x + G ( t ; x ; γ ) , то (6) можно рас-сматривать как систему дифференциальных уравнений, в которой неизвестной явля-ется функция y ( · ; γ ) . Разложим определитель (6) по первой строке. Следовательно, ∂ y ( · ; γ ) ∂γ = α n X i =1 S i ( y ( · ; γ )) ~e i , где α – произвольная функция, не зависящая от y . Такимобразом, получаем систему дифференциальных уравнений ∂y ( · ; γ ) ∂γ = αS ( y ( · ; γ )) , · · · ∂y n ( · ; γ ) ∂γ = αS n ( y ( · ; γ )) . Пусть y ( t ; x ; γ ; θ ) – решение этой системы, где θ – вектор постоянных, появившихся приее интегрировании. Поскольку условие ( ?? ) должно выполняться для любых t , x и γ ,то u ( t ; x ) = u (cid:16) t ; y ( t ; x ; γ ; θ ) (cid:17) = u (cid:16) t ; x + G ( t ; x ; γ ; θ ) (cid:17) = u (cid:16) t ; x + G ( t ; x ; γ ; θ ) (cid:17) , В частном случае, при некотором значении γ = γ o последнее равенство будет опреде-ляться условием G ( t ; x ; γ o ; θ ) = 0 . Без ограничения общности (при отсутствии скачка),положим: G ( t ; x ; γ o ; θ ) ≡ G ( t ; x ; 0) = 0 . Следовательно, функция G ( t ; x ; γ ) , обеспечивающая автоморфизм функции u ( t ; x ) опре-деляется представлением G ( t ; x ; γ ) = y ( t ; x ; γ ) − x , где y ( t ; x ; γ ) – решение системы диф-ференциальных уравнений (5) при начальном условии y ( t ; x ; γ ) (cid:12)(cid:12)(cid:12) γ =0 = x . Таким образом,последнее утверждение теоремы доказано. Очень часто возникает задачи управления динамической системой, в которой со-храняются заданные функционалы [6], причем влияние случайных возмущений, дей-ствующих на данную систему, должно быть сведено к минимуму. Понятие стохасти-ческого первого интеграла системы стохастических дифференциальных уравнений с6инеровскими и пуассоновскими возмущениями позволяет строить такие управления свероятностью 1, то есть полностью исключая влияние данных случайных возмущений.По аналогии с [7] введем следующее определение.
Определение 2
Программным движением стохастической системы d x ( t ) = h P ( t ; x ( t ))+ Q ( t ; x ( t )) · s ( t ; x ( t )) i dt + B ( t ; x ( t )) d w ( t )+ Z R ( γ ) G ( t ; x ( t ); γ ) ν ( dt ; dγ ) , (7) где w ( t ) – m -мерный винеровский процесс; ν ( t ; △ γ ) – нецентрированная пуассоновскаямера, будем называть решение x ( t ; x o , s ; ω ) , позволяющее с вероятностью при неко-тором управлении (программном управлении) s ( t ; x ) для всех t оставаться на неслу-чайном интегральном многообразии u (cid:16) t ; x ( t ; x o ) (cid:17) = u (0; x o ) , являющимся первым ин-тегралом уравнения (7) при заданных начальных условиях x ( t ; x o ) (cid:12)(cid:12)(cid:12) t =0 = x o . Таким образом, можно построить программное управление с вероятностью 1 длядинамической системы, подверженной случайному воздействию винеровских и пуассо-новских процессов.
Теорема 2
Программное управление, позволяющее с вероятностью 1 динамическойсистеме (7) при наличии винеровских и пуассоновских возмущений оставаться наинтегральном многообразии u (cid:16) t ; x ( t ; x o ); ω (cid:17) = u (0; x o ) , является решением системы,состоящей их уравнений (7) и (2), в которой коэффициенты второго уравнения и со-ответствующие коэффициенты первого определяются в соответствии с Теоремой 1.При этом определяются также реакции на случайные возмущения, обеспечивающиеэто программное управление. Рассмотрим на примере.
Пример 1
Найти управления и реакции на случайные возмущения, чтобы динамиче-ская система dx ( t ) dt = (cid:16) x ( t ) + x ( t ) + e − t + s ( t ; x ) (cid:17) dt + b ( t ; x ) dw ( t ) + Z R ( γ ) g ( t ; x ; γ ) ν ( dt ; dγ ) ,dx ( t ) dt = (cid:16) x ( t ) x ( t ) + e − t + s ( t ; x ) (cid:17) dt + b ( t ; x ) dw ( t ) + Z R ( γ ) g ( t ; x ; γ ) ν ( dt ; dγ ) , подверженная воздействию винеровского процесса и совершающая скачки по действи-ем пуассоновского процесса, с вероятностью 1 совершала движение по поверхности u ( t ; x ) = x e − x . Решение.
Сначала построим систему стохастических дифференциальных уравне-ний, для которой функция u ( t ; x ) = x e − x является детерминированным первым ин-тегралом. В соответствии с утверждением 2 теоремы 1 определим функцию, обеспечи-вающую автоморфизм функции u ( t ; x ) = x e − x . Тогда ∂u ( y ; t ) ∂y = − y e − y , ∂u ( y ; t ) ∂y = e − y ∂ y ( t ; x ; γ ) ∂γ = ∂y ( t ; x ; γ ) ∂γ∂y ( t ; x ; γ ) ∂γ = (cid:18) e − y y e − y . (cid:19) Решение этой системы с учетом начальных данных: y ( t ; x ; γ ) = 12 ln (cid:0) γ + e x (cid:1) , y ( t ; x ; γ ) = 2 x γe − x + x . Следовательно, преобразование g ( · ) = ( g ( · ) , g ( · )) ∗ , обеспечивающее функции u ( t ; x ) = x e − x автоморфизм, имеет функции-координаты: g ( t ; x ; γ ) = 12 ln (cid:0) γ + e x (cid:1) − x , g ( t ; x ; γ ) = 2 x γe − x . Теперь, в соответствии с теоремой 1, строим матрицу B (в данном случае – вектор-столбец, поскольку w ( t ) – одномерный винеровский процесс): B ( t ; x ) = q (cid:0) e − x , x e − x (cid:1) ∗ , где q = q ( t ; x ) , (cid:20) ∂B ( t ; x ) ∂ x (cid:21) = q (cid:18) − e − x x e − x e − x (cid:19) , (cid:20) ∂B ( t ; x ) ∂ x (cid:21) B ( t ; x ) = q (cid:18) − e − x (cid:19) = (cid:18) − q e − x (cid:19) . Опираясь на формулу (4) строим матрицу H ( t ; x ) и вычисляем ее определитель det H ( t ; x ) = det ~e ~e ~e − x e − x e − x f f f == ~e (cid:16) − f x e − x − f e − x (cid:17) + ~e (cid:16) f e − x (cid:17) + ~e (cid:16) f x e − x (cid:17) , где f i = f i ( t ; x ) , i = 1 , , . В итоге (из (4), коэффициенты вектора A = A ( t ; x ) имеютвид: a = − f f + 2 f x + 2 q e − x ,a = − f x f + 2 f x , и искомая система стохастических дифференциальных уравнений такова: dx ( t ) = (cid:20) − f f + 2 f x + 2 q e − x (cid:21) dt ++ q e − x dw ( t ) + Z R ( γ ) (cid:16)
12 ln (cid:0) γ + e x (cid:1) − x (cid:17) ν ( dt ; dγ ) dx ( t ) = (cid:20) − f x f + 2 f x (cid:21) dt ++ q x e − x ) dw ( t ) + Z R ( γ ) (2 x γe − x ) ν ( dt ; dγ ) x ( t ) + x ( t ) + e − t + s ( t ; x ) = − f f + 2 f x + 2 q e − x ,x ( t ) x ( t ) + e − t + s ( t ; x ) = − f x f + 2 f x . Или s ( t ; x ) = − f f + 2 f x + 2 q e − x − x ( t ) − x ( t ) − e − t ,s ( t ; x ) = − f x f + 2 f x − x ( t ) x ( t ) − e − t , где f i = f i ( t ; x ) , i = 1 , , , q = q ( t ; x ) . Реакция на возмущение, вызванное винеров-ским процессом, определяется матрицей-столбцом с элементами b ( t ; x ) = q e − x , b ( t ; x ) = q x e − x ) . Элементы для компенсатора пуассоновских скачков определяются следующим образом: g ( t ; x ; γ ) = 12 ln (cid:0) γ + e x (cid:1) − x ,g ( t ; x ; γ ) = 2 x γe − x . Выбор функций f i ( t ; x ) , i = 1 , , и q ( t ; x ) позволяет строить управление, опи-раясь на какие-либо условия, например, удобством для моделирования и реализацииуправления. Замечание 2
Отметим, что можно строить программное управления по многооб-разию, определяемому несколькими функциями [6] . Выводы
Применение теории стохастического первого интеграла позволяет строить с вероят-ностью 1 программные управления для динамической системы при наличии случайныхвозмущений, вызванных винеровскими [7] и пуассоновскими процессами.
Автор благодарен проф. В.А.Дубко за внимание к данной работе.