Điều khiển dự báo Tube - Mpc thích nghi cho hệ phi tuyến có khâu phi tuyến không biết trước thỏa mãn điều kiện liên tục lipschitz
Bài báo trình bày phương pháp điều khiển dự báo
MPC thích nghi - bền vững cho mô hình hệ phi
tuyến trong đó khâu phi tuyến không biết trước
thỏa mãn điều kiện liên tục Lipschitz. MPC là
phương pháp điều khiển dựa vào mô hình của hệ.
Vì thế, nếu mô hình hệ không biết rõ sẽ ảnh hưởng
đến chất lượng điều khiển, thậm chí không thể tìm
được lời giải. Ý tưởng chính của phương pháp là
dựa vào dữ liệu thu được trong quá trình vận hành
và điều kiện liên tục Lipschitz của hàm phi tuyến
chưa biết, chúng ta có thể xây dựng được hàm
chặn trên và hàm chặn dưới của hàm chưa biết
này, qua đó sai số của hàm xấp xỉ và hàm số thực
tế được chứng minh luôn nằm trong một khoảng
xác định được. Dựa vào khoảng bị chặn được xác
định này, bài toán điều khiển được đưa về phương
pháp điều khiển bền vững TubeMPC và hoàn toàn
có thể tìm được lời giải.
Trang 1
Trang 2
Trang 3
Trang 4
Trang 5
Tóm tắt nội dung tài liệu: Điều khiển dự báo Tube - Mpc thích nghi cho hệ phi tuyến có khâu phi tuyến không biết trước thỏa mãn điều kiện liên tục lipschitz
một từ phổ biến hơn ở thời điểm hiện tại là “học“ (learning). Trong bài báo này, đối tượng điều khiển được nghiên cứu là một hệ điều khiển phi tuyến bao gồm một hệ tuyến tính nối với một hàm phi tuyến không nhớ (memoryless), trong đó hàm phi tuyến này không biết trước, chỉ biết được hằng số Lipschitz của hàm số này. Cần tìm tín hiệu điều khiển để tối ưu hàm mục tiêu năng lượng khi đưa hệ về vị trí 0 và đảm bảo hệ ổn định, đồng thời tín hiệu điều khiển và các trạng thái của hệ phải nằm trong giới hạn kỹ thuật cho phép. Đã có những nghiên cứu trước đây về áp dụng MPC cho hệ phi tuyến tương tự, ví dụ [3, 4]. Những phương pháp này đảm bảo tính bền vững cho hệ dù không biết rõ hàm phi tuyến. Tuy nhiên, hạn chế của phương pháp này là vì được xây dựng dựa trên LMIs (Linear Matrix Inequalities), trong đó bài toán được đưa về tìm một elipsoid nằm trong một polytope tạo ra bởi các constraints (giới hạn) chứ không giải thẳng bài toán NLP (Nonlinear Programming), nên dẫn đến conservatism. Trong phương pháp được đề xuất dưới đây, thông tin được sử dụng để xây dựng hàm số chặn trên và chặn dưới của hàm phi tuyến nhằm giảm phần không tường minh xuống, đồng thời bài toán cũng được đưa về dạng NLP, qua đó giảm conservatism. Tiếp theo bài báo được bố cục như sau: Phần 2 trình bày rõ vấn đề cần được giải quyết dưới dạng toán học. Phần 3 và 4 trình bày ý tưởng và phương pháp. Phần 5 trình bày ví dụ minh họa và các kết quả mô phỏng. Cuối cùng, phần 6 là kết luận và định hướng nghiên cứu tiếp theo. 2. Vấn đề cần giải quyết Hệ phi tuyến được xem xét trong bài báo này là hệ phi tuyến phổ biến, ví dụ như hệ thống tay máy robot linh hoạt (xem [9]), được mô tả bởi phương trình: (1) Trong đó x, u lần lượt là vector biến trạng thái và tín hiệu điều khiển. A, B là ma trận trạng thái và ma trận tín hiệu vào, có chiều n × n và n × m. G và H là ma trận hằng đã biết và hàm số 𝛾(𝑧): 𝐑 ⟶ 𝐑 là khâu phi tuyến không biết rõ, giả thiết rằng chỉ có hằng số Lipschitz 𝐿 ≥ 0 của hàm phi tuyến đã biết trước, có nghĩa là với mọi 𝑧1, 𝑧2 ta luôn có: ||𝛾(𝑧1) − 𝛾(𝑧2)|| ≤ 𝐿||𝑧1 − 𝑧2||∀𝑧1, 𝑧2 ∈ 𝑅(2a) Và: (0) 0 (2b) Yêu cầu của bài toán là tín hiệu điều khiển và trạng thái của hệ luôn phải nằm trong giới hạn cho trước, giả thiết rằng hai tập giới hạn X và U này đều là tập lồi: x(k) X, u(k) , 0U k (3) Giả thiết mọi trạng thái của hệ 𝑥(𝑘) đều quan sát được và hệ điều khiển được hoàn toàn. Bài toán đặt ra là tìm tín hiệu điều khiển u để tối ưu năng lượng tiêu thụ của hệ, hay nói cách khác là phiếm hàm mục tiêu J đại diện cho năng lượng của hệ đạt giá trị nhỏ nhất. 3. Sử dụng dữ liệu để xây dựng hàm chặn trên và hàm chặn dưới Phần này sẽ trình bày cách xây dựng hàm chặn trên và hàm chặn dưới cho hàm phi tuyến 𝛾(𝑧) chưa biết. Giả thiết trong quá trình vận hành, chúng ta thu được các dữ liệu tương ứng của hàm số 𝛾(𝑧) dưới dạng bộ số (𝑧𝑖 , 𝛾𝑖) với 𝑖 = 1, , 𝑙, gọi là tập dữ liệu 𝒟. Giả thiết này thực hiện được vì theo giả thiết mọi trạng thái của hệ 𝑥(𝑘) đều quan sát được ở trên thì tại mỗi thời điểm k, ta luôn xác định được 𝑧(𝑘) và giá trị 𝛾(𝑧) từ (1). Đồng thời giả thiết bỏ qua sai lệch do đo đạc và thu thập dữ liệu. Không làm mất tính tổng quát, ta xét với bộ dữ liệu trong đó 𝑧 > 0 . Trường hợp 𝑧 < 0 thực hiện tương tự. Giả thiết bộ dữ liệu được sắp xếp theo thứ tự 0 < 𝑧1 < 𝑧2 < ⋯ 𝑧𝑙 . Gọi hàm �̅� và 𝛾 là hàm chặn trên và hàm chặn dưới của hàm phi tuyến 𝛾(𝑧) chưa biết, được xây dựng dựa vào giả thiết về hằng số Lipschitz (2) như sau. Xét tại điểm (𝑧𝑖 , 𝛾𝑖), vì hàm số 𝛾(𝑧) đi qua điểm này nên hàm số đó bắt buộc phải nằm trong vùng màu trắng như trên Hình 1. Tập hợp tất cả các điểm mà hàm số 𝛾(𝑧) phải đi qua, ta sẽ thấy bắt buộc hàm số này phải nằm trong miền nằm giữa hai hàm số liên tục có dạng răng cưa như trên Hình 1c. Vì các giá trị (𝑧𝑖 , 𝛾𝑖) xác định trong khoảng từ [0, 𝑧𝑙] nên hàm chặn trên và chặn dưới hoàn toàn xác định được trong miền này. Ký hiệu: Theo ký hiệu này ta có: ( 1) Ax(k)+G (z(k))+Bu(k), z(k)=Hx(k) x k max 1 max 1, 2,3..., 1 1 1 d z z Z Di d z z iiiZ Di KHOA HỌC - CÔNG NGHỆ 41 SỐ 65 (01-2021) TẠP CHÍ ISSN: 1859-316X KHOA HỌC CÔNG NGHỆ HÀNG HẢI JOURNAL OF MARINE SCIENCE AND TECHNOLOGY 0,i max i i d d z z Với cách xây dựng hai hàm chặn trên và chặn dưới �̅� và 𝛾 như trên, hiệu số giữa hai hàm này luôn này luôn bị chặn bởi: W (z)- (z) 2 WLd với W=2Ld . Nếu ta chọn một hàm nằm giữa hai hàm chặn trên và chặn dưới, tức là (z) (z) (z) , thì hiển nhiên ta sẽ có: (z)- (z) W (4) Và W hoàn toàn xác định được. Như vậy, thay vì cần hàm số 𝛾(𝑧), mà ta không biết, để tính toán tín hiệu điều khiển, ta có thể chọn một hàm �̃� bất kỳ nằm giữa hai hàm số chặn trên và chặn dưới để đưa vào bộ điểu khiển, đưa về bài toán MPC bền vững với sai số của hàm phi tuyến là W ước lượng được. Tiếp theo sẽ trình bày phương pháp điều khiển TubeMPC áp dụng cho trường hợp bài toán này. Hình 1a. Nếu ta biết điểm (𝒛𝒌, 𝜸𝒌) của hàm số chưa biết, điều kiện liên tục Lipschitz với hằng số Lipschitz L cho ta biết rằng hàm số chỉ có thể nằm trong miền có màu trắng, không thể nằm trong miền có màu xanh. Ranh giới miền màu xanh đậm có hệ số góc L Hình 1b. Nếu ta biết thêm điểm (𝒛𝒌+𝟏, 𝜸𝒌+𝟏) của hàm số chưa biết, tiếp tục áp dụng điều kiện liên tục Lipschitz cho ta biết rằng hàm số chỉ có thể nằm trong miền có màu trắng, không thể nằm trong miền có màu xanh Hình 1c. Khi ta có thêm nhiều điểm khác, miền mà hàm số có thể tồn tại (vùng màu trắng) hẹp lại, bị chặn bởi hai hàm liên tục có dạng răng cưa màu hồng và màu xanh lá như trên hình vẽ. Hiệu số của hai hàm này xác định được qua công thức (4) 4. TubeMPC cho bài toán điều khiển bền vững Ý tưởng của bài toán điều khiển TubeMPC là do đối tượng điều khiển thực tế có những sai số không biết, chỉ biết được các chặn trên của các sai số đó, trong khi phương pháp MPC cần phải có một mô hình tường minh của đối tượng. Giải pháp của phương pháp TubeMPC là ta chọn một mô hình đối tượng trên danh nghĩa (nominal system) và xây dựng bộ điều khiển MPC dựa trên mô hình danh nghĩa này, đồng thời đảm bảo rằng sai số giữa trạng thái của mô hình danh nghĩa so với trạng thái mô hình thực tế luôn nằm trong một giới hạn cho phép. Tưởng tượng hình học giống như ta giữ sai số 𝑒(𝑡) nằm trong một ống (tube), đó là lý do vì sao gọi là TubeMPC. Sau đây ta sẽ xét mô hình đối tượng danh nghĩa như sau: Trong đó, các ma trận A, B, C, G, H là các ma trận trong mô hình đối tượng thực tế (1), chỉ có hàm phi tuyến �̃� là khác với mô hình thực tế. Sự khác biệt đó dẫn đến trạng thái của hệ danh nghĩa �̃� khác với trạng thái 𝑥 của hệ thực tế. Phiếm hàm mục tiêu và hàm kết thúc được định nghĩa: T(x) : x PxE T TF(x,u) : x Qx u Ru Trong đó Q, R, P là các ma trận xác định dương có kích thước tương ứng. Bài toán tối ưu cần giải cho mỗi bước tính là: (6) (5) x(k 1) Ax(k) ( (k)) (k), z(k) Hx(k) G z Bu ( ) min (x( ), (k)) E(x(k N)) N u k k F k u KHOA HỌC - CÔNG NGHỆ 42 SỐ 65 (01-2021) TẠP CHÍ ISSN: 1859-316X KHOA HỌC CÔNG NGHỆ HÀNG HẢI JOURNAL OF MARINE SCIENCE AND TECHNOLOGY x( 1) x( ) ( x( )) ( ),k A k G H k Bu k �̃�(𝑘) ∈ 𝑋 ⊖ 𝑅(𝑘), �̃�(𝑘) ∈ 𝑈 ⊖ 𝐾𝑒𝑅(𝑘), �̃�(𝑘 + 𝑁) ∈ 𝐸 ⊖ 𝑅(𝑘 + 𝑁) Ký hiệu ⊖ là phép trừ Minkowski giữa hai tập. Nếu so sánh các điều kiện ràng buộc của hệ thực tế trong (3) với hệ danh nghĩa trong (6) sẽ thấy tập xác định của hệ danh nghĩa hẹp hơn do phải trừ đi các tập ℛ(𝑘). Tập ℛ(𝑘) xuất hiện do phải tính đến sai lệch W của hàm phi tuyến. Cụ thể, nếu chúng ta cho phép trạng thái �̃� của hệ danh nghĩa thuộc tập X, khi �̃� ở biên của X, do sai số tạo nên bởi tính không chính xác của hàm phi tuyến �̃�, chúng ta không thể chắc chắn rằng trạng thái thực tế 𝑥 vẫn thuộc tập X. Vì vậy, tập ℛ(𝑘) phải được tính toán sao cho không chỉ ở thời điểm 𝑘 hiện tại, mà tất cả các trạng thái từ 𝑘 đến 𝑘 + 𝑁, nếu (6) thỏa mãn thì chắc chắn trạng thái thực tế 𝑥 sẽ thuộc tập X. Để tính toán tập ℛ(𝑘) và đảm bảo sai số giữa hệ danh nghĩa và hệ thực tế luôn hữu hạn, chúng ta xét sai số của trạng thái giữa hai hệ: 𝑒(𝑘) = 𝑥(𝑘) − �̃�(𝑘) (7) Tín hiệu điều khiển cho hệ có dạng: 𝑢(𝑘) = �̃�(𝑘) + 𝐾𝑒𝑒(𝑘) (8) Trong đó thành phần �̃� được tính toán từ bộ điều khiển MPC dành cho hệ danh nghĩa, thành phần còn lại để ổn định hệ sai số với 𝐾𝑒 là tham số chọn được. Hệ sai số thu được khi sử dụng tín hiệu điều khiển (8) cho hệ (6), và trừ hệ (1) cho hệ (6) ta có: 𝑒(𝑘 + 1) = (𝐴 + 𝐵𝐾𝑒)𝑒(𝑘) + 𝐺𝑑(𝑘), Trong đó, 𝑑(𝑘) = 𝛾(𝑧(𝑘)) − �̃�(�̃�(𝑘)) (9) Tiếp theo sẽ trình bày tiêu chí chọn tham số 𝐾𝑒 cho hệ (9). Chú ý rằng 𝑑(𝑘) bị chặn bởi: ||𝛾(𝑧) − �̃�(�̃�)|| ≤ ||𝛾(𝑧) − 𝛾(�̃�)|| + ||𝛾(�̃�) − �̃�(�̃�)|| (10) Số hạng đầu tiên trong về trái được chặn bởi (sử dụng tính liên tục Lipschitz ở (2)): ||𝛾(𝑧) − 𝛾(�̃�)|| ≤ 𝐿||𝑧 − �̃�|| ≤ 𝐿||𝐻||||𝑥 − �̃�|| = 𝐿||𝐻||||𝑒|| Và số hạng thứ hai của (10) bị chặn bởi (4). Từ đó, ta có chặn trên của tín hiệu 𝑑(𝑘): ||𝑑(𝑘)|| ≤ �̃�||𝑒(𝑘)|| + 𝑊 (11) với �̃� = 𝐿||𝐻||. Như vậy, nếu xét hệ sai số (9) như một hệ có trạng thái là 𝑒(𝑘) và tín hiệu nhiễu là 𝑑(𝑘) và 𝑑(𝑘) bị chặn bởi (11), câu hỏi đặt ra làm thế nào để chọn được 𝐾𝑒 sao cho 𝑒(𝑘) không tiến đến vô cùng (khi đó, sai lệch giữa trạng thái hệ thực tế và hệ danh nghĩa là rất lớn). Đồng thời, khi đã chọn được 𝐾𝑒 để 𝑒(𝑘) hữu hạn, làm thế nào để tính được giá trị cực đại của 𝑒(𝑘) khi đó, vì từ giá trị cực đại của 𝑒(𝑘) ta có thể tính được giá trị cực đại cho phép của �̃� theo quan hệ (7), hay nói cách khác chính là tính tập ℛ(𝑘). Bài toán này chính là bài toán tính tập bất biến (invariant set) trong điều khiển phi tuyến ([2]). Một cách để giải bài toán này là đưa bài toán về LMI để tính ra một xấp xỉ ngoài (outer approximation) của tập này dưới dạng ellipsoid như đề cập trong [8]. Cụ thể bài toán được đưa về tìm giá trị Ω > 0 và Θ để hệ LMI sau đây có nghiệm: 𝜏1�̃� + 𝜏2 ≤ 1, �̃� = 2𝑊 2 (12) Khi đó 𝐾𝑒 được xác định bằng công thức: 𝐾𝑒 = ΘΩ −1 (13) Vì bài toán đã được đưa hoàn toàn về bài toán Tube MPC tiêu chuẩn được đề cập trong [6] nên dẫn đến kết quả sau. Xét đối tượng điều khiển (1) thỏa mãn điều kiện (2). Nếu bài toán tối ưu (6) tồn tại lời giải �̃�(𝑘) thì hệ thống thực tế (1) được điều khiển bởi tín hiệu (8) sẽ thỏa mãn điều kiện (3) về giới hạn của trạng thái và tín hiệu điều khiển ([6]). Vì bài toán đã được đưa hoàn toàn về bài toán Tube MPC tiêu chuẩn được đề cập trong [6] nên kết quả này được trực tiếp có được từ các kết quả trong [6]. 5. Ví dụ và kết quả mô phỏng Trong phần này một ví dụ sẽ được trình bày để minh họa phương pháp thiết kế bộ điều khiển dự báo bền vững đã trình bày ở trên. Xét đối tượng điều khiển là một tay máy robot ([9]) (Hình 2) được mô tả bởi phương trình toán như sau: 𝑥1(𝑘 + 1) = 𝑥1(𝑘) + 0.05 𝑥2(𝑘) 𝑥2(𝑘 + 1) = −2,43𝑥1(𝑘) − 0,9375𝑥2(𝑘) + 2.43𝑥3(𝑘) + 1,08𝑢(𝑘) 𝑥3(𝑘 + 1) = 𝑥3(𝑘) + 0,05𝑥4(𝑘) 𝑥4(𝑘 + 1) = 0,975𝑥1(𝑘) − 0,835𝑥3(𝑘) + 𝑥4(𝑘) − 0.1665𝑔(𝑥3(𝑘)) Trong đó hàm số g(z) là hàm phi tuyến, có dạng: 𝑔(𝑧) = 0,25(𝑧 + 𝑠𝑖𝑛(𝑧)) Như vậy hàm g(x) luôn nằm giữa miền 0 ≤ 𝑔(𝑧) ≤ 0.5𝑧, thỏa mãn điều kiện (2) với L=0,5. Trạng thái ban đầu của hệ tại x0=(1;0,2;0;0). Yêu Hình 2. Mô hình tay máy robot KHOA HỌC - CÔNG NGHỆ 43 SỐ 65 (01-2021) TẠP CHÍ ISSN: 1859-316X KHOA HỌC CÔNG NGHỆ HÀNG HẢI JOURNAL OF MARINE SCIENCE AND TECHNOLOGY cầu điều khiển về gốc tọa độ với: |𝑢| < 1,5, |𝑥1| < 𝜋 2⁄ , |𝑥3| < 𝜋 2⁄ Phiếm hàm mục tiêu có Q= 0,01diag(1;0,1;1;0,1), R= 0,01. Dữ liệu được giả thiết có sẵn từ các lần hoạt động trước. Giải hệ LMI (12,13) ta thu được 𝐾𝑒 = [−4,8; −1,2; 2,6; −0.5]. Các tập giới hạn trong (6) được tính bằng toolbox MPT3 (https://www.mpt3.org/) trên nền Matlab. Bài toán bền vững MPC (6) được giải bằng toolbox do- mpc (www.do-mpc.com) trên nền Python. Kết quả mô phỏng được thể hiện trên Hình 3 cho thấy tín hiệu điều khiển u luôn nằm trong giới hạn cho phép từ -1,5 đến 1,5 và các ràng buộc về giới hạn đối với trạng thái x1 và x3 đều được thỏa mãn. Như vậy phương pháp điều khiển được đề xuất giải quyết hoàn toàn được bài toán điều khiển đề ra. Hình 3. Kết quả mô phỏng các trạng thái và tín hiệu điều khiển của hệ 6. Kết luận Bài báo đã trình bày một phương pháp điều khiển dự báo thích nghi - bền vững dành cho hệ phi tuyến có hàm số phi tuyến chưa biết với giả thiết hàm số đó liên tục Lipschitz với hằng số L dưới các điều kiện ràng buộc về trạng thái và tín hiệu điều khiển. Vì phương pháp điều khiển dự báo MPC phụ thuộc vào mô hình đối tượng nên việc tận dụng các dữ liệu thu được trong quá trình vận hành để học thêm về mô hình của hệ góp phần nâng cao chất lượng điều khiển. Bằng các chứng minh toán học rõ ràng và ví dụ minh họa được mô phỏng, bài báo đã cho thấy phương pháp thiết kế bộ điều khiển giải quyết được bài toán đề ra. Bài báo là bước đầu của các nghiên cứu mở rộng sau này. Một hướng nghiên cứu khả dĩ có thể được mở rộng ra cho bài toán khi các dữ liệu đo đạc không chính xác, có kèm theo nhiễu đo. Việc không bỏ qua sai số đo đạc sẽ góp phần cải thiện hơn nữa chất lượng điều khiển. TÀI LIỆU THAM KHẢO [1] Basil Kouvaritakis, Mark Cannon: Model Predictive Control, Springer, 2016. [2] Stephen Boyd, Laurent El Ghaoui, Eric Feron, Venkataramanan Balakrishnan: Linear matrix inequalities in system and control theory, SIAM, 1994. [3] Rolf Findeisen, Frank Allgöwer, Lorenz T. Biegler: Assessment and Future Directions of Nonlinear Model Predictive Control (Lecture Notes in Control and Information Sciences), Springer, 2007. [4] Sasa V. Rakovic, William S. Levine: Handbook of Model Predictive Control, Birkhause, 2019. [5] Lars Grune, Jurgen Pannek: Nonlinear Model Predictive Control: Theory and Algorithms, Springer, 2017. [6] D.Q. Mayne, E.C. Kerrigan, E. Van Wyk, and P. Falugi, Tube-based robust nonlinear model predictive control, International Journal of Robust and Nonlinear Control, Vol.21(11), pp.1341-1353, 2011. [7] G. Beliakov, Interpolation of Lipschitz functions, Journal of Computational and Applied Mathematics, Vol.196(1), pp.20-44, 2006. [8] J. Lofberg, Min-Max Approaches to Robust ModelPredictive Control, Dissertation, Link ̈oping University, 2003. [9] C. Bohm, S. Yu, R. Findeisen, and F. Allgower, Predictive control for Lure systems subject to constraints using LMIs, 2009 European Control Conference (ECC), pp.3389-3394, 2009. Ngày nhận bài: 25/12/2020 Ngày nhận bản sửa: 09/01/2021 Ngày duyệt đăng: 18/01/2021
File đính kèm:
- dieu_khien_du_bao_tube_mpc_thich_nghi_cho_he_phi_tuyen_co_kh.pdf