دانلود پایان نامه

شکل(36-1) ساختار کنترل عصبی تطبيقی
کنترل کننده مبتنی بر برنامه ريزی ديناميکی تطبيقی روشی است برای حل مسئله پيچيده تئوری کنترل بهينه کلاسيک که برای محاسبه قانون کنترل بهينه بايد تابع هزينه بهينه محاسبه گردد. برنامه ريزی ديناميکی برای حل اين گونه مسائل از معادله بهينگی بلمن استفاده می کند. روش حل برنامه ريزی ديناميکی تطبيقی برای آموزش روی خط تابع هزينه بهينه و قوانين کنترل بهينه طراحی می شود. در هر پله زمانی، کنترل کننده تابع هزينه بهينه را با بردن سيستم از وضعيت فعلی به حالت نهايی، تخمين می زند. در مراجع[24] و[25] بصورت کامل درباره اين روش توضيح داده شده است.
با توجه به ساختار توضيح داده شده ، هر کدام ازکنترل کننده های فوق برای موارد زير استفاده می شوند:
از يک کنترل کننده مرتبه سوّم ، تک ورودی – تک خروجی عصبی تطبيقی برای تعقيب فرمانهای ناشی از سيستم فرمان، کنترل سرعت و کاهش Yaw استفاده می شود.
از کنترل کننده مرتبه چهار خطی برنامه ريزی ديناميکی تطبيقی برای مديريت بهينه انرژی استفاده می شود.
برای حل مسئله بهينه سازی ، تابع هزينه و قيد بصورت معادله (48-1) می باشد:
(48-1)
تابع هزينه (48-1) هم برای کنترل سرعت و هم برای استراتژی مديريت انرژی بکار می رود. در معادلات (48-1) ، v و vcom سرعتهای واقعی و درخواست شده بوده ، Pc و Pf توانهای لحظه ای توليد شده توسط پيل سوختی و چرخ طيّار می باشد. α و β فاکتور های وزنی مثبت می باشند. قيد مربوط به توان چرخ طيار نشان دهنده اين است که هرگونه توان کشيده شده از چرخ طيار بايد در نهايت باز گردانده شود و توان ذخيره شده در چرخ طيار نيز بايد برای به حرکت درآوردن موتور الکتريکی استفاده شود. ساختار کلی کنترل کننده مورد نظر در شکل(37-1) نشان داده شده است.

شکل(37-1) ساختار کنترل کننده مورد نظر برای خودرو هايبريد برقی
در اين ساختار سيستم کنترل سرعت و مديريت انرژی بصورت کنترل کننده غيرخطی سرعت و سيستم خطی مديريت انرژی تجزيه شده اند. در اين ساختار از برنامه ريزی ديناميکی خطی استفاده شده است که به شرح مختصری درباره آن پرداخته می شود. فرض کنيد سيستم خطی رابطه (49-1) مفروض باشد:
(49-1)
X(0)=X0 معيار عملکردی مربعی نيز بصورت رابطه (50-1) می باشد:
(50-1)
که Q ماتريس متقارن مثبت و R ماتريس معين مثبت می باشد. براساس تئوری تنظيم کننده کلاسيک، سيگنال کنترل بهينه بصورت رابطه (51-1) می باشد:
(51-1)
که درآن P ماتريس يکتا متقارن معيّن مثبت که از حل معادله ريکاتی (52-1) حاصل می شود.
(52-1)
در ساختار کنترلی ADP ، زمان به بازه های زمانی [ti:ti+1] با t0=0 تقسيم می شود. با فرض اوليه P0 برای معادله ريکاتی ، قانون کنترل بهينه بصورت رابطه (53-1) در می آيد:
(53-1)
که در بازه زمانی [t0,t1] به سيستم اعمال می شود.