پایان نامه ارشد درمورد حداقل مربعات معمولی و برآورد پارامترها

یکی از مفروضاتی که در رگرسیون مدنظر قرار می‌گیرد، عدم وجود خود‌همبستگی یا همبستگی پیاپی بین خطاها (تفاوت بین مقادیر واقعی و مقادیر پیش‌بینی‌شده توسط معادله رگرسیون) است. در الگوی رگرسیون فرض می‌شود که خطاها یک متغیر تصادفی هستند و نسبت به یکدیگر هیچ رابطه‌ای نداشته (مستقل از یکدیگرند)، یا به عبارت دیگر:
E (uiuj) i≠j=۰
E (ui, ui+h) h≠۰=۰
به عبارت دیگر، کوواریانس بین جملات خطا برابر با صفر خواهد بود.
معادله رگرسیون برازش شده در کل معنادار باشد. برای آزمون معنا‌داری کلی مدل از آماره F در سطح ۹۵% استفاده می‌شود.
خطاهای معادله دارای توزیع نرمال با میانگین صفر باشند. برای بررسی نرمال بودن خطاهای معادله، مقادیر استاندارد خطاها محاسبه‌شده، منحنی اجزای خطا در مدل رگرسیون رسم می‌گردد و سپس با نمودار نرمال مقایسه می‌شود.
بین متغیرهای مستقل موجود در الگوی رگرسیون همبستگی وجود نداشته باشد (دارای هم خطی نباشند)؛ زیرا در صورتی که شدت رابطه بین متغیرهای مستقل بسیار زیاد باشد، اندازه‌گیری جداگانه اثرات هر یک از متغیرها بر روی متغیر وابسته دشوار است.
آزمون استقلال خطاها
به منظور بررسی استقلال خطاها از یکدیگر از آزمون دوربین-واتسون استفاده می‌شود. به طور كلي آزمون دوربين واتسون همبستگي سريالي بين باقيمانده (خطا) هاي رگرسيون را آزمون مي‌نمايد. مقدار اين آماره بين ۰ تا ۴ تغيير مي‌كند. اگر همبستگي بين ماندههاي متوالي وجود نداشته باشد، مقدار آماره بايد نزديك ۲ شود. اگر مقدار آماره نزديك به صفر شود، نشان‌دهنده همبستگي مثبت بين باقيمانده‌ها و اگر نزديك به ۴ شود، نشان‌دهنده همبستگي منفي بين باقیمانده‌های متوالي است. به طور کلی اگر آماره دوربین- واتسون بین ۵/۱ و ۵/۲ قرار گیرد، میتوان فرض عدم وجود همبستگی بین خطاهای مدل را پذیرفت (مومنی، ۱۳۸۶).
آزمون مناسب بودن مدل
براي آزمون مناسب بودن مدل تخمين شده، ابتدا اين فرض را مطرح مي‌سازيم كه مدل تغييرات Y را به صورت معنی‌داري توجيه نمي‌كند. براي آزمون فرض مزبور، از آماره F استفاده مي‌كنيم. اگر در سطح خطاي α (در اين تحقيق ۵%) مقدار آماره F از مقدار جدول بيشتر باشد، فرض صفر رد می‌شود و مي‌توان گفت تغييرات توجيه شده توسط مدل مناسب است و يا اينكه رابطه معناداري بين متغير وابسته و متغیر مستقل وجود دارد. همچنين اگر سطح معناداري مدل (sig) كمتر از سطح خطاي α (در اين تحقيق ۵%) باشد، فرض صفر رد و چنين استنباط می‌شود كه مدل تغييرات F را به صورت معناداری توجيه می‌نماید (يعني مدل مناسب است).
آزمون معنادار بودن ضرايب
به منظور آزمون معنی‌دار بودن هر يك از ضرايب برآوردی رگرسیون فرض می‌شود كه ضريب رگرسيون برابر صفر است و به عبارتي متغير مستقل بر متغير وابسته تأثیری ندارد؛ یعنی فرضیه صفر به صورت زیر بیان می‎‌گردد:
H0: β = 0
در مقابل آن فرضیه رقیب بیان می‌دارد که متغیر مستقل در تغییرات متغیر وابسته موثر واقع می‌شود یعنی:
H1: βi ≠ 0
براي آزمون اين فرضيات از آزمون t استیودنت، در سطح معناداری ۵% استفاده می‌شود. اگر در سطح اطمينان ۹۵% (خطاي ۵%(=) قدر مطلق t بدست آمده از آزمون، بزرگ‌تر از t بدست آمده از جدول با همان درجه آزادي باشد، فرض H0 رد شده و در غير اين صورت تأیید می‌شود. در اين آزمون رد H0 به معني معنا‌دار بودن ضريب مورد نظر و عدم رد H0 به مفهوم بی‌معنا بودن ضريب مورد نظر است.
بررسي ساختار دادههاي تركيبي و انواع مدلهاي آن
در این تحقیق، با توجه به نوع دادهها و روش‌های تجزیه و تحلیل آماری موجود، از روش دادههای ترکیبی و مقطعی برای برآورد پارامترهای الگو و بررسی آزمون فرضیهها استفاده شده است. روش دادههای ترکیبی که به روش دادههای مقطعی – سری زمانی نیز معروف است، به شکلهای مختلف انجام ‌شده و مدلهای متنوعی دارد که با توجه به شرایط تحقیق از یکی از آن‌ها استفاده می‌شود.
استفاده از روش دادههای مقطعی ممکن است با مشکلات عدم کارایی و ناسازگاری تخمین مدلها همراه باشد. مشکلات مزبور در تخمین مدلها به روش دادههای ترکیبی و با استفاده از روشهایی مانند مدل اثر ثابت ، مدل اثر تصادفی ، مدل رگرسیون به ظاهر نامرتبط و مدل دادههای یکپارچه شده ، وجود نخواهد داشت. در بررسی دادههای مقطعی و سری زمانی، اگر ضریب اثرات مقطعی و اثر زمانی معنیدار نشود، میتوان تمامی دادهها را با یکدیگر ترکیب کرده و به وسیله رگرسیون حداقل مربعات معمولی تخمین زد. به این روش، دادههای تلفیق‌شده نیز میگویند. مدلهای اثر ثابت و اثر تصادفی به سبب اهمیت، در این قسمت به اختصار توضیح داده میشوند:
مدل اثر ثابت
در مدل اثر ثابت، شیب رگرسیون در هر مقطع ثابت است و جملهی ثابت از مقطعی به مقطع دیگر متفاوت است. هر چند اثر زمانی معنیدار نیست، اما اختلاف معنیداری میان مقطعها وجود دارد و ضرایب مقطعها با زمان تغییر نمیکند. یکی از روش‌های نشان دادن اثر مقطعی استفاده از متغیرهای مجازی است. شکل کلی این مدل به صورت زیر است: (فرمول 3-6)

در این رابطه، Xit نشان‌دهنده‌ی برداری از متغیرهای مستقل، DUM متغیر مجازی برای نشان دادن اثر مقطعی، Yit برداری از متغیرهای وابسته و eit جملات خطای معادله است. در مدلهای اثر ثابت که شیب ثابت دارند، فرض می‌شود که واریانس خطاها در مقطع و همچنین، بین مقاطع همسان است و خود همبستگی بین اجزای خطای آن وجود نداشته باشد. به بیان دیگر، برای هر t≠s و i≠j رابطهی زیر برقرار است (اشرف زاده و مهرگان، ۱۳۸۷؛ زراءنژاد و انواری، ۱۳۸۴).