سرانجام در مشاهدات ۶۶ تا ۷۵ میانگین جمعیت برای اولین مولفه یک انحراف معیار به پایین و برای دومین مولفه یک انحراف معیار به بالا منتقل شدهاند یعنی:
یادآوری میشویم ۵۰ مشاهدهی اول دو متغیره از توزیع نرمال با بردار میانگین زیر تولید شده است:
باید دو مجموعه مقادیر هدف را در نظر گرفت: اولین مجموعه را ارضا میکند یعنی میانگینهای استفاده شده برای تولید دادهها به عنوان مقادیر هدف می باشند. در مجموعه دوم مقادیر هدف عبارتند از:
با آزمون فرضیهای که داده های تولید شده از جهت، با اهداف از پیش تعیین شده سرچشمه میگیرند آغاز میکنیم یعنی بعلاوه اگر فرض کنیم ماتریس کوواریانس معلوم باشد (یعنی همانطور که در دادههای شبیهسازی شده داشتیم) میتوانی برای هر مشاهده در نمونهی آزمایشی آمارهی زیر را محاسبه میکنیم و مقادیر آنرا با مقادیر بحرانی از توزیع خی دو با دو درجه آزادی (اصلvi را در بخش دوم ببیند) مقایسه میکنیم:
ماتریس کوواریانس میتواند از نمونه پایه با ماتریس تجربی s تخمین زده شود. آمارهی نتیجه شده با مقادیر بحرانی بر مبنای توزیع F که در این فصل ارائه میگردد مقایسه میشوند. اکنون برای هر ۲۵ مشاهده نمونه آزمایشی (یعنی تک مشاهدهی (y) همانطور که آزمون t تک متغیره را برای هر کدام از دو مولفه انجام دادیم آزمون چند متغیره را برای آمارهی انجام میدهیم. یادآوری میگردد که آزمون مشابه را در بخش قبل برای ۵۰ مشاهدهی اول نمونه پایه انجام دادیم.
در آزمون چند مغیره فرضیهی صفر این است که میانگین مشاهدات دو متغیره همانطور که آزمون تک متغیره هر دومولفه جداگانه بیان شد عبارت زیر را ارضا کند.
مقادیر بحرانی از توزیع بدست آمده و برای
به ترتیب عبارتند از ,۱۳,۶۹۳,۱۲٫۱۰۳,۶٫۵۱۵ مقادیر بحرانی متناظر تست t دو طرفه برای های بالا به ترتیب ۲٫۰۱,۲٫۹۴,۳٫۱۶ هستند.نتایج در جدول ۳٫۳ آمده است.
جدول ۲-۳:
میانگین ها با مقادیر خارجی (۴۹۹۱,۶۰۰۵) که پارامترهای مورد استفاده برای تولید داده ها هستند. ماتریس s از نمونه پایه (۵۰ مشاهده) دادههای نمونه آزمایشی عبارتند از]۲۴[:
برای هر کدام از سه زیر مجموعه نمونه آزمایشی (به ترتیب به اندازههای ۵و۱۰و۱۰) در جدول ۴٫ ۳ تعداد مشاهداتی که هر فرض صفر رو میشود آمده است.
زیر مجموعهی نخست شامل ۵ مشاهده که تحت کنترل است همانطور که انتظار می رفت عمل میکند و در هیچ یک از مشاهدات از مقادیر بحرانی متناظر تخطی نمیکند. در زیر مجموعه دوم شامل ۱۰ مشاهده که تنها میانگین مولفهی اول (با دو انحراف استاندارد) تغییر کرد می بینیم که توان تجربی آزمون چند متغیر از آزمون تک متغیره ی صورت گرفته روی متغیر موثر، تخطی میکند. تک مشاهدهای که نشان میدهد مولفه ی دوم از مقدار بحرانی در تخطی می کند خطای نوع I است زیرا میانگین تغییر نکرده است
جدول ۲-۴
تعداد مردودین فرض برای سه نمونه آزمایشی]۲۴[
.
مجموعه دوم مقادیر هدف را در نظر میگیریم ( که به عنوان میانگینهای مورد استفاده برای تولید دادهها تعریف میشوند، ولی تنها با یک رقم اعشار) یعنی:
برای ۵۰ مشاهدهی نمونه پایه مثل ۵ مشاهدهی اول نمونه آزمایشی اهداف توزیع دو متغیرهی - از میانگینهای احتمالاً نامعلوم انحراف دارند. انحرافات برای دیگر مشاهدات آزمایشی مهم تر هستند.
نتایج آزمون ۵۰ مشاهدهی نمونه پایه با ماتریس تخمینی S در جدول ۳٫۵ ارائه شدهاند، نتایج نمونهی آزمایشی در جدول ۲-۶ آمده است .
جدول ۲-۵:
میانگینها، مقادیر خارجی (۴۹۹,۶۰٫۰) ، ماتریسs از نمونه پایه ۵۰ مشاهدهای محاسبه شده است داده ها نمونه پایه عبارتند از]۲۴[:
جدول ۳-۶:
میانگینها، مقادیر خارجی (۴۹٫۹,۶۰٫۰) ، ماتریسs از نمونه پایه ۵۰ مشاهدهای محاسبه شده است داده ها نمونه پایه عبارتند از]۲۴[:
جدول ۳-۷ تعداد مشاهدات که فرض صفر هر دو نمونه پایه و نمونههای آزمایشی را رو میکند ارائه میدهد. باز مشاهده میکنید که موفقیت آزمون تک متغیره برای یافتن انحرافات از آزمون چند متغیره کمتر است.
جدول ۳-۷ :
تعداد مردودین فرض برای سه نمونه آزمایشی]۲۴[
در مقدمه اشاره کردیم که آمارهی پیرامون متغیرهایی که علائم خارج از کنترل را سبب شدهاند اطلاعا مهمی را فراهم نمیکند. در مثال قبل دیدیم توان تستهای یک متغیره از تست چند متغیره کمتر است. آزمون تک متغیره چندتایی به دلیل مقایسات متعدد شکل مرکب دارد که زمانی است که سطح معنی برآرود شده باشد (تخمیمی). در فصل هفتم روشهای دیگر برای یافتن متغیرهای دور از مرکز[۳۷] ارائه میگردد، که تعمیم آزمون چند متغیره و استفاده از اطلاعات همهی متغیرها و ساختار ماتریس کوواریانس آنها هستند.
.در مثال دوم اهداف خارجی اطلاعات واقعی مطالعه موردی سوم استفاده میکنیم که متغیرها ابعاد چندین قطعهی سرامیکی است. مواد خام که در تولید استفاده میگردند شامل اجزائی نظیر رنگها، چسبها و زیر لایه های سرامیکی هستند. صفحات سرامیکی چاپ و در کوره قرار داده می شوند پس لایههای رسانا و نارسانا، مقاومتی و طلا یا پلاتین به صفحات افزوده میشوند. قدمهای بعدی شامل آمادهسازیهای لیزری و نصب اجزاء و لحیمکاری جزئی با اتصال سیم چیپ است. آخرین مرحلهی ساخت، بستهبندی محصول نهایی است. اولین دسته های[۳۸] تولیدی (مراجع مشخص شده) کیفیت بسیار بالای تولید را فراهم میکنند که همهی سطوح تولید بدون شیب و تعمیر هستند. بنابراین پومین اولین قطعات به عنوان استاندارد برای بقیهی بستهها در نظر گرفته می شوند. ۵ بعد با نشانهگذاری (a,b,c,w,l) در مطالعه موردی سوم در نظر گرفته میشوند. سه بعد اول با فرایند ثبت لیزری[۳۹] تعیین می گردند و دوتای آخر ابعاد خارجی هستند. در این مثال تنها سه بعد اول را در نظر میگیریم.
نمونه مرجع ابعاد (a,b,c)=(199,550,615,550,923) را بر حسب mm دارند. مشخصات اسمی مهندسی تولید (۲۰۰ ۵۵۰ ۵۵۰) میباشد، تعریف مجدد ابعاد (a,b,c) به صورت انحراف از مشخصات اسمی مقادیر هدف، فرضیهی صفر برای آزمون سه بار میانگین جمعیت عبارتند از:
جدول ۳-۸:
ابعاد در نمونه مرجع موردی سوم ]۲۴[
میانگینها (با توجه به مرکز مشخصات اسمی) و ماتریس s-1 نمونه مرجع از جدول ۳٫۶ آمده است. چون نمونه مرجع۱۳ واحد دارد پس n=13 است:
چون باید H0 را در سطح معنی[۴۰] ۱درصد رد کنیم بنابراین نتیجه میگیرم که به طور متوسط اگر چه نمونه مرجع شدیداً کیفیت خوبی دارد ولی مشخصات اسمی مورد نیاز را برآورده نمیکند.
گروهبندی دادهها:
اگر نمونه آزمایشی به اندازهی n1 در k زیر گروه منطقی به اندازه های njو گروهبندی شوند، ماتریس کوواریانس آمیخته[۴۱] از k ماتریس کوواریانس نمونه تخمین زده می شود یعنی:
بعلاوه اگر اندازهی همهی زیر گروهها مساوی باشد یعنی n1=kn ماتریس کوواریانس sp میانگین k ماتریس مجزا میباشد.
وقتی میخواهیم میانگین زیر گروه jام از n مشاهده را آزمون کنیم آمارهی آزمون عبارت است از:
که yj میانگین n مشاهدهی زیر گروه است. مقدار بحرانی آزمون فرضیه که j امین زیر گروه فقط انحرافات تصادفی از مقدار هدف داشته باشد عبارت است از:
گروهبندی دادهها همچنین ما را قادر میسازد معیار تغییرپذیری درونی زیر گروه را محاسبه کنیم که برای jامین زیر گروه عبارت است از:
که ،iامین مشاهدهی زیر گروه jام است. با در نظر گرفتن همهی مشاهدات زیر گروه jام، توجه به اهداف m0 یک معیار تغییرپذیری کل بدست میآید.
مقادیر بحرانی برای را میتوان رابطهی زیر تخمین زد:
که امین درصد توزیع فی دو با P درجه آزادی است. این تخمین بر مبنای تعویض sp با در فرمول محاسبهی است.
برای تشریح آمارههای آزمون[۴۲] از یک حالت تعمیم یافتهی مجموعه دادههای شبیهسازی شده استفاده میکنیم که در فصل دوم ارائه گردید. علاوه در ۱۰۰ مشاهدهی اول (۵۰ گروه با اندازهی۲) ۹۰ مشاهدهی اضافی گروهبندی شده ( در زیر گروه به سایز۲) تولید میکنیم که توزیع آنها به صورت زیر است:
پارامتر مشاهدات ۱۱۰-۱۰۱ بر پایهی منطق نمونهی مرجع است. میانگین جمعیت برای اولین مولفه ی مشاهدات ۱۳۰-۱۱۱ با دو انحراف استاندارد بالا منتقل شده است یعنی داریم:
در مشاهدات ۱۵۰-۱۳۱ میانگین جمعیت جزء اول یک انحراف استاندارد به پایین و جزء دوم به بالا منتقل شدهاند:
در نمونه آزمایشی[۴۳] چهارم (مشاهدات ۱۷۰-۱۵۱) جزء اول با یک انحراف استاندارد بدین صورت منتقل میشود که در مشاهدات فرد میانگین جزء اول به پایین و در مشاهدات زوجه به سمت بالا منتقل میگردد؛ بنابراین وقتی دادهها به صورت زوجی گروهبندی می شوند. ۱۰ گروه آخر مشاهدات ۱۷۰-۱۵۱ میانگین متوسطی دارند که در نمونه پایه[۴۴]داریم ولی انتظار داریم انحرافات درون گروهی زیاد باشد.
سرانجام میانگین جهت اجزای هر یک از چهار مولفه در مشاهدات ۱۹۰-۱۹۱ با یک انحراف استاندارد به بالا منتقل میگردد:
مقادیر هدف عبارتند از:
آزمون را برای ۷۵ گروه انجام دادیم و نتایج
را با مقادیر بحرانی که به ترتیب ۹٫۹۴,۱۰,۹۴ میباشد مقایسه میکنیم. که نتایج در جداول ۳٫۷ و ۳٫۸ آمدهاند.
در جدول ۳٫۹ تعداد زیر گروههایی که برای مقادیر لازم است تا از مقادیر بحرانی نمونه پایه تخطی کند آمده است. همچنین برای نمونههای آزمایشی ۱ تا۴ نیز این مقادیر محاسبه شدهاند. در جدول می بینیم که حتی برای انحرافات نستباً کوچک بین اهداف و میانگین عملی (با انحرافات کوچکتر از ۵/۰ )توان تست چند متغیره حدود ۶۰ درصد حالتی است که میانگینهای جمعیت منتقل نشدهاند. در نمونههای آزمایشی دوم و سوم صددرصد و در دو نمونه آزمایشی اخر حدود ۷۰-۶۰ درصد است.
موضوعات: بدون موضوع
[پنجشنبه 1400-07-29] [ 05:27:00 ب.ظ ]