فهرست مطالب                    

فصل اول: مقدمه

در تحقیقات و مطالعات پزشکی و زیست شناسی، داده های بدست آمده معمولا مثبت بوده و دارای توزیع راست چوله با واریانس هایی هستند که با افزایش میانگین افزایش می یابند. به ویژه زمانی که داده ها از فرآیندهای تکثیری بدست می آیند، می توان انتظار چنین ویژگی- هایی را داشت. به عنوان مثال آزمایشات ژنتیک و فرآیند متابولیسمی در سیستم زیستی دارای چنین شرایطی هستند. یک راه برای توجیه این ویژگی ها در نظر گرفتن توزیع لاگ نرمال برای داده ها می باشد. البته با توجه به رابطه توزیع لاگ نرمال با توزیع نرمال، این فرض را   می توان با استفاده از نمودار چندکها یا آزمون شپیرو-ویلک(Shapiro-wilk test) برای داده- های نرمال بررسی کرد. برای انجام آزمون شپیرو-ویلک ابتدا لازم است از یک تبدیل لگاریتمی روی داده ها استفاده شود. زیرا اگر داده های اصلی لاگ نرمال باشند با این تبدیل داده ها دارای توزیع نرمال می شوند.همان طور که مشاهده می شود، توزیع لاگ نرمال یک توزیع با مقادیر مثبت است. در این توزیع کمیتی چون میانه فقط به پارامتر  و کمیت های همچون ضریب تغییرات، ضریب چولگی و ضریب برجستگی به پارامتر  بستگی دارند، اما کمیت های بسیار مهم و کاربردی در تحلیل و استنباط آماری یعنی میانگین و واریانس آن تابعی از پارامترهای توزیع یعنی  و  می باشند. قابل ذکر است که این توزیع بشدت چوله می باشد و میزان چولگی آن به پارامتر  بستگی دارد. برای روشن تر شدن این موضوع نمودار تابع چگالی احتمال چند توزیع لاگ نرمال با پارامتر  و  های مختلف در زیر آورده شده است.استنباط درباره میانگین یک جامعه لاگ نرمال توسط افرادی چون لند (Land) در سالهای (1971،1972،1973،1975،1988)، آنگوس (Angus)(1994)، ژو  و  گو    (Zhou & Gao) (1997) و کریشنامورتی و متیو  (Krishnamoorty & Mathew)(2003) مورد بررسی قرار گرفته است. مسئله مقایسه میانگین های دو جامعه لاگ نرمال در مطالعات افرادی چون ژو و گو (1997)، ژو و تو (Tu) (2000)، کریشنامورتی و متیو (2003) و چن (Chen) و ژو (2006) مطرح شده است. همچنین برای آزمون برابری میانگین های جوامع لاگ نرمال، روش های کلاسیک توسط گوو و لوه  (Guo & Luh)(2000) و گیل (Gill)(2004) معرفی شد که این روش ها به طور مناسب خطای نوع اول را کنترل نمی کنند. البته این مسئله را لی (Li) در سال 2009 بررسی کرد. او آزمونی را براساس روش p-مقدار تعمیم یافته کریشنامورتی و متیو (2003) ارائه کرد. همچنین مسئله فواصل اطمینان همزمان برای نسبت میانگین های توزیع لاگ نرمال توسط هنیگ (Hannig) (2009)  و صدوقی الوندی و ملک زاده (Sadooghi-Alvandi & Malekzadeh) (2014) و برای نسبت و اختلاف میانگین های توزیع لاگ نرمال توسط شاراشمیت  (Schaarschmidt)(2013) بررسی شده است.کریشنامورتی و متیو برای استنباط روی میانگین توزیع لاگ نرمال از  مفهوم p-مقدار تعمیم یافته و فاصله اطمینان تعمیم یافته استفاده کردند. p-مقدار تعمیم یافته توسط ویراهاندی و تسو (Weerahandi & Tsue)  در سال 1989 و فاصله اطمینان تعمیم یافته توسط ویراهاندی  در  سال 1993  معرفی  شده  است. (Krishnamoorty and Mathew,2003,p.103-121)

1-3-2- آزمون برای میانگین توزیع لاگ نرمال

فرض کنید  یک نمونه تصادفی از توزیع  باشد و  قرار     می دهیم. برای راحتی محاسبات به جای میانگین توزیع، لگاریتم آن یعنی  را آزمون می کنیم. آزمون زیر را در نظر بگیرید:

   1-1- کاربردهای توزیع لاگ نرمال……………………………………………………………………. 2

1-2- ویژگی ها و خواص توزیع لاگ نرمال…………………………………………………………… 3

1-2-1- تابع چگالی احتمال……………………………………………………………………………. 3

1-2-2- رابطه توزیع لاگ نرمال با توزیع نرمال…………………………………………………………. 3

1-2-3- کمیت های توزیع لاگ نرمال……………………………………………………………… 4

1-2-4- برآوردگرهای ماکزیمم درستنمایی و نااریب پارامترها…………………………………… 6

1-3-  بررسی میانگین توزیع لاگ نرمال………………………………………………………………. 6

1-3-1- پیشینه……………………………………………………………………………………….. 7

1-3-2- آزمون برای میانگین توزیع لاگ نرمال……………………………………………………… 8

1-3-2-1-p -مقدار تعمیم یافته………………………………………………………………….. 8

1-3-3- فاصله اطمینان برای میانگین توزیع لاگ نرمال…………………………………………. 11

برای دانلود رایگان قسمت های بیشتراز فایل به انتهای مطلب مراجعه کنید

فصل دوم: آزمون برابری میانگین های جوامع لاگ نرمال

یکی از مسائل مهم در آمار، مسئله مقایسه میانگین های چند جامعه (تیمار) است. روش استاندارد برای آزمون کردن برابری میانگین های چند جامعه با فرض نرمال بودن توزیع داده- ها، آزمون F (ANOVA F-test) می باشد، با توجه به رابطه توزیع لاگ نرمال و نرمال که در بخش (1-2-2) بیان شد، می توان از تبدیل لگاریتم طبیعی روی داده ها و آزمون F برای بررسی این مسئله در توزیع لاگ نرمال استفاده کرد. ولی با این تبدیل، فرض برابری میانگین- ها در داده های اصلی با فرض برابری میانگین ها در داده های تبدیل یافته در صورتی که واریانس های داده های تبدیل یافته برابر نباشند، معادل نخواهند بود که در ادامه این موضوع بررسی می شود.

برای حل این مسئله روش استاندارد و دقیقی وجود ندارد. استفاده از روش های مجانبی، یک راه حل معمول در این گونه مسائل می باشد که در این مسئله نیز چندین روش مجانبی وجود دارد.گوو و لوه در سال 2000 سه آزمون مجانبی را مورد بررسی قرار دادند که شامل آزمون آلکساندر-گوورن (Alexander-Govern test) (1994)، آزمون ولچ (Welch test) (1951) و آزمون مرتبه دوم جیمز (James second-order test) (1951) می باشند. این روش ها را با آزمون F مقایسه کردند. نتایج شبیه سازی آنها نشان داد که این سه آزمون تقریبا مانند هم عمل می کند و قابل اعتماد تر و پرتوان تر از آزمون F می باشد.

همچنین، لی (Li) در سال 2009، روش p-مقدار تعمیم یافته را برای مقایسه میانگین های چند جامعه لاگ نرمال بکار برد که در مقایسه با آزمون های مجانبی دیگر خواص خوبی داشت.در این فصل به معرفی روش لی و آزمون ولچ می پردازیم و این دو روش را براساس ملاک هایی چون توان و اندازه آزمون مقایسه می کنیم.

2-2- آزمون هافرض کنید طرح، یک طرح تصادفی کامل  و  مشاهده ها از واحدهای آزمایشی در تیمار  ام  باشد. همچنین فرض کنید  دارای توزیع  است، به عبارت دیگر  دارای توزیع لاگ نرمال با پارامترهای  و  و امید ریاضی                ، می باشد.

 

2-1- مقدمه……………………………………………………………………………………………… 15

2-2- آزمون ها…………………………………………………………………………………………… 16

2-2-1- آزمون ولچ (Welch’s test)………………………………………………………………… 17

1-2-2-1- روش ولچ (Welch Method)…………………………………………………………. 18

2-2-2- روش p-مقدار تعمیم یافته………………………………………………………………… 20

2-3- شبیه سازی……………………………………………………………………………………….. 27

2-4- نتیجه گیری…………………………………………………………………………………………. 29

فصل سوم : فواصل اطمینان همزمان برای مقایسه نسبت و اختلاف میانگین های جوامع لاگ نرمال

در صورتی که فرض برابری میانگین های چند جامعه (تیمار) رد شود، مسئله یافتن تیمارهایی که باعث رد فرض برابری شده اند، مسئله دیگری برای پژوهشگر خواهد بود که مقایسه های دو به دو میانگین ها مطرح می شود. برای این مسئله، روش های استاندارد تحت فرض نرمال بودن توزیع داده ها، شامل روش توکی ((Tukey’s method برای مقایسه دو به دو تیمارها (1953) و روش دانت (Dunnett’s method) برای مقایسه تیمارها با تیمار کنترل (1955) می باشد. همچنین برای بررسی های بیشتر محققان، فواصل اطمینان همزمان برای مقابله های تعریف شده توسط محقق تحت فرض نرمال وجود دارد(Bretz et al.,2001).در این فصل به مقایسه دو به دو میانگین های جوامع لاگ نرمال  با ساختن  فواصل اطمینان همزمان برای نسبت و اختلاف میانگین ها می پردازیم.

  • نمادها و پارامترها

 فرض کنید طرح، یک طرح تصادفی کامل و  مشاهده ها از واحدهای آزمایشی در تیمار  ام  باشد. همچنین فرض کنید  دارای توزیع  است، به عبارت دیگر  دارای توزیع لاگ نرمال با پارامترهای  و  می باشد. و  به ترتیب برآوردهای درستنمایی ماکزیمم برای  و  هستند، همچنین برآوردگر نااریب برای ،       می باشد.قبل از معرفی روش ها ذکر این نکته ضروری است که اگر فرض اضافی، برابری  ها را در تیمارهای  داشته باشیم (به این معنا که ضریب تغییرات مشترک در تیمارها وجود دارد) مطابق با بحثی که در بخش (2-2) داشتیم، بسادگی می توانیم برای محاسبه فواصل اطمینان همزمان برای اختلاف های  از روش های توکی یا دانت یا آزمون مقابله های کلی استفاده کنیم و در نهایت با یک تبدیل نمایی روی فواصل اطمینان بدست آمده به فواصل اطمینان برای نسبت میانه ها یعنی  تبدیل می شود (با فرض اضافی برابری   ها نسبت میانه ها با نسبت میانگین ها برابر می شود). البته همان طور که قبلا بیان شد بررسی اختلاف و نسبت میانگین ها بیشتر از میانه ها مد نظر می باشد.

با توجه به نتایج نمودار (3-1) روش GPQ احتمال پوشش همزمان بسته (نزدیک) به سطح اطمینان 95/0 را در تمامی مجموعه پارامترها و ماتریس های مقابله تعریف شده در           (3-3- 15)، چه برای نسبت ها و چه برای اختلاف ها ارائه می دهد. روش GPQB نیز نتایج خوبی از احتمال پوشش ها را ارائه می دهد ولی به دلیل تصحیح بانفرونی نسبت به روش GPQ بسیار محافظه کار می باشد. دو روش مجانبی ANM و ANB در بسیاری از شرایط تعریف شده احتمال پوشش های آزادتری دارد ولی در بعضی از شرایط به ویژه برای اختلاف ها محافظه کار عمل می کند. البته تخلف از سطح اطمینان (یا خطای نوع اول در آزمون) به طور مشابه در روش های مجانبی برای دو نمونه (چین و ژو 2006 و کریشنامورتی و متیو 2003) گزارش شده است. با توجه به این نتایج تخلف از احتمال پوشش ها در نمونه های کوچک مشاهده می- شود (به نمودار (3-2) نگاه کنید). همچنین در شرایطی که   بزرگ یا مقادیر  ها در  گروه ها متفاوت باشد، نیز دیده می شود. با توجه به نمودار (3-1) به وضوح دیده می شود که روش های مجانبی برای نسبت ها بهتر از اختلاف ها عمل می کند. در ضمن روش FGPQ که فقط برای مقایسه نسبت میانگین ها استفاده می شود، نتایج نسبتا خوبی از احتمال پوشش ها را ارائه می دهند.نمودار (3-2) با جزئیات بیشتر به مقایسه احتمال پوشش همزمان برآورد شده برای روش GPQ با روش های دیگر با تمرکز روی ماتریس مقابله  می پردازد. خطوط نقطه چین  نشان دهنده کمترین مقادیر احتمال های پوشش مشاهده شده هستند که برای آنها فرض مقابل فرض صفر با احتمال پوشش 95 درصد در سطح 5 درصد رد می شود. بنابراین برای یک روش دقیق تنها 5 درصد از مجموعه ها می تواند خارج از این حدود قرار بگیرد. با توجه به نمودار (3-2) (a) و (d) جایگزین کردن روش GPQ به جای روش GPQB باعث می شود در بسیاری از شرایط احتمال پوشش به سطح اطمینان 95/0 نزدیک تر شود. همچنین مشاهده می شود در اندازه نمونه های متعادل  روش GPQ نسبت به یک روش دقیق خیلی    محافظه کار می باشد. نمودار (3-2) (e) و (b) نشان می دهند که در مجموعه هایی با شرایط سخت با اندازه نمونه کم و نا متعادل اجرای روش ANM به شدت آزاد است، حتی اگر  باشد. همچنین از این نمودارها نتیجه می شود که احتمال پوشش ها نزدیک به سطح اطمینان می باشد. نمودار (3-2) (c) و (f) نشان می دهند که لزومی به اجرای روش غیرقابل پذیرش ANM با استفاده از برآورد واریانس ها برای برآورد ماتریس همبستگی نیست. واضح است که تصحیح بانفرونی با تقریب نرمال در روش ANB بسیار ساده می باشد. اگرچه تصحیح بانفرونی باعث احتمال پوشش های بالای غیرضروری در اندازه نمونه های بزرگ  می شود.

   3-1- مقدمه……………………………………………………………………………………………. 31

3-2- نمادها و پارامترها……………………………………………………………………………….. 31

3-3- روش های ساختن فواصل اطمینان همزمان………………………………………………….. 33

3-3-1- روش تقریب نرمال با تصحیح بانفرونی…………………………………………………… 33

3-3-2- روش کمیت محوری تعمیم یافته با تصحیح بانفرونی…………………………………. 36

3-3-3- روش تقریب نرمال و تصحیح آن بوسیله چندک های نرمال چند متغیره…………….. 36

3-3-4- روش کمیت محوری تعمیم یافته………………………………………………………….. 38

3-3-5- روش کمیت محوری تعمیم یافته فیدوشیال……………………………………………… 42

3-3-5-1- پیشینه……………………………………………………………………………….. 44

3-3-5-2- معرفی روش ساختن فاصله اطمینان تعمیم یافته فیدوشیال…………………. 45

3-3-5-3- فاصله اطمینان همزمان تعمیم یافته فیدوشیال………………………………… 46

3-3-5-4- خصوصیت مجانبی فواصل اطمینان همزمان تعمیم یافته فیدوشیال…………. 48

3-4- شبیه سازی مونت کارلو……………………………………………………………………….. 52

برای دانلود رایگان قسمت های بیشتراز فایل به انتهای مطلب مراجعه کنید

فصل چهارم: مثال عددی و نتیجه گیری.

 

در این فصل به منظور درک بهتر آزمون های معرفی شده برای برابری میانگین های جوامع لاگ نرمال در فصل دوم و فواصل اطمینان همزمان معرفی شده برای مقایسه همزمان   میانگین ها در فصل سوم، مثالی را مطرح می کنیم.مثال 5-1: داده های این مثال که براساس کتاب هند (Hand et al.,1994) می باشد، شامل  57 مشاهده از آلبومین سرم گاوی وابسته به نیتروژن در سه گروه از موش های درمانی که شامل موش های طبیعی (گروه اول) با 20 مشاهده، موش های دیابتی بوسیله آلوکسان (allxon) (گروه دوم) با 18 مشاهده و موش های دیابتی بوسیله آلوکسان تحت درمان انسولین (گروه سوم) با 19 مشاهده جمع آوری شده است.

نمودار (4-1) (a) نمودار جعبه ای برای سه گروه تیماری می باشد. نمودارهای (4- 1(b)( و (c) به ترتیب نمودارهای Q-Q برای باقیمانده های یک مدل خطی (با در نظر گرفتن اختلاف بین گروه های تیماری) برای مقادیر اصلی آلبومین سرم و مقادیر تبدیل یافته آلبومین سرم با تبدیل لگاریتم طبیعی است. با توجه به نمودار های Q-Q، به وضوح دیده می شود که داده های اصلی راست چوله می باشند در حالی که داده های تبدیل یافته از فرض نرمال بودن تبعیت  می کنند. همچنین برای بررسی بیشتر باقی مانده ها، آزمون شپیرو- ویلک را برای آنها انجام داده ایم. طبق آزمون شپیرو- ویلک برای باقیمانده های داده های اصلی فرض نرمال بودن در سطح معنی داری 05/0 رد می شود، زیرا p-مقدار برای این آزمون  می باشد. در حالی که این آزمون برای باقیمانده داده های تبدیل یافته دلیلی بر رد فرض نرمال در سطح 05/0 ندارد، زیرا p-مقدار در این آزمون 315/0 است که بیشتر از سطح معنی داری 05/0 می باشد. بنابراین فرض لاگ نرمال برای داده های بدست آمده منطقی می باشد.

   4-1- مثال عددی…………………………………………………………………………………… 63

4-2- نتیجه گیری…………………………………………………………………………………… 66

پیوست 1 : برنامه نویسی………………………………………………………………………… 69

پیوست 2 : لغت نامه فارسی- انگلیسی……………………………………………………….. 97

پیوست3 : لغت نامه انگلیسی-فارسی…………………………………………………………. 101

فهرست منابع و مراجع………………………………………………………………………………. 105

ABSTRACT

The lognormal distribution is widely used for analyzing positive, right-skewed data. Such data is usually obtained from biological, medical and economic research. In this thesis, at the first, we examine the equality of means of several lognormal distribution using the concept of generalized p-value (GP) that Li(2009) introduced. Simulation results show that this method is better than other approximate tests such as Welch’s test. We also analyzed simultaneity comparison of ratios and differences of means of several lognormal distribution by constructing simultaneous confidence intervals that were introduced by Schaarschmidt(2013). He used normal approximation, Bonferroni adjustment and generalized pivotal quantity (GPQ) in order to introduce simultaneous confidence intervals. According to simulation results, the method based on generalized pivotal quantity is better than other approaches. We Also introduce fiducial generalized confidence interval (FGPQ) used by Hannig(2006) in order to compare the ratio of means of lognormal distribution. These confidence intervals have correct asymptotic coverage.



بلافاصله بعد از پرداخت به ایمیلی که در مرحله بعد وارد میکنید ارسال میشود.


فایل pdf غیر قابل ویرایش

قیمت25000تومان

خرید فایل word

قیمت35000تومان