فهرست مطالب
فصل اول : کلیات تحقیق

مقدمه
در طول پنجاه سال اخیر، در جامعه جهانی دیدگاهی نسبت به آموزش و پرورش به وجود آمده است که گزارش اخیر شورای بین المللی آموزش و پرورش برای قرن بیست و یکم (دلورس ، 1996) آن را ” آرمانی ضروری” تلقی می¬کند. این گزارش با قاطعیت ادعا می¬کند که آموزش و پرورش تنها یک سازوکار برای اکتساب دامنه¬ی محدودی از مهارت های پایه نیست، بلکه عاملی ارزشمند برای توسعه¬ی اجتماعی و فردی است. دارایی بی¬مانندی است برای تلاش (نوع بشر) به سوی دستیابی به آرمان¬های ” صلح، آزادی و عدالت” و یکی از راه¬های اصلی در دسترسی برای پرورش الگویی عمیق¬تر و هماهنگ¬تر از توسعه¬ی انسانی می¬باشد و از طریق آن، فقر، تبعیض، جهل، استضعاف و جنگ را می¬توان کاهش داد (یونسکو ، 2001، ترجمه سعیدی، 1384،ص 18). امروزه جوامع به آموزش و پرورش به عنوان یکی از مهمترین راه¬های توسعه و پیشرفت همه جانبه می¬نگرند و هزینه¬های کلانی را در آن صرف می¬کنند. جوامع دریافته¬اند که برای تحقق اهداف گوناگون، نیازمند نیروی انسانی ماهر و کارآمد هستند که دو دستگاه آموزش و پرورش و آموزش عالی متولی این امر می¬باشند. آنچه این دو را به هم پیوند می¬دهد، فرایند گزینش دانشجو است که در جوامع مختلف، متفاوت و بر مبنای انگیزه¬های گوناگونی شکل یافته است. اما در این میان سعی همه جوامع بر این است که امکانات آموزش عالی به شایسته¬ترین و اصلح¬ترین افراد تخصیص یابد.
در ایران دیر زمانی است که نظام پذیرش دانشجو از طریق کنکور صورت می¬گیرد که در بین جوانان به معنای” سرنوشت” تعبیر می¬شود و در کشور باعث تولید نوعی بحران شده است. از تحولات سال¬های اخیر در زمینه نظام پذیرش دانشجو، مطرح کردن جایگزینی سوابق تحصیلی بجای کنکور است که در سال 1386 با عنوان قانون حذف کنکور به تصویب مجلس شورای اسلامی رسید و می¬بایست از سال 90 اجرایی می¬شد که با توجه به مشکلات علمی، فنی و اجرایی به سرانجام نرسید. تا اینکه در مرداد ماه 1392 کلیات طرح جدید سنجش و پذیرش دانشجو به تصویب نمایندگان مجلس شورای اسلامی رسید که بر اساس آن، این مصوبه از کنکور سال آینده اجرا می¬شود و تأثیر سوابق تحصیلی (دور دوم دوره متوسطه) از سال 93 به صورت پلکانی از تأثیر 25 درصد شروع می¬شود تا در نهایت به 85 درصد طی 5 سال برسد.
با توجه به طرح جدید سنجش و پذیرش دانشجو، از امتحانات¬نهایی مقطع متوسطه می¬توان به عنوان یکی از مهم¬ترین و سرنوشت¬سازترین ابزار سنجش علمی دانش¬آموزان نام برد. آنچه در این میان مهم جلوه می¬کند، کیفیت این آزمون¬ها و استاندارد بودن سوالات آنهاست. از اولین گام¬ها در کیفیت مستندسازی فنی ابزار اندازه¬گیری، تعیین روایی و اعتبار نمراتی است که از یک ارزیابی به دست می-آیند.
با نگاهی به مجلات علمی کشورمان، می¬توان دریافت در بسیاری از مطالعات صورت گرفته، نه تنها در زمینه¬ی آموزش و پرورش بلکه در رشته¬های گوناگون، با وجود منابع چندگانه¬ی خطا باز محققان ضرایب اعتبار کلاسیک را گزارش می¬دهند. این در حالی است که در وضعیت¬های اندازه¬گیری پیچیده که منابع چندگانه¬ای از خطای اندازه¬گیری وجود دارد، نظریه کلاسیک آزمون (CTT) قادر به برآورد اعتبار نیست. از این رو، تحقیق حاضر در پی آن است که ضمن معرفی نظریه تعمیم¬پذیری (GT)، اعتبار امتحانات نهایی سال سوم متوسطه رشته¬ی تجربی در دو درس ادبیات¬فارسی و زیست¬شناسی را با استفاده از طرح¬های اندازه¬گیری این نظریه تعیین نموده و همچنین روایی آن¬ها را مورد بررسی قرار دهد.
علاوه بر این، این تحقیق می¬کوشد ویژگی¬های روان¬سنجی سوالات امتحانات نهایی را بر اساس CTT با توجه به اهمیتی که این مدل در تحلیل سوالات آزمون¬های مختلف روانی- تربیتی داشته است، در کنار مدل¬های نظریه پرسش- پاسخ (IRT) مورد بررسی قرار دهد.
بیان مسئله
ارزشیابی پیشرفت تحصیلی فرآیند منظمی است که با به کارگیری روش¬های علمی، عملکرد یادگیرندگان و میزان آموخته¬هایشان را می¬سنجد و در مورد عملکرد آن¬ها با توجه به اهداف آموزشی مورد نظر به قضاوت و داوری می¬پردازد. امتحانات نهایی سال سوم متوسطه نوعی از ارزشیابی پیشرفت تحصیلی هستند که در پایان دوره¬ی آموزشی اجرا می¬شوند.¬ از نتایج این امتحانات جهت سنجش آموخته-های دانش¬آموزان، تصمیم¬گیری در مورد رد یا قبول شدن آن¬ها و نیز ارزشیابی اثر بخشی برنامه آموزشی و شیوه تدریس مدرس استفاده می¬شود. همچنین با توجه به طرح جدید سنجش و پذیرش دانشجو در کشورمان، این امتحانات پلی برای ورود به دانشگاه محسوب می¬شوند. این کارکرد اخیر، بیش از پیش بر حساسیت این امتحانات می¬افزاید.
زمانی این امتحانات به عنوان ابزار گزینشی کارا و سودمند تلقی می¬شوند و می¬توان به نتایج آن¬ها اعتماد کرد که کیفیت این آزمون¬ها در سطح مطلوبی باشد. به بیانی دیگر، در فرایند طراحی سوالات امتحانی و تصحیح اوراق امتحانی ملاک¬های علمی و اصول روان¬سنجی رعایت شود. همچنین به دلیل هماهنگ بودن این امتحانات در سطح کشوری، صحت اجرا و امنیت آن نیز تضمین شود. به منظور برنامه ریزی، اتخاذ تصمیم در حدود اختیارات، اجرا، هماهنگی و نظارت بر حسن برگزاری امتحانات ستادی تحت عنوان ستاد امتحانات در سطح استان، شهرستان، منطقه، ناحیه برای انجام وظایف مورد نظر تشکیل می¬گردد و افراد زیادی در قبل، حین و بعد از برگزاری این امتحانات درگیر هستند و انجام وظیفه می-کنند. همان¬طور که حسنی و کیامنش (1388) نیز مطرح کرده¬اند، سازوکار امتحانات نهایی تمامی بخش¬های آموزش و پرورش از وزارتخانه تا منطقه و مدارس را درگیر می¬کند. روشن است که همه این تشکیلات عریض و طویل که سراسر کشور را در بر می¬گیرد، برای بالا بردن ضریب صحت اجرای امتحان است و با صحت نتایج آزمون و طراحی سوال کاملاً تفاوت دارد.
با اینکه برای طراحی سوالات این امتحانات از دبیران مجرب و آشنا با اصول طراحی سوال استفاده می¬شود با این حال در خصوص کیفیت سوالات این امتحانات و دقت عمل مصححان هنوز تردیدهایی وجود دارد و نمی¬توان با اطمینان گفت آیا اصول و قواعد آزمون سازی در مورد این سوالات رعایت می¬شود یا خیر. و آیا این امتحانات به عنوان ابزار گزینشی از روایی و اعتبار لازم برای شناسایی استعدادها برخوردارند یا نه. برای پاسخگویی به این سوالات، از علم روان سنجی و تئوری های آن استفاده می¬شود. تئوری¬های روان¬سنجی به دو دسته تقسیم می شوند: دسته¬ی اول نظریه¬ی نمونه¬برداری تصادفی، که این نظریه خود شامل نظریه کلاسیک آزمون و نظریه¬ی تعمیم¬پذیری و دسته دوم شامل نظریه¬ی پرسش پاسخ است .

مقدمه ……………………………………………………………………1
بیان مسئله……………………………………………………………. 2
اهداف تحقیق…………………………………………………………. 3
هدف کلی……………………………………………………………… 4
اهداف جزیی…………………………………………………………… 4
سوالات تحقیق………………………………………………………… 4
اهمیت و ضرورت تحقیق…………………………………………….. 5
تعاریف واژه ها و اصطلاحات………………………………………… 6

برای دانلود رایگان قسمت های بیشتراز فایل به انتهای مطلب مراجعه کنید

فصل دوم : ادبیات تحقیق

روان¬شناسان و متخصصان تعلیم و تربیت بگونه کلی از دو جهت به اندازه¬گیری و سنجش علاقه¬مند بوده-اند. نخست آنکه بدانند که فرد معینی چه می¬کند. در این مورد نتایج اندازه¬گیری مربوط به آن بخشی از رفتار فرد می¬شود که شخصیت نام دارد و موضوع اندازه¬گیری در واقع ” عمل فرد” است. دوم آنکه بدانند که فرد چه می¬تواند انجام دهد. در این نوع انداره¬گیری، مقصود به دست آوردن قراین و شواهدی درباره¬ی اعمالی است که اگر فرد تلاش کند می¬تواند از عهده¬ی آن برآید. نتایج این نوع اندازه¬گیری که در واقع مربوط به توانایی فرد می¬شود ممکن است به دو بخش اصلی تقسیم شود. اندازه¬های مربوط به استعداد و اندازه¬های مربوط به معلومات یا پیشرفت¬تحصیلی (هومن، 1384، ص 168). آزمون¬های پیشرفت-تحصیلی برای اندازه¬گیری معلومات و آموخته¬ها، توانایی¬های اکتسابی یا مهارت¬های پیشرفته مورد استفاده قرار می¬گیرند که عمده¬ترین آنها، آزمون¬های مداد و کاغذی یا آزمون¬های کتبی نام دارند. این آزمون¬ها را به دو دسته¬ی اصلی تقسیم می¬کنند: آزمون¬های عینی و آزمون¬های ذهنی. صاحب¬نظران و متخصصان، نظرهای موافق و مخالف زیادی نسبت به کاربرد آزمون¬های ذهنی ابراز داشته¬اند و برای آنها، امتیازات و معایبی برشمرده¬اند که در این میان بخش اعظم انتقادات، متوجه آزمون¬های تشریحی است. دقت این آزمون¬ها به مقدار زیاد به نحوه¬ی تصحیح اوراق امتحانی و دقت عمل مصححان مربوط است و دلیل عمده¬ی مخالفت برخی صاحب نظران با کاربرد این آزمون¬ها نیز از بی ثباتی نمره¬گذاری آنها ناشی می¬شود.
با اینکه سوالات امتحانات نهایی سال سوم متوسطه ترکیبی از انواع گوناگون سوال است ولی درصد بیشتری از سوالات آن از نوع تشریحی و کوتاه پاسخ می¬باشد. در بسیاری از تحقیقات، آزمون¬های عینی مورد تجزیه و تحلیل قرار گرفته¬اند و این خود گام بزرگی برای بهبود کیفیت سوالات این آزمون¬ها می-باشد. اما متأسفانه به آزمون¬های ذهنی و روش¬های تحلیل آنها کمتر توجه شده است. در راستای بهبود کیفیت امتحانات¬نهایی، هر چند تشکیلات مربوطه گام¬های ارزنده¬ای برداشته است که می¬توان به مواردی از جمله؛ دستور¬العمل¬های طراحی سوال امتحان، برگزاری کارگاه¬های آموزشی در حوزه سنجش و ارزشیابی، استفاده از دانش معلمان آموزش دیده در طراحی سوالات، تشکیل بانک سوال اشاره کرد. با وجود این، مستندسازی کیفیت این امتحانات جای بررسی و تحقیق دارد. همان¬طور که حسنی و کیامنش (1388) بیان کرده¬اند؛ تحلیل آیین¬نامه¬ها¬ی امتحانات نشان می¬دهد در طول هشتاد و اندی سال که از تدوین اولین آیین-نامه¬های امتحانات در شورای عالی معارف می گذرد، تدوین کنندگان آیین نامه ها کمتر به صحت و دقت سوالات و نتایج ارزشیابی¬ها توجه داشته¬اند و بیشترین دغدغه آن¬ها صحت اجرا و ثبت نمره بوده است.
هر ارزشیابی و سنجشی بر اساس اطلاعات و داده¬هایی انجام می¬گیرد که از طریق ابزارها و روش-های مختلف جمع¬آوری می¬شوند. سنجشی می¬تواند کارا و سودمند قلمداد شود که بر پایه اطلاعات دقیق و معتبر باشد و مطابق با اصول و ملاک¬های علمی صورت پذیرد. سنجش آموخته¬های دانش¬آموزان در امتحانات نهایی نیز از این قاعده مستثنی نیست. زمزمه تغییر نظام پذیرش دانشجو در کشور و جایگزینی سوابق تحصیلی که در چند سال اخیر مطرح شده است بر اهمیت امتحانات نهایی مقطع متوسطه بیش از پیش افزوده است. از این رو طراحی و سنجش سوالات این امتحانات نیز می¬باید مبتنی بر اصول و نظریه¬های علمی باشد تا بدین وسیله با در اختیار داشتن داده¬هایی هر چه نزدیک¬تر به واقعیت، زمینه برای ارزشیابی عادلانه فراهم شود.
در این فصل ابتدا به تشریح ارزشیابی پیشرفت¬تحصیلی پرداخته می¬شود، به¬دنبال آن به موضوعاتی چون نحوه طراحی و تصحیح امتحانات نهایی نیز اشاره می¬شود. سپس در قسمت مبانی نظری به معرفی سه نظریه¬ی کلاسیک آزمون، تعمیم پذیری، پرسش – پاسخ و تقابلات آنها پرداخته و بعد از آن مباحث اعتبار و روایی مرور خواهد شد. در پایان، تحلیل محتوا به طور مختصر مورد بررسی قرار خواهد گرفت.
فرآیند ارزشیابی پیشرفت تحصیلی
ارزشیابی پیشرفت¬تحصیلی فرایند منظمی است که با بکارگیری روش¬های علمی، عملکرد یادگیرندگان و میزان آموخته¬هایشان را می¬سنجد و در مورد عملکرد آن¬ها با توجه به اهداف آموزشی از پیش تعیین شده به قضاوت و داوری می¬پردازد. طبق این تعریف در ارزشیابی پیشرفت¬تحصیلی نخستین گام، تعیین اهداف آموزشی است. منظور از اهداف، انتظارات آموزشی است که پس از طی یک دوره آموزشی از یادگیرندگان انتظار می¬رود به آن دست یابند. برای سهولت مطالعه، اهداف آموزشی را به انواع مختلفی طبقه¬بندی کرده¬اند که از این میان طبقه¬بندی بلوم شناخته شده¬تر است. اهداف در طبقه¬بندی بلوم در سه حیطه¬ی شناختی، روانی – حرکتی و عاطفی قرار می¬گیرند که در هر کدام از این حیطه¬ها نیز اهداف از سطوح سلسله مراتبی از ساده به مشکل برخورداند. در آموزش و پرورش بسیاری از اهداف در ارتباط با حیطه شناختی هستند. نوع دیگری از طبقه¬بندی اهداف، تعیین اهداف در سه سطح کلی، نسبتاً کلی و هدف¬های رفتاری است که از این میان، هدف¬های رفتاری نسبت به دو سطح دیگر جزئی¬تر، دقیق¬تر و قابل اندازه¬گیری¬تر است. ویژگی¬های مذکور به روند ارزشیابی پیشرفت¬تحصیلی سرعت و سهولت می-بخشند.
بعد از تعیین اهداف آموزشی نیاز است که عملکرد یادگیرندگان متناسب با اهداف تعیین شده از طریق ابزارهای اندازه¬گیری سنجیده شود. از مهمترین این ابزار¬ها امتحانات پیشرفت¬تحصیلی هستند. این امتحانات زمانی در سطح مطلوب قرار می¬گیرند که سوالات آن به بهترین وجه نمونه¬ی معرفی از همه¬ی سوالات ممکن در موضوع مورد سنجش باشد، به طوریکه همه ی هدف¬های آموزشی و محتوای درس را پوشش دهد. در این راستا آنچه به آزمون¬ساز کمک می¬کند، تهیه جدول مشخصات برای موضوعی که قرار است عملکرد یادگیرندگان در آن سنجیده شود. این جدول، یک جدول دو بعدی است که در یک بعد آن محتوا و در بعد دیگر هدف قرار می¬گیرد. همچنین تعداد سوالات متناسب با اهمیت محتوا و هدف هر بخش در خانه¬های جدول ذکر می¬شود.
بعد از تهیه این جدول، آنچه باید تعیین گردد نوع سوال است. پس از طرح سوالات امتحان، اجرا و تصحیح آن، نوبت به تجزیه و تحلیل داده¬های به دست آمده از امتحان می¬رسد که می¬توان از نتایج آن در راستای بهبود کیفیت فنی این امتحانات بهره برد. در قسمت زیر سعی شده است، در راستای تحقیق به معرفی انواع سوال و قواعد طرح و تصحیح سوالات ذهنی پرداخته شود.

مقدمه …………………………………………………………………9
فرآیند ارزشیابی پیشرفت تحصیلی…………………………….. 10
انواع سوال…………………………………………………………. 11
انواع امتحانات قابل اجرا در سطح وزارت آموزش و پرورش…… 15
شیوه طراحی سوالات امتحانات نهایی……………………….. 16
چگونگی تصحیح امتحانات نهایی……………………………….. 16
مبانی نظری…………………………………………………….. 18
نظریه کلاسیک آزمون (CTT)ا………………………………… 19
مفروضات نظریه کلاسیک آزمون………………………………. 19
محدودیت های نظریه کلاسیک آزمون………………………. 20
نظریه تعمیم پذیری(GT) ا……………………………………..22
مفاهیم و اصطلاحات در GT ا………………………………….24
انواع مطالعات…………………………………………………. 27
ملاحظات مطالعات G و D ا…………………………………….27
جهان مشاهدات قابل قبول و مطالعات G ا……………………28
جهان تعمیم و مطالعات D ا…………………………………….29
مدل های تصادفی و ترکیبی با جهان های تعمیم نامحدود و محدود…………………………………………………………….. 30
طرح های تعمیم پذیری…………………………………………. 31
انواع تصمیم و واریانس های خطا……………………………… 35
انواع ضرایب ………………………………………………………37
نظریه پرسش – پاسخ(IRT) ا………………………………….37
مفروضات نظریه پرسش – پاسخ………………………………. 38
تک بعدی بودن…………………………………………………… 38
استقلال موضعی……………………………………………….. 38
معرفی مفاهیم اساسی در نظریه پرسش – پاسخ………… 39
خم ویژه سوال (ICC) ا……………………………………………39
پارامتر دشواری سوال……………………………………………. 39
پارامتر تشخیص سوال………………………………………….. 40
پارامتر حدس سوال……………………………………………… 40
پارامتر آزمودنی…………………………………………………… 40
ویژگی نامتغیر بودن پارامترها ……………………………………41
مدل ها در نظریه پرسش- پاسخ………………………………. 41
مدل های پرسش – پاسخ لوجیستیک برای داده های دو ارزشی………………………………………………………….. 42
مدل یک پارامتری……………………………………………….. 42
مدل دو پارامتری…………………………………………………. 42
مدل سه پارامتری……………………………………………… 43
نظریه تعمیم پذیری در مقابل نظریه کلاسیک آزمون …………43
نظریه کلاسیک آزمون و نظریه تعمیم پذیری در مقابل نظریه پرسش پاسخ…………………………………………………………… 45
مفهوم اعتبار…………………………………………………… 47
تعاریف آماری اعتبار…………………………………………… 47
روش های برآورد اعتبار………………………………………. 48
روش های برآورد اعتبار آزمون های هنجار مرجع………….. 50
عوامل مؤثر بر اعتبار آزمون………………………………….. 56
خطای معیار اندازه¬گیری……………………………………. 57
مفهوم اعتبار در IRT ا…………………………………………59
تعریف و مفهوم روایی……………………………………….. 59
تاریخچه روایی……………………………………………….. 60
انواع روایی…………………………………………………… 60
ارتباط روایی و اعتبار………………………………………… 65
محتوا…………………………………………………………… 65
تحلیل محتوا ……………………………………………………66
تحقیقات انجام شده در داخل و خارج از ایران……………… 66

فصل سوم : روش تحقیق

مقدمه
انتخاب روش مناسب برای انجام تحقیق، از عوامل مهمی است که محقق را در رسیدن به نتایج و حقایق یاری می¬رساند و دستیابی به اهداف را امکان¬پذیر می¬سازد. لذا ضرورت دارد با توجه به موضوع تحقیق و اهداف آن، مناسب¬ترین روش را انتخاب کرد تا با تکیه بر آن به جمع¬آوری دقیق داده¬ها و تجزیه و تحلیل آن¬ها پرداخته و در نهایت به نتایج قابل قبولی دست یافت. در این فصل ابتدا به بررسی روش تحقیق، معرفی جامعه و نمونه، پرداخته و به دنبال آن روش جمع¬آوری اطلاعات، روش اجرا و روش تجزیه و تحلیل اطلاعات توضیح داده خواهد شد.
روش تحقیق
در این پژوهش از روش ترکیبی جهت پاسخ¬گویی به سوالات تحقیق استفاده گردید. در روش¬های ترکیبی هر دو شکل تحقیق کمی و کیفی با هم ترکیب می¬شوند. این روش مشتمل بر مفروضات فلسفی، استفاده از روش¬های کمی و کیفی و ترکیب هر دو روش در یک مطالعه است. بنابراین، این روش فراتر از جمع¬آوری و تجزیه و تحلیل ساده هر دو نوع داده¬ها است؛ همچنین، مشتمل بر استفاده همزمان از هر دو روش است، به¬طوری که نیرومندی کلی یک تحقیق از هر یک از دو تحقیق کمی یا کیفی به تنهایی بیشتر است (کرسول و پلانو ، 2007، ترجمه¬ی سعدی پور، 1391، ص17).
هدف طرح¬های تحقیق ترکیبی آن است که شواهد بیشتری برای درک بهتر پدیده¬ها به¬دست دهند. علاوه بر آن محدودیت انحصاری طرح¬های تحقیق کمی را که در آن¬ها استفاده از داده¬های کیفی جایز نمی¬باشد و نیز طرح¬های تحقیق کیفی که استفاده از داده¬های کمی در آن¬ها توصیه نمی¬شود از میان بر¬دارد. بنابراین، چنانچه پژوهشگر بخواهد داده¬های بدست آمده و شواهد خود را درباره¬ی پدیده¬ی مورد مطالعه از طریق اندازه¬گیری¬های کمی با گردآوری و تحلیل شواهد کیفی تکمیل کند، استفاده از روش¬های تحقیق ترکیبی ضرورت می¬یابد(بازرگان، 1391، ص161). از اهداف این پژوهش، بررسی ویژگی¬های روان¬سنجی سوالات امتحانات نهایی، تعیین و توصیف عملکرد آزمون¬شوندگان از طریق تحلیل پاسخ¬های آن¬ها به منظور شناسایی نقاط قوت و ضعف امتحانات و به دنبال آن ارتقاء کیفیت سوالات آن¬ها بود. ماهیت کمی پاسخ¬های آزمون¬شوندگان، به استفاده از روش¬های ارزیابی کمی سوالات آزمون در قالب دو نظریه کلاسیک اندازه¬گیری و پرسش – پاسخ ضرورت بخشیده و تحلیل کیفی آن¬ها را دشوار ساخته است.
همچنین، به منظور بررسی اعتبار امتحانات نهایی از روش¬های کمی استفاده گردید. بدین منظور، نظریه تعمیم¬پذیری بکار گرفته شد. ضریب اعتبار محاسبه شده با استفاده از روش¬های کلاسیک، قادر به تفکیک منابع چندگانه خطای اندازه¬گیری نیست و همه¬ی آن¬ها را به عنوان خطای تصادفی در نظر می¬گیرد. در حالیکهGT ، سهم هر منبع خطا (رویه) را در واریانس نمرات آزمون تعیین می¬کند و فرصت محاسبه¬ی برآوردهای متفاوتی از اعتبار را می¬دهد که بستگی به این دارد کدام منبع خطا برای هر استفاده¬ی خاص از آزمون مهم در نظر گرفته می¬شود.
اگر چه روش¬های کمی امکان تحلیل جامع و دقیق سوالات آزمون را میسر می¬سازند؛ با این وجود از عهده¬ی تحلیل ساختاری و محتوایی سوالات بر نیامده و نیاز به بررسی¬های کیفی به عنوان مکمل روش-های کمی کاملاً احساس می¬شود. در این تحقیق به منظور بررسی شکلی، ساختاری و محتوایی سوالات آزمون از نظرات دبیران متخصص ماده امتحانی و آشنا به اصول روان¬سنجی، در قالب پرسشنامه¬های محقق ساخته استفاده شد. اگر چه این روش قضاوتی و ذهنی است؛ با این وجود، تنها روشی است که به وسیله بنگاه¬های آزمون¬سازی و پژوهشگران، جهت بررسی روایی محتوایی آزمون¬ها به طور گسترده مورد استفاده قرار می¬گیرد.
جامعه آماری
جامعه در این پژوهش، تمام سوالات امتحانات نهایی رشته¬ی علوم تجربی سال سوم مقطع متوسطه در خرداد ماه 1390 بوده است. جهت بررسی ویژگی¬های روان¬سنجی این سوالات، عملکرد 600 نفر از دانش¬آموزان رشته تجربی سال سوم مقطع متوسطه ناحیه یک شهرستان خرم¬آباد در دو درس ادبیات-فارسی و زیست¬شناسی مورد تجزیه و تحلیل قرار گرفت. تعداد سوالات دروس مذکور به شرح زیر است؛

مقدمه…………………………………………………………. 78
روش تحقیق………………………………………………….. 78
جامعه آماری………………………………………………….. 79
گروه نمونه و شیوه گزینش آن……………………………… 80
روش گردآوری اطلاعات……………………………………… 81
روش اجرای تحقیق………………………………………….. 83
روش تجزیه تحلیل اطلاعات…………………………………. 84

فصل چهارم : تجزیه و تحلیل داده ها

در این فصل از تحقیق؛ به منظور پاسخگویی به سوالات، داده های بدست آمده از 600 برگه امتحان نهایی سال سوم متوسطه در دو درس ادبیات فارسی و زیست شناسی مورد تحلیل قرار گرفت. لازم به یادآوری است که آزمون ادبیات فارسی و زیست شناسی خرداد ماه 90، به ترتیب حاوی 53 و 30 سوال است که با احتساب ریز سوالات، این تعداد به 61 و 78 سوال می رسد.
سوال: روایی امتحانات نهایی دروس ادبیات فارسی و زیست شناسی رشته تجربی سال سوم متوسطه چگونه است؟
برای پاسخگویی به این سوال نیاز است تا به چند سوالی که در ادامه مطرح می گردد، پاسخ داده شود که در این زمینه، اطلاعات متخصصان موضوعی در قالب پرسشنامه های محقق ساخته بکار گرفته شده است. دروس ادبیات فارسی و زیست شناسی با احتساب ریز سوالات، مطابق با ورقه ی امتحانی (سوالات بر اساس ریز بارم مطابق با راهنمای تصحیح در نظر گرفته نشده اند) به ترتیب حاوی 57 و 64 سوال می باشند که برای این بخش از تحلیل، تعداد مذکور در نظر گرفته شده است.

تجزیه تحلیل آماری…………………………………………….. 92

فصل پنجم : بحث و نتیجه گیری

مقدمه………………………………………………………………………. 151
بحث و نتیجه گیری………………………………………………………… 152
یافته های جانبی تحقیق در ارتباط با تصحیح اوراق امتحانات نهایی… 163
محدودیت های تحقیق……………………………………………………. 166
پیشنهادهایی برای تحقیق های آینده………………………………….. 166

فهرست جداول

جدول2-1: مشخصات طرح 1…………………………………………………. 31
جدول 2-2: مشخصات طرح 2………………………………………………… 33
جدول 2-3: مشخصات طرح 3………………………………………………… 34
جدول 2-4: طرح یک رویه ای i P× مطالعهG – اثرات تصادفی……………. 35
جدول 3-1: دروس انتخاب شده و تعداد سوالات………………………….. 79
جدول3-2: توزیع فراوانی جنسیت در جامعه و نمونه ی دانش آموزان رشته ی علوم تجربی…………………………………………………………………………. 81
جدول 3-3: خلاصه اطلاعات جمع آوری شده…………………………….. 82
جدول4-1 : توزیع فراوانی و درصد سوالات دارای اشکال ساختاری در دروس ادبیات فارسی و زیست شناسی……………………………………………………………… 92
جدول4-2: نسبت روایی محتوایی بدست آمده برای سوالات ادبیات فارسی……………………………………………………………………….. 93
جدول4-3: نسبت روایی محتوایی بدست آمده برای سوالات زیست شناسی…………………………………………………………………… 94
جدول4-4: تعداد و درصد سوالات ضروری برحسب شاخص CVR به تفکیک دروس……………………………………………………………………… 94
جدول4-5: توزیع طبقه بندی سوالات به تفکیک دروس………………. 95
جدول4-6: چگونگی توزیع سوالات به فصل های مختلف به تفکیک دروس……………………………………………………………………….. 96
جدول 4-7: طرح برآورد و مشاهده مطالعه برای درس ادبیات فارسی 97
جدول 4-8: جدول منابع تغییر درس ادبیات فارسی برای طرح های اندازه گیری SGR/I،I/SGR، R/SGI ا……………………………………………………………………..97
جدول 4-9: مطالعه G برای طرح اندازه گیری SGR/I ا………………..98
جدول4-10: مطالعه G برای طرح اندازه گیری I/SGR ا………………..99
جدول 4-11: ضرایب تعمیم پذیری برای طرح R/SGI ا………………..101

برای دانلود رایگان قسمت های بیشتراز فایل به انتهای مطلب مراجعه کنید

فهرست نمودار¬ها

نمودار2-1 : طرح 1 ……………………………………………………………32
نمودار2-2 : طرح2 ……………………………………………………………. 33
نمودار2-3: طرح 3……………………………………………………………. 34
نمودار 2-4: سهم واریانس خطای نسبی و مطلق در طرح یک رویه ای متقاطع…………………………………………………………………………36
نمودار2-5: روش های برآورد اعتبار………………………………………….49
نمودار2-6: روش های برآورد روایی…………………………………………61
نمودار3-1: تقسیم بندی واریانس برای طرح برآورد I(S:G:R)…..ا………49
نمودار4-1: نمودار اسکری آزمون ادبیات فارسی……………………….. 119
نمودار4-2 : منحنی ویژگی سوال های آزمون ادبیات فارسی در مدل یک پارامتری…………………………………………………………………… 125
نمودار 4-3 : منحنی ویژگی سوال های آزمون ادبیات فارسی در مدل دو پارامتری………………………………………………………………….. 126
نمودار 4-4 : منحنی ویژگی سوال 48 آزمون ادبیات فارسی بر اساس مدل دو پارامتری……………………………………………………………………….. 127
نمودار 4-5: منحنی آگاهی سوال 48 آزمون ادبیات فارسی بر اساس مدل دو پارامتری…………………………………………………………………….. 128

Abstract

The purpose of the present research was assessment of validity and reliability of biology and literature courses at final exams of the education system of high schools. The studied population of this research was all the items of final exams of third level of high school in science field which was held at June 1390.In order to assess the psychometrics properties of these items, analyzed the performance of 600 students in these two courses at district one of Khorramabad city. In this mixed methods research, in order to assess validity, these exams were assessed in aspects of structure, content, distribution of items according to cognitive Level and the level of coverage of contents of book, using views of subject matter expertise in form of researcher-made questionnaires. reliability of mentioned exams were assessed based on Measurement designs at GT. Also, item of exams were analyzed based on IRT and classical models. We used descriptive measure and independent T-test in order to assess acceptance situation of subjects and compare their performance based on gender.In literature course approximately %95 of items have no structural flaws which represents entirely satisfactory condition. The most structural flaws were in biology course including inappropriate item score with difficulty and importance of item. According to permissive criteria (0.6), in literature and biology respectively (26.31, 67.19) percent of items were identified as essential. Approximately, %60 of items in both courses were belonged to knowledge level. Both students’ scores and items have high reliability .On the other hand, Coef_G absolute scorer was less than 0.70 which demonstrate undesirable correction scorers in both courses. Achieved Coef_G relative for scorers demonstrate that correction methods of scorers in literature has been different and at biology courses has been similar. Estimated reliability coefficient in biology and literature was determined by Cronbach’s Alpha, (0.97, 0.96).Also, according to CTT and IRT models, courses has desirable psychometric properties. The mean score of girls was more than boys in both courses. Empirical evidence represents neutral role of the second scorer in final exams.



بلافاصله بعد از پرداخت به ایمیلی که در مرحله بعد وارد میکنید ارسال میشود.


فایل pdf غیر قابل ویرایش

قیمت25000تومان

خرید فایل word

قیمت35000تومان