سنجش و اندازه گیری . تألیف دکتر علی اکبر سیف

 

فصل اول 

 ما در این فصل برخی از مفاهیم بنیادی مبحث اندازه گیری و سنجش یا اندازه گیری و ارزشیابی را معرفی می کنیم 

 

تعریف آزمون

      آزمون وسیله انداز


 

 

 

سنجش و اندازه گیری . تألیف دکتر علی اکبر سیف

 

فصل اول 

 ما در این فصل برخی از مفاهیم بنیادی مبحث اندازه گیری و سنجش یا اندازه گیری و ارزشیابی را معرفی می کنیم 

 

تعریف آزمون

      آزمون وسیله اندازه گیری در آموزش و پرورش و روانشناسی است ، در اندازه گیری ، ما ویژگیها یا صفات اشیاء و افراد را تعیین و به صورت اعداد و ارقام گزارش می کنیم . برای اندازه گیری ویژگیهای مختلف اشیاء و افراد ، وسایل مختلفی به کار می روند ، مثلاً برای اندازه گیری ویژگیهای طول و وزن اشیاء از متر و ترازو استفاده   می شود

انواع آزمونها

   در آموزش و پرورش و روانشناسی ، آزمونها به چند منظور عمده مورد استفاده قرار می گیرد .

    برای اندازه گیری تواناییهای شناختی و تواناییهای حرکتی و نیز برای اندازه گیری ویژگیهای شخصیت و ویژگیهای عاطفی . آزمونهای مختلف را می توان به دو دسته کلی .

    « آزمونهای توانایی و آزمونهای عاطفی » تقسیم کرد

آزمونهای توانایی

   آزمونهای توانایی ، آموخته ها ، مهارتها و استعدادهای افراد را   می سنجد . دسته ای از این آزمونها ، تواناییهای شناختی افراد را می سنجد و تعدادی دیگر تواناییهای روانی - حرکتی را اندازه  می گیرد ، آزمونهای تواناییهای شناختی بیشتر در زمینهای تحصیلی و فعالیتهای فکری و ذهنی مورد استفاده قرار می گیرند و آزمونهای       روانی- حرکتی غالباً در موقعیتهای صنعتی ، نظامی و تربیت بدنی به کار می روند

آزمونهای به دو دسته :

     1- آزمونهای استعداد 2- آزمونهای پیشرفت تحصیلی تقسیم می شوند .

1- آزمونهای استعداد : مقدار توانایی یا آمادگی فرد را برای انجام دادن کارهایی که در پیش دارد و همچنین ظرفیت او را برای یادگیریهای مختلف می سنجد .

2- آزمونهای پیشرفت تحصیلی : دانش و مهارتهایی را که فرد تا لحظه ی اجرای آزمون کسب کرده است اندازه می گیرند . 

به عبارت دیگر :  

انواع آزمونهای توانایی  

آزمونهای عاطفی  

آزمونهای عاطفی دارای انواع زیادی هستند . ما در اینجا تنها به مهمترین آنها یعنی آزمونهای شخصیت ، آزمونهای نگرش و ازمونهای علاقه اشاره می کنیم

       

آزمونهای شخصیتی   

 می توان شخصیت را به صورت مجموعه رفتارهای فرد در موقعیت های اجتماعی تعریف کرد (ایبل ،1979) .

از این توصیف کلی چنین بر می آید که روشهای سنجش شخصیت باید شامل متغیر های مختلف شناختی ، روانی – حرکتی و عاطفی باشند . از جمله این متغیرها می توان پیشرفت ، هوش ، استعدادهای ویژه ، علاقه ، نگرش و ارزشها و غیره را نام برد.

 

آزمونهای شخصیت بطور عمده به اندازه گیری متغیرهای انگیزش ، مزاج ، سازگاری ، منش و از این قبیل اختصاص یابد .

ابزارهای اندازه گیری :

1- پرسشنامه های گزارش شخصی

2- پرسشنامه های جامعه سنجی .

3- فنون مشاهده ای 

آزمونهای علاقه و نگرش

علاقه و نگرش دو بخش دیگر شخصیت هستند که به خاطر اهمیت زیادی که در امور مشاوره شغلی و تربیتی دارند معمولاً بطور جداگانه سنجش می شوند . هم علاقه و هم نگرش به دوست داشتن ها و دوست نداشتن های افراد اشاره می کنند و هر دو به رجحان های فرد در باره فعالیت ها ، نهادهای اجتماعی ، یا گروهها ارتباط دارند .

 

علاقه به احساس فرد نسبت به یک فعالیت اشاره می کند مثل فعالیت مربوط به یک فعالیت ورزشی (چون فوتبال و والیبال و غیره ) در حالیکه نگرش حاکی از احساس فرد نسبت به یک شیء ، یک نهاد اجتماعی ، یا یک گروه است مثل تیم والیبال ، یا تیم فویبال و ... .

 

در اندازه گیری ، ویژگیها یا صفات بصورت عدد یا رقم گزارش می شود بنابراین می توان گفت : « اندازه گیری عبارت است از فرایندی که تعیین می کند یک شخص یا یک شیء چه مقدار از یک ویژگی برخوردار است . ( گی ، 1991 )

تعریف آزمودن

بنابه تعریف ، وقتی که برای اندازه گیری یکی از ویژگیهای روانی یا تربیتی یک فرد یا گروهی از افراد از آزمون استفاده می شود به این فعالیت آزمودن می گویند .

 

سنجش از آزمودن و اندازه گیری مفهوم گسترده تری دارد . بنابه گفته نتبکو (2001) ، « سنجش یک اصطلاح کلی است و به صورت فرایندی تعریف می شود که برای گردآوری اطلاعات مورد نیاز تصمیم گیری در باره دانش آموزان ، برنامه های درسی و سیاستهای آموزش مورد استفاده قرار می گیرد .

تفاوت میان سنجش ، اندازه گیری و آزمودن

تفاوت میان سنجش ، اندازه گیری و آزمودن این است که هم اندازه گیری و هم آزمودن عموماً با کمیت سر و کار دارند ، اما سنجش الزاماً به کمیت منحصر نمی شود . به سخن دیگر ، زمانیکه اندازه گیری یا آزمودن صورت می پذیرد ، نتیجه بصورت اعداد یا ارقام (کمیت ) نشان داده می شود ، اما نتیجه سنجش می تواند به صورت غیر کمی (توصیفی ) گزارش شود 

 

آزمون پیشرفت تحصیلی وسیله ارزشیابی پیشرفت تحصیلی است . ارزشیابی بنابه تعریف که در کتاب روانشناسی تربیتی از آن دیدیم « عبارت است از سنجش عملکرد یا یادگیرندگان و مقایسه نتایج حاصل با هدفهای آموزش از پیش تعیین شده ، به منظور تصمیم گیری در این باره که آیا فعالیتهای آموزشی معلم و کوششهای یادگیری دانش آموزان به نتایج مطلوب انجامیده است یا نه » .

 

ارزشیابی فرایندی است که از آن طریق ما برای چیزی ارزش قائل می شویم . در ارزشیابی ما کم و زیاد بودن ، خوب و بد بودن ، جلو و عقب بودن ، و از این قبیل را تعیین می کنیم .

با توجه به توضیحات بالا « اندازه گیری اعداد را در اختیار ما قرار می دهد ، قضاوت ، علاقه و تفسیر انسان آن اعداد را به ارزشیابی بدل می سازد .»

 

انواع ارزشیابی ها در آموزش و پرورش

1- ارزشیابی ملاکی و ارزشیابی هنجاری (وابسته به ملاک – وابسته به هنجار )

2- ارزشیابی تکوینی ، تشخیصی و تراکمی

3- ارزشیابی درونی و ارزشیابی بیرونی

 

ارزشیابی های پیشرفت تحصیلی را با توجه به مقاصد ارزشیابی به دو دسته ملاکی و هنجاری تقسیم می کنند . در ارزشیابی ملاک یا ملاک مرجع ، معیار یا ملاک ارزشیابی از پیش تعیین می شود و عملکرد یاد گیرنده در آزمون با توجه به آن ملاک سجش می شود . ملاک های این نوع ارزشیابی غالباً در هدفهای دقیق آموزشی از پیش تعیین می شود .       

 

ارزشیابی ملاکی بر اساس نوعی ملاک مطلق انجام می پذیرد ، از این رو به آن ارزشیابی مبتنی بر ملاک مطلق نیز می گویند .

مثال : آزمونهای پایان ترم دانشگاه ، آزمون گواهینامه رانندگی نمونه ای از ارزشیابی ملاک مطلق بحساب می آید .

 

 

ارزشیابی هنجار مرجع یا ارزشیابی مبتنی بر ملاک نسبی ، بر خلاف ارزشیابی ملاکی ، عملکرد آزمون شونده را نه با یک ملاک مطلق از پیش تعیین شده ، بلکه با عملکرد آزمون شوندگان دیگری که همان آزمون را گذرانده اند می سنجد .

به طور خلاصه ، در ارزشیابی هنجاری هدف عمده این است که تعیین کنیم یک دانش آموز در مقایسه با دانش آموز دیگر ، چه وصفی دارد .

 

ارزشیابی هنجاری و آزمونهای مبتنی بر ملاک نسبی در سنجش هوش و استعداد و نیز در سنجش شخصیت و سایر جنبه های عاطفی به کار می روند . در این آزمونها هیچگونه ملاک از پیش تعیین شده ای مورد استفاده واقع نمی شوند ، بلکه در آنها عملکردهای آزمون شوندگان با یکدیگر مقایسه می شوند .

مثال : آزمونهای کنکور سراسری دانشگاهها و مسابقات علمی نمونه هایی از آزمونهای ملاک نسبی ( هنجاری ) به شمار می روند .

 

نمرات آزمونهای هنجاری به صورت توزیع طبیعی پراکنده می شوند . در این توزیع اکثر نمرات حول هوش میانگین قرار دارند و تعداد کمی از آنها بسیار بالاتر از میانگین و به همان نسبت هم تعداد کمی از نمرات بسیار پایین تر از میانگین قرار دارند . 

 

ارزشیابی تکوینی ، تشخیصی و تراکمی

اجرای آزمون و ارزشیابی از آموخته های دانش آموزان تنها به پایان دوره آموزشی منحصر نمی شود ، بلکه ارزشیابی یک جریان مستمر است که هم در ضمن آموزش و هم در پایان باید انجام پذیرد . بدین منظور شیوه های ارزشیابی مختلفی وجود دارند که در جریان آموزش و یادگیری مورد استفاده قرار می گیرند . 

ارزشیابی تکوینی 

هدف ارزشیابی تکوینی آگاهی یافتن از نمره یادگیری دانش آموزان برای تعیین نقاط قوت و ضعف یادگیری آنان و نیز تشخیص مشکلات روش آموزشی معلم در رابطه با هدفهای آموزشی معین و مشخص است . این ارزشیابی در طول دوره آموزشی ، معین زمانی که فعالیت آموزشی معلم در جریان است و یادگیری در حال تکوین و شکل گیری است انجام می شود .

ارزشیابی تشخیصی :

نوع دیگر ارزشیابی ملاکی که بسیار شبیه به ارزشیابی تکوینی است ارزشیابی تشخیصی نام دارد . علت این نام گذاری آن است که این ارزشیابی با هدف تشخیص مشکلات یادگیری دانش آموزان در یک موضوع درسی به کار می رود و از کج فهمیهایی که منجر به اشتباهات آنان می شود تصویر دقیقی به دست آورد . 

ارزشیابی تراکمی

در ارزشیابی تراکمی ، تمامی آموخته های دانش آموزان در طول یک دوره آموزشی تعیین می شودند و هدف آن نمره دادن به دانش آموزان و قضاوت درباره اثربخشی کار معلم و برنامه درسی ، یا مقایسه برنامه های مختلف درسی با یکدیگر است . از این جهت به این نوع ارزشیابی تراکمی گفته می شود که بوسیله آن می توان یادگیریهای متراکم دانش آموزان را در طولیک دوره اندازه گیری کرد . 

هدف ارزشیابی تراکمی

هدف ارزشیابی تراکمی هم نمره دادن و اتخاذ تصمیمهای پرورشی (ارتقاء دانش آموزان به کلاسهای بالاتر ، دادن امتیازهای تحصیلی ، اعزام به دوره های عالی تر تحصیلی ، اعطای بورس تحصیلی و غیره ) و هم تعیین اثربخشی کار معلم و میزان توفیق او در پیاده کردن مراحل مختلف طرح آموزشی است .

فصل دوم

تهیه طرح آزمون

پیشرفت تحصیلی

هدفهای آموزش رفتاری

هدفهای آموزشی رفتاری ، هدفهای هستند که مقاصد آموزشی معلم را بر حسب رفتار قابل اندازه گیری یا اصطلاحاً عملکرد یادگیرنده بیان می کنند .

 

متخصصان آموزش و ارزشیابی پیشرفت تحصیلی توصیه    می کنند که بهتر است ، هنگام نوشتن هدفهای آموزشی رفتاری ، علاوه بر کاربرد افعال و عبارات مشخص کننده رفتار ، شرایط و اوضاع و احوالی که رفتار باید در آن انجام پذیرد و ملاک موفقیت رفتار نیز ذکر شوند . به این نوع هدفهای رفتاری هدفهای کامل رفتاری گفته می شود . 

نمونه ای از هدفهای کل رفتاری

دانش آموز باید بتواند ، از میان فهرستی از ماشینها و وسایل دیگر که معلم در اختیار او می گذارد ، حداقل پنج ماشین را انتخاب کند که همزمان در دو راه یا بیشتر به انسان کمک می کنند . 

 

هدف بالا ویژگی هدفهای کامل رفتاری را دارد . 

     اولاً : این هدف بر حسب رفتار دانش آموزان نوشته شده است : انتخاب کند.

    ثانیاً : دارای شرایط عملکرد است ؛ از میان فهرستی از ماشینها و

            وسایر وسایل که معلم در اختیار او می گذارد . 

    ثالثاً : این هدف دارای ملاک عملکرد است ؛ حداقل پنج ماشین

             را انتخاب کند .

طرح آزمون پیشرفت تحصیلی

 

انواع آزمونهای پیشرفت تحصیلی

آزمونهای پیشرفت تحصیلی را می توان ابتدا به دو دسته عینی و غیر عینی یا ذهنی تقسیم کرد و سپس این دو دسته کلی را نیز به اجزاء دیگری تقسیم کرد .

   آزمونهای عینی آزمونهایی هستند که هم سئوالها و هم جواب سئوالها را در اختیار آزمون شوندگان قرار می دهند و آزمون شوندگان در باره جوابهای داده شده اعمالی انجام می دهند یا تصمیماتی اتخاذ می کنند . آزمونهای عینی بطور عمده از سه نوع اصلی چندگزینه ای ، صحیح –غلط ، و جور کردنی تشکیل می یابند . 

آزمونهای هستند که در آنها سئوالها در اختیار آزمون شونده گذاشته می شوند و او جواب سئوالها را خود آماده می کند و در برگه امتحانی می نویسد . علت نامگذاری این نوع آزمونها به آزمونهای ذهنی آن است که در تصحیح جوابهای آنها ممکن است نظر مصحح دخالت کند . این نوع آزمونها را نیز می توان به دو دسته آزمونهای گسترده پاسخ و آزمونهای محدود پاسخ تقسیم کرد .

نوعی دیگری آزمون پیشرفت تحصیلی وجود دارد که حد وسط دو نوع آزمون عینی و ذهنی قرار دارند . در این آزمونها که به آزمونهای کوته پاسخ شهرت دارند سئوالها بسیار شبیه به آزمونهای تشریحی هستند ، زیرا پاسخها را خود آزمون شونده باید تهیه کند ، اما سئوالها بسیار دقیق و مشخص هستند . جواب سئوالهای کوته پاسخ معمولاً به یک یا جند کلمه (حداکثر یک جمله ) یا یک عدد و یا یک علامت خلاصه می شود . 

 

انواع آزمونهای پیشرفت تحصیلی از نظر طرح تهیه آنها :

فصل سوم

آزمونهای تشریحی

انواع آزمونهای تشریحی

آزمونهای تشریحی را ، با توجه به آزادی عمل آزمون شونده در پاسخ دادن و به سئوالهای آزمون ، به دو دسته گسترده پاسخ و محدود پاسخ تقسیم می کنند .

آزمون گسترده پاسخ 

در آزمونهای تشریحی گسترده پاسخ ، هیچگونه محدودیتی برای آزمون شونده منظور نمی شود و او عملاً آزاد است تا هر طور که مایل باشد پاسخ خود را بپروراند و سازمان دهد . آزمون شونده در پاسخ دادن به سئوالهای این نوع آزمون از لحاظ زمان و مقدار پاسخ نیز آزادی کامل دارد .

 

آزمونهای تشریحی گسترده پاسخ برای سنجش هدفهای ترکیب و ارزشیابی ( بالاترین طبقه های طبقه بندی هدفهای آموزشی ، حوزه شناختی ) مناسب ترین سؤالها هستند .

مثال : یک آزمون تشریحی گسترده پاسخ : آنچه را که به نظر شما باید در یک برنامه امتحان یک آموزشگاه گنجانده شود بنویسید . 

آزمون محدود پاسخ 

در آزمونهای تشریحی محدود پاسخ ، آزمون شونده در پاسخ دادن به سؤالها آزادی کامل ندارد ، بلکه صورت سؤال او را ملزم می سازد تا پاسخ خود را در چهارچوب شرایطی خاص محدود کند . همچنین این سؤالها برای آزمون شونده از لحاظ زمان و پاسخدهی و تعداد پاسخ محدودیتهایی قایل می شوند .

 

 

در سؤالهای آزمون محدود پاسخ برای اندازه گیری توانایی یادگیرندگان در سطوح فهمیدن ، کار بستن و تحلیل مناسب است ، ولی برای سنجش توانایی ترکیب (خلاقیت) و ارزشیابی زیاد مناسب نیست .

مثال سؤال محدود پاسخ :

« در یک پاراگراف ، به طور خلاصه توضیح دهید که چرا فشارسنج بهترین ابزار پیش بینی وضع هوا است . » 

محاسن و معایب آزمونهای تشریحی

محاسن :

1- تهیه آزمونهای تشریحی از تهیه آزمونهای عینی آسان تر است .

2- توانایی پاسخ دادن به سؤالها را می سنجد نه توانایی انتخاب پاسخها را .

3- موقعیتهای واقعی تری را از آزمونهای عینی به آزمون شوندگان عرضه می کنند .

معایب :

1- این آزمونها نمونه کوچکی از محتوای درس و هدفهای آموزش را اندازه می گیرند .

2- تصحیح برگه های امتحان این گونه آزمونها نمی تواند با دقت و به طور عینی انجام گیرد .

3- تصحیح برگه های امتحانی این آزمونها بسیار وقت گیر است .

قواعد تهیه سئوالات تشریحی

بزرگترین امتیاز آزمونهای تشریحی این است که آزمون شوندگان را وا می دارند تا اندیشه های خود را بطور منطقی ، منسجم و سازمان یافته بیان کنند و در این کار خلاقیت خود را نشان دهند . این است تفادوت عمده آزمونهای تشریحی و آزمونهای عینی ، قواعد زیر به منظور تحقق کاستن از معایب این سئوالها پیشنهاد شده اند .  

قواعد تهیه سئوالهای تشریحی به شرح زیر است 

1- در نوشتن صورت سئوالها ، با رسم جدول مشخصات آن درس ، سئوالها بطور مستقیم به هدفهای آموزشی ربط شوند .

2- به اندازه گیری هدفهایی محدود کنید که با سایر آزمونها قابل اندازه گیری نیستند .

3- صورت سئوالهای تشریحی را با عبارات و کلمات واضح بنویسید و از کلی گویی بپرهیزید .

4- از کاربرد کلمات «چی کسی » ، « چه وقت » ، « کجا » و جزء اینها بپرهیزید .   

5- تا حدامکان از سئوالهای تازه و موقعیتی جدید استفاده کنید .

6- سئوالهای مربوط به موضوعات و عقاید بحث انگیز طوری طرح شوند که از آزمون شونده بخواهند تا شواهد مستند را بیان کند .

7- به آزمون شوندگان حق انتخاب چند سئوال از میان تعدادی سئوال را ندهید .

8- برای پاسخ دادن به سئوالها ، زمان کافی در نظر بگیرید و زمان هر سئوال را نیز بطور جداگانه مشخص کنید .

قواعد تصحیح سئوالهای تشریحی

1- پاسخهای سئوالات را تنها بر اساس هدفی که در سئوال گنجانده شده است تصحیح کنید .

2- با نوشتن یک پاسخ نمونه برای هر سئوال به عنوان کلید ، از دخالت عوامل نامربوط جلوگیری کنید  .

3- پاسخ را سئوال به سئوال تقسیم کنید نه ورقه به ورقه .

4- هنگام تصحیح ورقه های امتحانی از شناسایی نام صاحبان آنها خودداری کنید .

5- در صورت امکان از یکی دو نفر از همکارانتان بخواهید تا سئوالهایی را که شما تصحیح کرده اید تصحیح کنند .

6- بر روی برگه های آزمون اشتباهات دانش آموزان را تصحیح کنید و اظهار نظرهای خود را بنویسید .

7- تمام پاسخهای آزمون شوندگان به یک سئوال را در یک نشست و بدون وقفه زمانی تصحیح کنید .

8- از روش تحلیلی و کلی نمره گذاری استفاده کنید . 

 

 آزمونهای کوته پاسخ 

 

 آزمونهای کوته پاسخ حد وسط بین آزمونهای تشریحی و عینی است . شباهت این نوع آزمون با آزمونهای تشریحی آن است که در هر دو آنها به صورت سئوال بوسیله طراح سئوال تهیه می شود و جواب آنها را آزمون شونده تهیه می کند .

تعریف آزمون کوته پاسخ

آزمون کوته پاسخ از مجموعه ای سئوال مختصر که غالباً برای سنجش هدفهای آموزشی سطح پایین مطرح می شوند تشکیل می یابد . سئوالهای آزمون کوته پاسخ از آزمون شونده می خواهند تا کلمه ، عبارت ، جمله ، عدد ، یا علامتی را در پاسخ به یک سئوال یا تکمیل یک جمله بنویسند .

 

انواع آزمونهای کوته پاسخ :

1- نوع پرسشی

مثال : مرکز استان مازندران کجاست ( ساری )

2- نوع کامل کردنی

مثال : بزرگترین دریاچه دنیا دریاچه ............ است . ( خزر )

3- نوع تشخیصی یا تداعی

مثال : بعد از نام هر استان ، نام مرکز آن را بنویسید .

خوزستان ____    ( اهواز )

خراسان   ____    ( مشهد )

مرکزی    ____    ( اراک )

محاسن و معایب آزمونهای کوته پاسخ :

محاسن :

1- اجرای آنها آسان است

2- تقلب را کاهش می دهند .

3- نسبت به آزمونهای عینی چند گزینه ای ، صحیح – غلط و جور کردنی اطلاعات تشخیصی بیشتری را در اختیار معلمان می گذارند .

4- سهولت تهیه سؤالات و تصحیح پاسخهای آنها . 

 

معایب : 

1- نمی توان از آنها برای سنجش هدفهای بالای یادگیری استفاده کرد و کاربرد آنها حداکثر به سطح هدفهای فهمیدن و کاربستن محدود می شود .

2- کاربرد زیاد آنها ، سبب تشویق یادگیرندگان به حفظ کردن اطلاعات جزئی و بی اهمیت خواهد شد .

3- تصحیح و نمره گزاری پاسخ این آزمونها به دقت و سرعت آزمونهای عینی عملی نیست .

 

 

قواعد تهیه سؤالات آزمونهای کوته پاسخ :

1- هر سؤال باید موضوع مهمی را شامل شود .

2- صورت سؤال را طوری بنویسید که به پاسخ مشخص و واحدی نیاز داشته باشد .

3- در سؤالهایی که پاسخهای آنها اعداد هستند ، واحد مقیاس و میزان دقتی را که در محاسبات باید رعایت شود مشخص کنید .

4- در سؤالات کوته پاسخ کامل کردنی ، کلمات و عبارات مهم را حذف کنید . 

 

5- در سؤالهای کامل کردنی که برای ارزشیابی پیشرفت تحصیلی به کار می روند تعداد زیادی جای خالی منظور نکنید .

6- جای خالی سؤالهای کامل کردنی را تا آنجا که ممکن است در قسمت آخر سؤال قرار دهید .

7- تا حد امکان به جای سؤالهای کامل کردنی ، از سؤالهای پرسشی استفاده کنید .

8- در سؤالات کامل کردنی ، از کاربرد اشارات دستوری که جواب را مشخص می کنند خودداری کنید .

9- صورت سؤال را با نقل عین جملات کتاب ننویسید .

 

فصل پنجم 

آزمونهای صحیح – غلط

و جور کردنی

در این فصل دو نوع آزمون عینی ، یعنی آزمون صحیح غلط و آزمون جور کردنی را معرفی می کنیم . در مقایسه با آزمون چند گزینه ای که متداول ترین نوع آزمون عینی است ،آزمونهای صحیح و غلط و جور کردنی آسان تر تهیه می شوند و کاربرد کلاسی بیشتری دارند . 

 

وجه تمایز آزمونهای عینی و ذهنی :

1- ویژگی مهم همه آزمونهای عینی این است که تصحیح جواب آنها به طور کاملاً دقیق و عینی انجام می گیرد و در آن نظر شخصی مصحح هیچ گونه دخالتی ندارد .

2- وجه تمایز دیگر این است که آزمونهای عینی توانایی بازشناسی یا تشخیص را می سنجد ، در حالیکه آزمونهای تشریحی توانایی بازخوانی یا یادآوری را اندازه می گیرند .

 

آزمونهای صحیح – غلط

در آزمون صحیح – غلط تعدادی سؤال یا جمله در اختیار آزمون شونده گذاشته می شود و او صحیح یا غلط بودن آنها را تعیین می کند .

 

انواع سؤالهای صحیح – غلط 

1- نوع صحیح – غلط

مثال : مجموع زاویه های داخلی هر چهار ضلعی 360 درجه است . صحیح – غلط

2- نوع بله – نه

مثال : مرکز استان آذربایجان غربی شهر ارومیه است ؟ بله – نه

3- نوع اصلاحی

مثال : جذر عدد 64 ، 9 است .

دانش آموز باید عدد 9 را خط بزند و بجای آن عدد 8 را قرار دهد .

4- نوع خوشه ای

محاسن و معایب آزمونهای صحیح – غلط 

 

 

 

محاسن :

1- بیان موضوعهای درسی در قالب عبارات ساده

2- سادگی تهیه

3- عینی بودن تصحیح جوابها

4- زیادی تعداد آنها در هر جلسه  امتحان

معایب 

1- این آزمونها اغلب برای سنجش اطلاعات جزئی و کم اهمیت به کار می روند

2- حدس زدن کور کورانه در آنها خیلی زیاد است .

3- کاربرد زیاد آنها سبب تأکید بی مورد بر حفظ طوطی وار اطلاعات کم اهمیت می شود .

4- آنها بیشتر برای سنجش هدفهای سطح پایین مفیدند و توانائیهای پیچیده سطح بالا را اندازه نمی گیرند .  

 

قواعد تهیه سئوالهای صحیح – غلط 

1- سئوالها را تا حد امکان مختصر ، ساده و روشن بنویسید .

2- جملاتی بکار برید که به طور آشکار درست یا غلط باشند .

3- از کاربرد کلماتی چون همه ، بعضی وقتها ، غالباً ، هرگز و از این قبیل پرهیز کنید .

4- سعی کنید طول سئوالها ی صحیح و طول سئوالهای غلط هم اندازه باشند .

 

5- سعس کنید تعداد سئوالهای صحیح و غلط تقریباً به یک اندازه باشد .

6- سئوالهای صحیح – غلط را از روی جملات کتاب ننویسید .

7- سعی کنید هر سئوال به یک هدف آموزشی مهم مربوط باشد و از گنجاندن مطالب بی اهمیت در سئوال پرهیز کنید . 

آزمونهای جور کردنی 

آزمونهای جور کردنی از تعدادی سئوال تشکیل می شوند که هر یک از آنها شامل دو ستون است . یک ستون معرف پرسشها و ستون دیگر نشان دهنده پاسخ هاست . وظیفه آزمون شونده آن است که پاسخها را با پرسشهای مربوط جور کند . 

 

آزمونهای جور کردنی فقط به الگوی بالا منحصر نمی شوند . و الگوهای دیگری را نیز می توان به کاربرد . برای مثال ، می توان نقشه ای را که در آن نقاط مختلفی با شماره یا حروف مشخصی مشخص شده اند در اختیار دانش آموزان گذاشت و از آنان خواست تا این شماره هایی حروف را با نام شهرها ، دریاچه ها ، رودخانه ها یا مواردی از این قبیل جور کنند .

نکته مهم 

تفاوت سئوالهای جور کردنی رده بندی و معمولی

در سئوالهای رده بندی یک پاسخ را می توان بیش از یک بار به کار برد و بنابرایتن تعداد پرسشها می تواند بیش از تعداد پاسخها باشد . اما در سئوالهای جور کردنی معمولی تعداد پاسخها بیش از تعداد پرسشها است .

محاسن و معایب آزمونهای جور کردنی

محاسن

1- سئوالهای آزمونهای جور کردنی برای آزمون دانش اصطلاحات ، تعاریف ، تاریخها ، رویدادها ، و سایر موراد به روابط ساده بسیار نباشند .

2- از آنجا که خواندن این سئوالها زمان زیادی لازم ندارد ، تعداد زیادی از انها را می توان در یک زمان معین مورد استفاده قرار داد

3- تصحیح سئوالهای جور کردنی به سرعت و سهولت امکان پذیر است و نیازی به مصحح مشخص ندارد . 

معایب آزمون جور کردنی

1- از آنجا که در یادگیری تداعی بین امور حفظ طوطی وار دخالت زیادی دارد ، و معلمان غالباً در تهیه این نوع سئوالها بر روابط حفظی بین امور تأکید می کنند .

2- بعضی وقتها پیدا کردن مجموعه ای از پرسشها ، که به اندازه کافی شبیه به هم باشند تا بتوان برای آنها مجموعه پاسخهای همگونی پیدا کرد ، کار دشواری است .

قواعد تهیه سئوالهای جور کردنی 

1- پرسشهاو پاسخهای متناجس و یا همگون انتخاب کنید .

2- طول و فهرست پرسش و پاسخ را کوتاه انتخاب کنید .

3- در راهنمای یئوال ، اطلاعات لازم را درباره نحوه مقایسه و جور کردن پاسخها و پرسشها در اختیار دانش آموزان قرار دهید .

4- همه پرسشها و پاسخهای یک سئوالی را در یک صفحه قرار دهید . 

5- در صورت امکان فهرست پاسخها را بطور منطقی مرتب کنید .

6- در فهرست پرسشهای سئوالهی جور کردنی از کاربد جملات نیمه تمام خودداری کنید .

7- پرسشها را با شماره و پاسخها را با حروف مشخص کنید .

8- هریک از پاسخها برای تمام پرسشهای یک سئوال درست جلوه کند . 

فصل ششم 

آزمونهای چند گزینه ای

 

آزمون چند گزینه ای متداول ترین آزمون عینی است که هم در سنجش تواناییهای مختلف و هم در سنجش پیشرفت تحصیلی در زمینه های گوناگون تحصیلی مورد استفاده واقع می شود . آزمون های چند گزینه ای هم از لحاظ یکنواختی سئوالها ، هم از لحاظ حساسیت کم در قابل حدس کورکورانه و هم از لحاظ سهولت تصحیح پاسخنامه ها بهترین نوع آزمونهای عینی هستند. 

تعریف آزمون چند گزینه ای

آزمون چند گزینه ای شامل تعدادی سئوال است که هریک از آنها از یک قسمت اصلی و تعدادی گزینه (پاسخ ) تشکیل می شود و آزمون شونده از میان گزینه های پیشنهادی گزینه های صحیح (پاسخ سئوال ) را انتخاب می کند . 

ویژگیهای سئوالهای چند گزینه ای

هر سئوال چند گزینه ای شامل قسمتهای اصلی زیر است :

1- قسمت اصلی یا تنه سئوال .

2- گزینه درست یا پاسخ سئوال .

3- گزینه های انحرافی

انواع سئوالهای چند گزینه ای 

1- نوع تنها گزینه درست . مثال : اگر 27 = 3 R باشد ، R برابر است با :

الف : 3      ب : 9          ج :  11       د:  30

2- نوع بهترین گزینه مثال : می توان گفت یادگیری عبارت است از :

 الف : کسب اطلاعات تازه در نتیجه آموزش

ب : ایجاد تغییرات نسبتاً پایدار در رفتار بالقوه یادگیرنده

ج :ایجاد تغییرات مطلوب در رفتار

د: توانایی به خاطر سپردن و یادآوری

3- نوع منفی :

مثال : کدامی از عبارت های زیر در باره ویروس درست نیست ؟

محاسن استفاده از آزمونهای چند گزینه ای 

1- این آزمونها از سایر آزمونها انعطاف پذیرترند .

2- در یک زمان محدود تعداد زیادی از هدفهای آموزشی را اندازه گیری کرد .

3- نسبت به آزمونهای صحیح – غلط کمتر امکان حدس زدن کورکورانه را به آزمون شونده می دهند .

4- پاسخها به سادگی و با عینیت کامل قابل تصحیح هستند .

5- اگر گزینه های انحرافی به خوبی تهیه شوند ، منبع بسیار مناسبی برای تشخیص مشکلات دانش آموزان خواهند بود .

معایب آزمونهای چند گزینه ای 

1- ساختن این آزمونها بسیار دشوار است .

2- معلمان اغلب سئوالهای چند گزینه ای را در حد سنجش اطلاعات جزکی و کم اهمیت می نویسند .

3- مستلزم صرف وقت زیاد است .

4- در صورت اعمال نمره منفی دانش آموزانی که خطر    می کنند از سایر دانش آموزان نمره بهتری می گیرند . 

اهم قواعد تهیه سئوالهای چند گزینه ای

1- هر سئوال به روشنی موضوع مورد نظر را بیان کند

2- موضوع اصلی را در تنه سئوال بنویسید .

3- مطالب تکراری گزینه ها را در تنه سئوال قرار دهید .

4- هر سئوال یک موضوع مهم را اندازه بگیرد .

5- گزینه های یک سئوال با هم تجانس داشته باشد .

 

 

فصل هفتم

سنجش هدفهای آموزشی مختلف

با انواع آزمونها

 

در این فصل دانشجوی محترم را با نمونه هایی از این آزمونها که به منظور سنجش هدفهای گوناگون طبقه های مختلف طبقه بندی هدفهای آموزشی تهیه تهیه شده اند آشنا خواهیم کرد . طبقه بندی هدفهای آموزشی مورد نظر ما همان طبقه بندی هدف های آموزشی معروف بلوم است که در فصل دوم معرفی شد . در این فصل سئوالهای نمونه را برای سنجش طبقه های مختلف حوزه شناختی           می آوریم . 

نمونه سئوال های مربوط به طبقه بندی هدفهای پرورشی

1- دانش

10/1- دانش امور جزکی

11/1- دانش اصطلاحات

1- کدامیک از عبارتهای مربوط به حرکت موج که در زیر آمده اند زمان را تعریف می کند ؟

الف : حداکثر فاصله ای که یک ذره از نقطه سکون خود در تغییر مکان طی می کند .

ب: طول مدت زمانی که یک ذره برای یک ارتعاش کامل نیاز دارد .  

ج: تعداد ارتعاشات کامل در ثانیه

د:سرعت زمانی تغییر فاصله در جهتی معین .

 

12/1 دانش واقعیتهای مشخص

 

2- جنگ جهانی اول از .................. تا .................. به طول انجامید .

 

20/1 دانش راهها و وسایل برخورد با امور جزئی

21/1 دانش امور قراردادی

3- قطبهای آهنربا با چه صورتی معرفی می شوند ؟

الف : منفی – مثبت                ب: قرمز و آبی 

ج : غربی و شرقی                   د : شمالی و جنوبی

 

4- مراحل زندگی مگس خانگی به ترتیب عبارتند از :

الف : کرم – تخم – شفیره – مگس بالغ

ب : شفیره – کرم – تخم – مگس بالغ

ج : شفیره – تخم – کرم – مگس بالغ

د : تخم – کرم – مگس بالغ – شفیره

 

کدامیک از مواد زیر نشان دهنده یک واکنش شیمیایی است؟

الف :   تبخیر الکل

ب : یخ زدن آب

ج : سوختن نفت

د : ذوب شدن موم

 

 

 6- به نظر روسکین بهترین نقاش آن است که :

الف : واقعیت را به دقت تقلید می کند .

ب : بیشترین آموزش را به ما می دهد .

ج : بزرگترین قدرت را نشان می دهد .

د : تعداد بیشتری از اندیشه های بزرگ را انتقال می دهد . 

 

 

7- دانشمند واقعیتهای تازه را به چه طرقی کشف می کند .

الف: بررسی نوشته های ارسطو

ب : اندیشیدن درباره احتمالات

ج : انجام مشاهدات دقیق و اجرای آزمایش

د : مذاکره با دوستان درباره سوالها

ه : مراجعه به آثار داروین

 

30/1 دانش امور کلی و انتزاعی یک رشته

31/1 دانش اصلها و تصمیم ها

8- اگر حجم مقدار معینی از گاز ثابت نگهداشته شود ، فشار آن را چگونه  می توان کاهش داد ؟

الف : کاهش حرارت

ب : افزایش حرارت

ج : دادن گرما

د : کاهش چگالی

ه : افزایش چگالی

   

 

راهنمایی سئوال : به شواهد احتمالی تأئید کننده نظریه تکامل زیست شناسی مربوطند . از میان فهرست زیر طبقه ای را انتخاب کنید که شواهد ذکر شده در سئوال به آن مربوط است .

الف – کالبد شناسی

ب – فیزیولوژی تطبیقی

ج – طبقه بندی

د – رویان شناسی

هـ - دیرین شناسی

9- قلب انسان در مرحله بسیار ابتدایی رشد دارای دو حفره است .

 

10/2 ترجمه از یک سطح انتزاعی به سطحی دیگر .

10- گروهی از متخصصان مشغول یک طبقه بندی از هدفهای پرورشی هستند . به زبان معمولی این گروه از افراد به چه کاری مشغولند .

الف- ارزشیابی از پیشرفت آموزش و پرورش

ب – دسته بندی هدفهای نهایی آموزش

ج- تهیه یک برنامه درسی

د- تهیه تمرین های یادگیری  

 

11- قانون جاذبه نیوتن یا فرمول جبری               G=F نشان دهنده نیرو M و

 

 m دو جرم مختلف ، G یک مقدار ثابت ، و d فاصله دو جرم است . اگر فرض کنیم M و m همانند G مقداری ثابت هستند کدامیک از نمودارهای زیر نشان دهنده تغییر نیرو و بر اثر تغییر فاصله بین دو جرم است ؟

الف :                                                 ب :                     

                      

 

سئوال 12 را با توجه به غزل زیر جواب دهید .

1- حسن تو دائم بدین قرار نماند               مست تو جاوید در خمار نماند

2- ای گل خندان نوشکفته نگه دار            خاطر بلبل که نوبهار نماند

3- حسن دلاویز پنجه ای است نگارین        تا به قیامت بر او نگار نماند 

 

     

 

 12- در سئوال بالا ، سعدی

الف – معشوق خود را از همه زیبایان بهتر می داند .

ب – می گوید زیبایی زودگذر است نباید به آن مغرور بود

ج – حسن و زیبایی را پدیده ای جاودانی فرض کرده است

د – بلبل را ستایشکر زیبایی گل بهاری می داند 

 

مردم شناسی می خواهد بداند که بین سفید پوستان و سیاه پوستان اختلاف هوشی وجود دارد یا نه ؟ او یک آزمون گروهی میزان شده را با تمام دانش آموزان در کلاسهای مختلف مدارس یک شهر کوچک که دارای یک دوره فوق دیپلم نیز هست به اجرا در آورد . نتایج حاصل در جدول زیر ارائه شده است .

1-                    300                103              75                  85

2-                    275                99                60                  90

3-                    260                101              35                  105

 

 

سئوال 13 بعضی از سیاه پوستان از بیشتر مردم باهوش ترند .

الف – این نتیجه معتبر است

ب – این نتیجه احتمالاً درست است ، اما نمی توان در این باره مطمئن بود ، زیرا سیاه پوستان در این تحقیق یک گروه منتخب هستند .

ج – این نتیجه احتمالاً درست است ، اما نمی توان در این باره مطمئن بود ، زیرا هم سفیدپوستان و هم سیاه پوستان در این تحقیق گروههای منتخب هستند .

د – این نتیجه احتمالاً نادرست است زیرا میانگین هوشبر کلاس اولی های سیاه پوستان 18 نمره کمتر از میانگین هوسبر سفید پوستان کلاس اول است .

3 ) کار بستن 

کاربرد اصول

سئوال 14 – یک اتوی برقی (110 ولت ، 1000 وات ) برقی مورد استفاده قرار گرفته و دو شاخه اتصال آن قدری سوخته است و منجربه تولید مقاومت اضافی شده است ، این مقاومت اضافی بر مقدار حرارتی که اتو تولید می کند چه اثری دارد . 

الف – اتو اکنون بیش از زمان نو بودن گرما تولید می کند .

ب – اتو اکنون به همان اندازه نو بودن گرما تولید می کند .

ج – اتو اکنون کمتر از زمان نو بودن حرارت تولید می کند .

4 ) تحلیل

1/4 تحلیل عناصر

سئوال 15 : گالیله مسئله شتاب سرعت اجسام در حال سقوط را بوسیله غلتانیدن گلوله ها بر روی سطوح بسیار صاف با زاویه شیب فراینده مورد بررسی قرار داد ، زیرا او برای اندازه گیری فواصل زمانی کوتاه هیچ ابزاری در اختیار نداشت . او از اطلاعات به دست آمده به استخراج نتایجی درباره سقوط آزاد اجسام پرداخت . کدامیک از موارد فرض؟؟؟/ مربوط به استخراج او را نشان می دهد ؟

 

 

الف – مقاومت هوا در سقوط آزاد قابل چشم پوشی است

ب – اجسام با شتاب ثابت سقوط می کنند .

ج – شتاب مشاهده شده در سطوح شیب دار برابر با شتاب در سقط آزاد است

د – سطوح مستوی بدون اصطهلاک هستند .

هـ - سطح قائم و سطحی که تقریباً قائم است بر روی گلوله غلتان اثر تقریباً مساوی دارند 

2/4 تحلیل روابط 

به سئوال 16 با توجه به پاراگراف زیر جواب دهید .

1) هاملت از روح پدر مقتول خود دستور می گیرد که از قاتل ، کلادیوس ، انتقام بکشد

2) او به فوریت قادر به انجام این کار معین ، زیرا دلایلی کافی است که نشان دهد کلادیوس قاتل پدر اوست در دست ندارد .

3)  هاملت در جریان کشف دلیل ، ناخواسته به پادشاه اجازه می دهد تا به شک او پی ببرد .

4) ...

5) ...

 

سئوال 16 – بحث و ارزیابی از متن فوق حول نکته ای که در جمله (جملات) زیر آمده است دور می زند . آن جمله (جملات) کدام است ؟

الف : جمله 1

ب : جملات 2 و 3

ج : جملات 2 و 4

د : جمله 5

 

 

سئوال زیر مبنی بر یک قطعه موسیقی است که در ضمن امتحان اجرا میشود .

17- ساخت یک قطعه موسیقی عبارت است از :

الف – مایه و واریاسیونها

ب – مایه ، بسط ، تجدید بیان

ج – مایه اول ، بسط مایه دوم ، بسط

د – مقدمه ، مایه ، بسط

سئوال بالا خواستار تحلیل آرایش یا ساخت منطمی است که قطعه موسیقی را بصورت یک واحد یکپارچه در آورد .    

 

100/5 تولید یک اثر بی همتا یا منحصر بفرد

سئوال 18 – به زمانی در زندگی خود فکر کنید که با مشکلی روبرو بودید ، چیزی برسر راه شما قرار داشت و می بایست بر آن فایق می آمدید . درباره این مشکل داستانی بسازید و آن را برای دانش آموزان کلاس بگوئید .

2/5 تولید یک طرح یا یک مجموعه اقدامات پیشنهادی

سئوال 19 – به کمک داده های حاصل از یک تحقیق ، تفاوتهای بین میزان این بزهکاریها را چگونه تبین می کنید.

(میتوانید از نظر یا مطلبی که در طی درس به شما ارائه شده استفاده کنید )

00/6 ارزشیابی

برای تشخیص توانایی ارزشیابی نیز بهترین نوع سئوال ، سئوال تشریحی است . با وجود این متخصصان اندازه گیری و ارزشیابی پیشرفت تحصیلی معتقدند که از سئوالهای عینی نیز برای سنجش ارزشیابی می توان استفاده کرد .

1/6 داوری بر اساس شواهد درونی

سئوال 20- مأموران رفاه اجتماعی بعضی اوقات در بررسی تقاضاهای مربوط به غرامت بیکاری با مسائل پیچیده ای مواجه می شوند . تعدادی ازبازیکنان یک تیم عمده بیس بال در ماه ژانویه تصمیم گرفتند که چون از پایان فصل بازی تا آن زمان نتوانسته بودند در بازی شرکت کنند خود را در زمره بیکاران به حساب آورند . بعضی از آنها ادعا می کردند که مستحق دریافت غرامت های بیکاری مربوط به به ؟؟؟؟/ رفاه اجتماعی هستند ....

 

نتایج زیر را مورد بررسی قرار دهید . با فرض اینکه پاراگرافهای بالا مشکل طرح شده را به خوبی توضیح داده اند ، کدامیک از نتایج به نظر شما منطقی است .

الف – بازیکنان مستحق دریافت مزایای بیکاری مربوط به رفاه اجتماعی بودند .

ب - بازیکنان مستحق دریافت مزایای بیکاری مربوط به رفاه اجتماعی نبودند .

ج – اطلاعات بیشتری لازم است تا معلوم شود که بازیکنان مستحق دریافت مزایای بیکاری مربوط به قانون رفاه اجتماعی شوند یا نه .

2/6 داوری بر اساس شواهد درونی

 

فصل هشتم

اجرا ، نمره گذاری و تحلیل آزمونها

شما در فصل های پیش با روش تهیه طرح آزمون و نحوه نوشتن آزمونهای مختلف آشنا شدید . در این فصل روش اجرای آزمونها ، طرز تصحیح پاسخها ، روش نمره گذاری ، و چگونگی تحلیل سئوالها را یاد خواهید گرفت . همچنین با استفاده از نتایج حاصل از آزمون خود به تجدید نظر در آن و رفع نواقص و اشکالات آن اقدام کنید .

شرایط اجرای آزمون

اولین گام در اجرای آزمونهای پیشرفت تحصیلی آماده سازی آزمونها و شرایط اجرای آنهاست . تهیه پرسشنامه ها و پاسخنامه ها ، ترتیب پشت سر هم قرار گرفتن سئوالهای مختلف ، و زمان و مکان آزمون نیاز به دقت فراوان دارند . مجموعه این عوامل باید به گونه ای باشند که برای هر یک از آزمون شوندگان حداکثر امکانات را ، به منظور بهترین عملکرد آْنان ، فراهم آورند .

ترتیب سئوالهای آزمون

ترتیب قرار دادن سئوالهای مختلف یک آزمون به دنبال یکدیگر :

1- سئوالهای صحیح – غلط

2- سئوالهای جور کردنی

3- سئوالهای چند گزینه ای

4- سئوالهای کوته پاسخ

5- سئوالهای تشریحی

 علاوه بر گروه بندی سئوالهای بر حسب نوع ، لازم است سئوالهای مختلف هر نوع را نیز بر حسب موارد زیر دسته بندی کنید !

1- سئوالهای مربوط به هر طبقه از هدفهای آموزشی مانند : دانش ، کاربرد ، و ... به دنبال هم قرار دهید .

2- سئوالها را از ساده به دشوار مرتب کنید .

3- در تنظیم سئوالهای یک آزمون سازمان اصلی مطالب را حفظ کنید .

نوشتن دستور العمل یا راهنمای آزمون :

راهنمای آزمون باید مختصر و مفید باشد و به طور آشکار به آزمون شونده بگوید که چه کاری را انجام دهد . مهرنزولیهان ( 1984 ) گفته اند که راهنمای آزمون باید اطلاعات زیر را در اختیار آزمون شوندگان قرار دهد .

1- زمان لازم برای هر قسمت 

2- ارزش هر سؤال

3- مجاز یا غیر مجاز بودن حدس زدن

اجرای آزمون  

شرایط اجرای آزمون های پیشرفت تحصیلی باید به گونه ای باشد که از هر لحاظ آسایش جسمی و فکری آزمون شوندگان را تأمین نماید علاوه بر شرایط فیزیکی ، شرایط درونی آزمون شوندگان نیز بر عملکرد آنان تأثیر دارد مهمترین این عوامل اضطراب زیاد است . پژوهش ها نشان می دهد اندکی اضطراب سبب افزایش دقت و کوشش آزمون شونده می شود ، اما اضطراب زیاد بر عملکرد او تأثیر منفی دارد .

نمره گذاری :

در نمره گذاری آزمون های عینی دو روش عمده وجود دارد:

الف : احتساب کلیه پاسخهای درست بدون کسر نمره برای حدس زدن

ب : کسر مقداری از نمره برای جبران حدس زدن .

تعدا پاسخهای درست = r

تعداد پاسخهای غلط = w

تعداد گزینه های هر سؤال = n

                              - n = نمره اصلاح شده 

مثال : فرض کنید که در یک آزمون چهار گزینه ای ( 4=n ) که دارای 50 سؤال است ، دانش آموزی به 45 سؤال پاسخ داده است و از این تعداد 6 سؤال غلط ( 6=w ) و 39 سؤال درست است ( 39=r ) نمره اصلاح شده این دانش آموز برابر است با :

 

 r = = نمره اصلاح شده

 

-39 = نمره اصلاح شده

 

                                                                                                                               - 39 =

                                                                                                                              2-39 =

                                                                                                                                  37 =

                                                                                   نمره دانش آموز 8/14 = 4/0 × 37 =

   

 

هدف از تحلیل سؤالهای آزمون وارسی یک یک سؤالها و تعیین میزان دقت و نارساییهای آنها است . در تحلیل سؤالهای آزمون نقاط قوت و ضعف یک آزمون و کیفیت تک تک سؤالهای آن تعیین می شود . تحلیل پاسخهای آزمون شوندگان اطلاعات تشخیصی لازم را برای بررسی کیفیت یادگیری دانش آموزان و مشکلات آموزشی معلمان فراهم می آورد .

مراحل تحلیل سؤال :

اطلاعات مورد نیاز برای تحلیل سؤالهای یک آزمون ، پاسخهایی هستند که آزمون شوندگان به هر سؤال داده اند یعنی باید تعیین شود که در هر سؤال چند نفر گزینه های درست را انتخاب کرده اند . هر یک از گزینه های انحرافی چند نفر را به خود جلب کرده است ، چند نفر آن را بی جواب گذاشته اند .

 

برای این منظور بهتر است از کارت تحلیل سؤال استفاده نمود .

 

نمونه کارت تحلیل سؤال :

 

نمونه سؤال با توجه به چارت تحلیل بالا 

چهل و هشت نمره از یک مجموعه 100 نمره ای پایین تر از 54 است . چهار نمره معادل 54 است . رتبه درصدی نمره 54 چند است ؟ ( اگر گزینه ب صحیح باشد )

الف : 48

ب : 50

ج : 52

د : 54

1- ضریب دشواری = 35                 35=100 ×                 = ضریب دشواری

2- ضریب تمیز = 3/0                     3/0 =         =              = ضریب تمیز 

تعیین گروه بالا و گروه پایین :

متخصصان آزمون سازی ( ویتنی و سیبرز و نتیکو ) پیشنهاد کرده اند اگر تعداد کل برگه های آزمون بین 20 تا 40 نفر هستند 10 برگه بالا و 10 برگه پایین را انتخاب کنید . اگر تعداد کل برگه های شما 20 عدد باشد ، همه آنها به دو دسته بالا و پایین تقسیم خواهند شد . اگر تعداد کل برگه ها کمتر از 20 باشد به دو دسته بالا و پایین تقسیم کنید . در شرایطی که تعداد کل آزمون شوندگان بیش از 40 نفر است ، بهترین رقم برای گروه بالا و پایین 27% کل برگه هاست .

فرمول محاسبه ضریب دشواری

 

 

نکته :

فرمول محاسبه ضریب تمیز 

 

                                                                      = ضریب تمیز سؤال

 

با توجه به مثال بالا                                          = ضریب تمیز سؤال

 

                                                                     =

                                                              3/0 =

نکته : 

هر قدر ضریب تمیز بزرگتر باشد ، قوه تمیز آن سؤال بیشتر و هر قدر این ضریب کوچکتر باشد قوه تمیز آن کمتر است . مثلاً قوه تمیز سؤالی 90/0 باشد ، آن سؤال آزمون شوندگان قوی و ضعیف را بخوبی از هم جدا خواهد کرد . اما اگر ضریب تمیز سؤالی 10/0 باشد آن سؤال از عهده جداسازی دانش آموزان قوی و ضعیف بخوبی بر نخواهد آمد .

رابطه بین ضریب دشواری و ضریب تمیز 

شکل 2-8 رابطه بین ضریب دشواری و ضریب تمیز  را نشان می دهد . حدود چهار ضلعی این شکل حداکثر و حداقل و دشواری ضریب تمیز را نشان می دهند . برای مثال اگر ضریب دشواری 8/0 باشد ، ضریب تمیز بین 4/0 + و 4/0 – خواهد بود . دقت کنید که تنها در صورتی ضریب تمیز به حداکثر یا 1+ می رسد که ضریب دشواری برابر 50/0 یعنی درصد وسط باشد .

 

تحلیل گزینه های انحرافی 

در تحلیل سؤالهای آزمون ، علاوه بر تعیین ضریبهای دشواری و تمیز برای هر سؤال ، بررسی نحوه پراکندگی پاسخهای مربوط به گزینه های انحرافی هر سؤال نیز ضروری است . منظور از گزینه های انحرافی ، منحرف کردن آزمون شوندگانی است که جواب دست سؤال را نمی دانند . در صورتی یک سؤال به خوبی عمل می کند که افراد ضعیف بیشتر از افراد گروه قوی گزینه های انحرافی آن سؤال را انتخاب نمایند . 

تجدید نظر و اصلاح آزمون : 

پس از تعیین ضریبهای دشواری و تمیز همه سؤالهای یک آزمون و بررسی گزینه های هر  سؤال ، باید به اصلاح سؤالها و بازنویسی آنهایی که نیاز به تغییر دارند اقدام کرد . سؤالهایی که ضریب دشواری آنها بسیار بالا یا بسیار پایین است یا ضریب تمیز آنها خیلی کم است باید مورد تجدید نظر قرار گیرند . همچنین گزینه های انحرافی معیوب نیز باید اصلاح یا عوض شوند .

تحلیل آزمونهای وابسته به ملاک 

لازم به تذکر است که کاربرد ضریبهای دشواری و تمیز به شرح فوق صرفاً برای آزمونهای هنجاری یا وابسته به ملاک نسبی مناسب است . اما در آزمونهای ملاکی یا وابسته به ملاک مطلق این ضریبها مورد استفاده ندارند . نتیجه آرمانی آزمونهای ملاکی این است که در آنها اکثر آزمون شوندگان اکثر سؤالها را درست جواب دهند . بعبارت دیگر منحنی بطرف کجی منفی تمایل نماید .

ضریب دشواری و تمیز در یادگیری در حد تسلط 

بعضی از متخصصان ارزشیابی پیشرفت تحصیلی پیشنهاد می کنند که آزمونهای ملاکی مورد استفاده در سنجش یادگیری در حد تسلط تنها باید شامل سؤالهایی باشند که پس از آموزش مطالب درسی آسان تر از پیش از آموزش آن مطالب باشند . برای تحقق این امر انجام مراحل زیر پیشنهاد شده است :

1- اجرای آزمون پیش از آموزش و پس از آن .

2- محاسبه ضریب دشواری هر سؤال برای پیش آزمون و پس آزمون .

3- محاسبه تفاوت ضرایب دشواری سؤالهای پیش آزمون و پس آزمون .

طبق این پیشنهاد :

بهترین سؤال آن است که تفاوت ضرایب دشواری قبل و بعد آن 1+ باشد ، یعنی ضریب دشواری سؤال پس آزمون 1+ و ضریب دشواری پیش آزمون صفر باشد . بنابراین ، برای مصارف بعدی سؤالهایی که دارای تفاوت ضرابی دشواری قبلی و بعدی نزدیک به رقم 1+ هستند انتخاب می شوند .

 

فصل نهم 

هنجارها و نیمرخها

Norms and profiles

 

تعریف هنجار :

اگر برای تفسیر نمره یک دانش آموز نمره او را با نمره یک گروه مرجع مقایسه کنیم به آن گروه مرجع گروه هنجار گویند . گروه مرجع از کسانی تشکیل می یابد که به گونه ای شبیه به دانش آموز مورد نظر هستند .

 

 

نمرات هنجار که به آنها نمرات مشتق هم گفته    می شود دارای انواع مختلفی هستند که معروفترین آنها عبارتند از هنجارهای سنی یا معادل های سنی ، هنجارهای کلاسی یا معادل های کلاسی ، هنجارهای درصدی و نمرات معیار ( استاندارد ) .  

هنجارهای سنی 

هنجارهای سنی بر میانگین یا میانه نمراتی مبتنی هستند که دانش آموزان در سنین مختلف کسب می کنند و به صورت معادلهای سنی نشان داده می شوند . برای مثال اگر دانش آموزانی که 10 سال و ده ماه سن دارند ، در یک آزمون نمره 18 بگیرند ، به این نمره معادل سن 2-10 متعلق می گیرد . 

 

       بسیاری از آزمون های میزان شده پیشرفت تحصیلی دارای هنجارهای سنی هستند . در این آزمونها معادل های سنی با عنوان موضوعهای درسی نامگذاری می شوند . برای مثال سن خواندن ، سن حساب ، سن املاء و جز اینها . استفاده از هنجارهای سنی دارای محدودیت هایی است . اما در سطح دبستان بهترین مرحله کاربرد این نوع هنجارها است .

هنجارهای کلاسی :

    هنجارهای کلاسی شبیه به هنجارهای سنی هستند ، اما در هنجارهای کلاسی از گروههای کلاسی به عنوان گروههای مرجع استفاده می کنند . برای مثال : اگر دانش آموزان گروه نمونه ای که کلاس پنجم را شروع کرده اند ، در یک آزمون نمره خام 19 بگیرند ، به این نمره خام معادل کلاسی 0/5 داده می شود .

هنجارهای سنی نمایی :

       برای بدست آوردن شاخص درست تری از نمره متوسط دانش آموزان در یک کلاس معین ، نمرات دانش آموزان خیلی بزرگ یا خیلی کوچک را کنار می گذارند ، و نمره هنجار را تنها برای دانش آموزان سن مورد نظر برای آن کلاس محاسبه می کنند . این نوع هنجار کلاسی محدود شده را هنجار سنی نمایی می نامند .

هنجار سن ذهنی :

       هنجار سن ذهنی که اولین بار بوسیله آلفرد بینه معرفی شد نوعی هنجار سنی است که در آزمونهای هوشی به کار می رود . زوش محاسبه سن ذهنی یک دانش آموز شبیه به محاسبه معادلهای کلاسی است . بنابراین ، اگر نمره خام یک دانش آموز در یک آزمون هوشی برابر با میانه نمرات خام کودکان 9 ساله باشد . سن ذهنی او 9 خواهد بود . 

هوشبهر ( بهره هوشی ) IQ

در هنجارهای درصدی ، با گروه سنی یا کلاسی خودش یعنی گروهی که منطق می توان او را عضوی از آن دانست مقایسه می شود . در هنجارهای درصدی از رتبه درصدی یا صدکها استفاده می شود .

رتبه درصدی و صدک :   

معایب هنجارهای درصدی :

نکته :   

    نکته ای که در ارتباط با رتبه درصدی یا رتبه های درصدی نامساوی هستند ، و این عدم تساوی مقایسه افراد مختلف از لحاظ عملکرد با یکدیگر را با دشواری مواجه می سازد . برای رفع مشکل ، متخصصان روانسنجی از روش نمرات معیار که عیب روشهای دیگر را ندارد استفاده می کنند .

معروف ترین آنها عبارتند از :

1- نمرات Z

2- نمرات T

3- هوشبهر انحرافی

4- نمرات 9 بخشی 

نمره Z 

آن دسته از نمرات معیار که دارای میانگین صفر و انحراف معیار واحد (1) هستند به نمرات Z شهرت دارند . برای تبدیل نمرات خام به نمرات Z از فرمول زیر استفاده می شود .                        

Z=

در این فرمول :

نمره خام = X ،میانگین نمرات = X  ، انحراف معیار = SD 

مثال : اگر نمره خام دانش آموزی در یک آزمون که دارای میانگین ( 56=X ) و انحراف معیار ( 4= SD ) است ، 58 باشد نمره Z او برابر خواهد بود با :

                     5/0=                  = Z

همچنین نمره Z دانش آموز دیگری که دارای نمده خام 40 است برابر خواهد بود با :

                     4- =                  = Z

    نمره Z به ما نشان می دهند که یک نمره خام به اندازه چه تعداد از واحدهای انحراف معیار بالاتر یا پایین تر از میانگین است . بنابراین دانش آموزی که نمره خام او به اندازه یک انحراف معیار بالای میانگین باشد دارای نمره Z برابر با 1+ و دانش آموزی که نمره خام او به اندازه دو انحراف معیار پایین تر از میانگین باشد دارای نمره Z برابر با 2- خواهد بود و الی آخر .

نمره T

نمرات معیار دیگری که به نمرات T شهرت دارند برای رفع مشکلات نمرات Z ابداع شده اند . مقیاس نمرات T با ضرب نمرات Z در 10 و جمع کردن نمرات خاصل با 50 به دست می آید . بنابراین می توان فرمول محاسبه نمرات T را به صورت زیر نوشت :

50+ ( Z)10= T

مثال : اگر نمرات دو دانش آموز در مقیاس Z برابر 5/0 و 5/1- باشند نمرات آنها در مقیاس T به شرخ زیر خواهد بود .

50+(5/1-)10= T        50+(5/0)10= T

35=50+15- =                55=50+5=

   از آنجا که همه نمرات T دارای میانگین 50 و انحراف معیار 10 هستند ، هر نمره T به تنهایی و به طور مستقیم قابل تغییر و استفاده است . برای مثال ، نمره 55 = T حاکی از این است که آن نمره به اندازه نصف انحراف معیار بالای میانگین است ، و نمره 35= T نشان می دهد که آن نمره به اندازه یک و نیم انحراف معیار پایین میانگین قرار دارد و الی آخر .

نوع دیگر هنجار به نام نمرات 9 بخش وجود دارد که به صورت نمرات معیار یک رقمی نشان داده می شود . علت نامگذاری این مقیاس نمرات به 9 بخشی این است که توزیع این نمرات به 9 بخش محدود می شود . این مقیاس دارای میانگین 5 و انحراف معیار 2 است . 

نیتکو نمرات 9 بخشی را برای نمره گذاری آزمون های کلی و تشریحی که ارزشیابی آنها جنبه کیفی به شرح زیر پیشنهاد داده است .

9- بسیار عالی ( 4 % بالا )

8- عالی ( 7 % بعدی )

7- خیلی خوب ( 12 % بعدی )

6- خوب ( 17% بعدی )

5- متوسط ( 20% وسط )

4- نسبتاً ضعیف ( 17 % بعدی )

3- ضعیف ( 12% بعدی )

2- خیلی ضعیف ( 7% بعدی )

1- بیش از حد ضعیف ( 4% ) آخر )

 

هوشبهر انحرافی یک هنجار مربوط به نمرات معیار است که دارای میانگین 100 و انحراف معیار 15 یا 16 است . بنابراین ، اگر انحراف معیار 15 باشد معدل هوشبهر انحرافی  به قرار زیر است :

100+Z15 = D IQ

    هوشبهر انحرافی را مانند نمرات Z و T تغییر می کند . برای مثال : اگر هوشبهر انحرافی  دانش آموزی 130 باشد ، این دانش آموز دو انحراف معیار بالاتر از میانگین قرار دارد    ( 2=Z و 70= T ) ، یا اگر هوشبهر انحرافی  دانش آموزی 85 باشد ، یک انحراف معیار پایین تر از میانگین است      ( 1- = Z و 40= T )

 

رابطه میان هنجارهای مختلف در شکل زیر نشان داده شده است . این شکل رابطه هنجارها را برای نمراتی که توزیع بهنجار دارند نشان می دهد . برای مثال ، نمره ای که یک انحراف معیار پایین میانگین است ( 1- = SQ ) دارای 1- = Z ، ملاک 16 ، 40= T ، هوشبهر انحرافی 85 و نمره 9 بخشی 3 است . 

توزیع بهنجار نوعی توزیع است که بر منحنی بهنجار منطبق است . منحنی بهنجار یک منحنی زنگوله شکل است که ویژگیهای زیر را داراست :

1- دو قسمت منحنی بهنجار و نسبت به خط وسط منحنی قرینه هستند .

2- در توزیعی که این منحنی معرف آن است اکثر نمره ها در وسط توزیع انباشته شده اند .

3- دو امتداد منحنی بهنجار در بینهایت محور افقی را قطع می کنند . 

4- در منحنی بهنجار ، میانگین ، میانه ، و نمابر بر روی هم قرار دارند.

5- در روی این منحنی دو نقطه وجود دارند که در آنها جهت منحنی تغییر می  کند . این دو نقطه در فواصل 1 ± انحراف معیار از میانگین قرار دارند .

6- در منحنی بهنجار ، بین انحراف معیارها و نسبت افراد  یک رابطه دقیق ریاضی وجود دارد و در هر واحد انحراف معیار  ، همیشه یک نسبت ثابت از افراد موجود است .

  نیمرخ وسیله ای است که به کمک آن می توان نمرات یک دانش آموز ( یا گروهی دانش آموز ) در دو یا چند درس را با هم مقایسه کرد . این مقایسه به کمک اعداد خام درست نخواهد بود . هدف از ترسیم نیمرخ این است که نتایج را به صورت تصویر یا نمودار نشان دهیم .

 

نیمرخ یعنی بیان تصویری یا نموداری نتایج ، نیمرخ نقاط قوت و ضعف عملکرد یک فرد را نشان می دهد ، درست همانطور که تصویر یک فرد وضع ظاهری او را نشان می دهد ، نیمرخ نمرات وضع تحصیلی و روانی او را نشان می دهد .

مثال :

برای مقایسه نمره یک دانش آموز در آزمون درس علوم که تنها به 10 سؤال آن جواب داده است با نمره همین دانش آموز در آزمون درسی ریاضی که به 16 سؤال آن پاسخ گفته است ، باید این دو نمره را به نوعی هنجار کلاسی ، سنی یا درصدی تبدیل کنیم تا مقایسه آنها امکان پذیر شود . 

 

بنابراین ، هرگاه تعدادی نمره حاصل از آزمونهای مختلف با آزمونهای فرعی یک آزمون کلی را برای یک دانش آموز به یکی از هنجارها تبدیل کنیم . و این نمرات را در یک نمودار قرار دهیم نیمرخ عملکرد آن دانش آموز را بدست داده ایم . 

 

باید توجه داشت :

تفاوت نمره های یک دانش آموز در آزمونهای مختلف ممکن است ناشی از خطای اندازه گیری آزمونها باشد نه یک تفاوت واقعی . بنابراین تفاوت میان نمرات آزمونها را با احتیاط تفسیر کنیم .

 

روش دیگر ترسیم نیمرخ نمرات که برای رفع مشکل خطای اندازه گیری پیشنهاد شده است این است که ، به عوض نشان دادن نمرات آزمون به صورت نقطه هایی در روی نیمرخ نمرات ، عملکرد دانش آموز به صورت نوارهایی ترسیم شود که هر نوار به اندازه یک خطای معیار اندازه گیری بالای نمره دانش آموز و یک خطای اندازه گیری پایین آن نمره را شامل شود .

 

فصل دهم

روایی آزمون

روایی آزمون

متخصصان اندازه گیری و ارزشیابی برای آزمونهای مختلف ویژگیهای زیادی را برشمرده اند ، از جمله می توان عینیت ، سهولت اجرا ، سهولت نمره گذاری ، عملی بودن ، سهولت تعبیر و تفسیر ، روایی و پایایی را نام برد . از میان این ویژگیها آنچه از بقیه مهمترند دو ویژگی روایی و پایایی هستند . 

تعریف روایی

سه هدف عمده از آزمونهای مورد استفاده در آموزش و پرورش

1- آیا سئوالهای آزمون از محتوای درس یا موضوع موردنظر یک نمونه خوب ارائه می دهند ؟

2- آیا نمرات آزمون عملکرد فعلی یا آتی دانش آموزان را پیش بینی می کنند ؟

3- آیا نمرات با مفاهیم نظری یا سازه های که آزمون برای سنجش آن درست شده است مربوط می شوند ؟

سه مورد بالا به ترتیب سه نوع روایی محتوا ، پیش بینی و سازه را نشان می دهند .

روایی محتوایی 

روایی محتوایی به این مطلب اشاره می کند که نمونه سئوالهای مورد استفاده در یک آزمون تا چه حد معرف کل جامعه سئوالهای ممکن است که می توان از محتوا یا موضوع موردنظر تهیه کرد . هرچه آزمون از این لحاظ بهتر باشد ، دارای روایی بیشتر است . بنابراین ، اگر معلم فیزیک بخواهد برای درس خود یک آزمون پیشرفت تحصیلی روا بسازد ، آزمون او باید در برگیرنده نمونه ای درست و دقیق از مطالب درس فیزیک باشد .

روایی صوری

روایی همزمان

روایی همزمان ، نوعی روایی پیش بینی است که در آن به جای تعیین رابطه بین دو آزمون در یک فاصله زمانی ، رابطه دو آزمون به طور همزمان تعیین می شود . هدف از تعیین روایی همزمان بین دو آزمون این است که معلوم سازیم آیا می توان یک آزمون را به جای آزمون دیگری استفاده قرار داد یا نه ؛ در تعیین روایی همزمان ، هنگام اندازه گیری متغییر پیش بینی ، علاوه بر این متغییر ، متغییر ملاک نیز موجود است .

   متخصصان روانسنجی دو نوع روایی پیش بینی و همزمان را با اصطلاح روایی ملاکی معرفی می کنند و بین این دو نوع روایی تمایز چندانی قائل نمی شوند . اما با وجود شباهت زیاد بین این دو نوع روایی ، می توان بین آن دو نوعی تمایز منطقی قائل شد . 

روایی پیش بینی ، نمرات آزمون واقعاً برای انجام نوعی پیش بینی بکار می روند ، اما چون در روایی همزمان داده های پیش بینی کننده و پیش بینی شونده همزمان جمع اوری می شوند ، هدف آزمون پیش بینی ، پیش بینی ملاک نیست ، بلکه هدف آن جانشین ساختن آزمون پیش بینی با آزمون ملاک است . 

ویژگیهای مطلوب ملاک

شرندایک وهیگن برای داده های ملاکی چهار ویژگی مطلوب ذکر کرده اند :

این ویژگیها به ترتیب اهمیت عبارتند از :

1- ربط داشتن

2- بی طرفی

3- پایایی

4- در دسترس بودن

 

ربط داشتن 

ربط داشتن داده های یک آزمون ملاکی ، با توجه به قابلیت انطباق آن با موفقیت واقعی شخص مورد قضاوت قرار می گیرد . برای اینکار هیچ گونه شواهد تجربی وجود ندارد و باید بر اساس ملاک منطقی تصمیم گرفت .

بی طرفی

منظور از بی طرفی این است که آزمون باید به گونه ای باشد که همه افراد در کسب نمره خوب فرصت مساوی داشته باشند . مثالهای مربوط به عدم بی طرفی ، تفاوت بین تجهیزات و شرایط کار برای کارگران یک کارخانه  یا تفاوت بین کیفیت آموش داده شده به دانش آموزان مختلف است . 

پایایی

یک آزمون یا یک اندازه پایایی مربوط به موفقت شناسی باید با ثبات و قابل تکرار باشد . اگر این نمره از روزی به روز دیگر تغییر کند ، به طوری که کارگر از روزی به روز دیگر یا از هفته ای به هفته دیگر نمرات متفاوتی بگیرد . در این صورت هیچ آزمونی وجود نخواهد داشت که نمره ملاک را پیش بینی کند . 

در دسترس بودن 

در دسترس بودن به این معنی است که دستیابی به اندازه ملاک عملی و میسر باشد . این ویژگی را با توجه به زمان ، هزینه و امکانات مورد نیاز مورد قضاوت قرار می دهند . بنابراین ملاکی که به سهولت بیشتر در چهار چوب امکانات سهل تر قابل دسترس باشد ملاک بهتری است .

روایی سازه

یک آزمون در صورتی دارای روایی سازه که نمرات حاصل از اجرای شان به مفاهیم سازه های نظریه مورد نظر مربوط باشند . برای مثال ، یک آزمون یا پرسشنامه اضطراب در صورتی دارای روایی سازه است که نمرات حاصل از آن به سازه هایی که در نظریه های اضطراب آمده اند ارتباط داشته باشد . 

تعریف سازه 

معنی سازه به معنی مفهوم بسیار نزدیک است . کرلینجر سازه را اینگونه تعریف کرده است :

در سازه یک مفهوم است ، اما سازه یک معنی اضافی بر مفهوم دارد و آن این است که سازه برای مقاصد ویژه ی علمی بطور عمد و از روی آگاهی ابداع می شود . مثالهای سازه : هوش – انگیزش – اضطراب – برون گرایی – درون گرایی

بار علمی  +  مفهوم  =  سازه

روشهای تعیین روایی سازه 

1- روش تعیین همبستگی آزمون با سایر آزمونهای روا

2- روش تمایز سنی

3- روش تحلیل عوامل

4- روش همسانی درونی 

 

فصل یازدهم

پایایی آزمون

تعریف پایایی 

   پایایی یک وسیله اندازه گیری به دقت آن اشاره      می کند . یک آزمون در صورتی دارای پایایی است که اگر آن را در یک فاصله زمانی کوتاه چندین بار به گروه واحدی از افراد بدهیم نمرات حاصل از این چندین بار اجرا نزدیک به هم باشند .

رابطه بین پایایی و روایی

رابطه بین روایی و پایایی از این قرار است که یک آزمون باید پایا باشد تا بتواند روا باشد . اگر آزمونی در هر بار اجرا در مورد تعدادی دانش آموز نتایج مختلفی بدست بدهد آن آزمون یک آزمون پایا نخواهد بود . پس برای اینکه یک آزمون روا باشد باید پایا باشد ، یعنی پایایی شرط روایی است ، اما روایی بر پایایی ضروری نیست . 

برای مقایسه پایایی و روایی در شکل 10-1 نتایج تیراندازی با سه تفنگ مختلف نشان داده است . چنانکه مشاهده می نمایند نتایج تیر اندازی با تفنگ الف هم پایاست و هم روا ، زیرا همه تیرها به هدف خورده اند . نتایج تیر اندازی با تفنگ ب پایا است اما روا نیست ، زیرا تیرها همه تقریباً به یک نقطه اثابت کرده اند اما آن نقطه مورد نظر تیر انداز نیست . نتایج تیراندازی با تفنگ پ نه پایا است و نه روا . 

روشهای تعیین پایایی

ایبل پنچ روش تعیین پایایی را معرفی کرده است . این روشها عبارتند از :

1- روش پایایی مصحح

2- روش باز آزمایی

3- روش فرمهای موازی یا هم ارز

4- روش دو نیم کردن آزمون

5- روش کودر -  ریچاردسون

روش پایایی مصحح

برای تعیین پایایی آزمونهای تشریحی یا انشایی که نمرات آنها تحت تأثیر قضاوت محصصان برگه های آزمون قرار می گیرد باید از دو یا چند مصحح که مستقلاًً‌ برگه های امتحان را تصحیح می کنند استفاده کرد . همبستگی بین نمرات این مصححان شاخص پایایی به حساب می آید . 

   ساده ترین روش تعیین پایایی یک آزمون باز آزمایی است در این روش ، آزمون را در دو نوبت به گروه واحدی از آزمون شوندگان می دهند و نمرات حاصل را با هم مقاسه می کنند . ضریب همبستگی بین نمرات حاصل از دوبار اجرای آزمون ضریب پایایی آزمون است . به این نوع پایایی ، پایایی باز آزمایی می گویند .

 روش دیگری که بای رفع مشکلات روش باز آزمایی به کار می رود . روش فرمهای هم ارز است . در این روش دو آزمون معادل یا همارز برای یک مطلب یا موضوع تهیه می کنند و آنها را در فاصله زمانی کوتاهی به یک گروه واحد از آزمون شوندگان می دهند . ضریب همبستگی بین نمرات این دو فرم آزمون ، ضریب پایانی آن آزمون به حساب می آید .

روش دو نیمه کردن

در روش دو نیمه کردن آزمون یک آزمون واحد یک بار به یک گروه از آزمون شوندگان داده می شود و پس از اجرا ، آن را به دو نیمه مساوی تقسیم می کنند . در این روش ، بهترین راه دو نیم کردن آزمون ، این است که همه سئوالهای فرد را یک آزمون به حساب آوریم ، و سئوالهای زوج را نیز آزمون دیگری بدانیم ضریب همبستگی حاصل از نمرات دو نیمه آزمون ضریب پایایی هر یک از دو نیمه خواهد بود .  

نحوه محاسبه ضریب پایایی به روش دو نیمه کردن

برای محاسبه ضریب پایایی کل آزمون ، ضریب همبستگی بین نیمه ها را در فرمول زیر که به فرمول الپیرمن براون شهرت دارد قرار می دهند .

ضریب پایایی آزمون = r tt                          

ضریب همبستگی بین نیمه های آزمون =  R       

مثال :

اگر ضریب همبستگی بین نیمه های یک آزمون برابر 50% باشد ، ضریب پایایی کل آزمون با استفاده از فرمول الپیرمن – براون به نحو زیر محاسبه خواهد شد . 

روش کودر ریچاردسون 

در روش کودر ریچاردسون نیز آزمون تنها یک بار اجرا می شود . در این روش همسانی درونی کل آزمون بررسی میشود و برای این منظور همه ماده های آزمون تحلیل می شوند برای بررسی همسانی درونی آزمون و پایایی آن دو فرمول معرف به کار برده اند که kr20 و kr21  مشهورند . ما در اینجا این دو فرمول و نحوه استفاده از آنها را به ترتب توضیح می دهیم .

فرمول kr20 :

ضریب پایانی آزمون = rtt  

تعداد سئوالهای آزمون = k

واریانس یا مربع انحراف معیار آزمون =  σt

نسبت دانش آموزانی که به سئوال پاسخ داده اند =  Pi

نسبت دانش آموزانی که به سئوال پاسخ غلط داده اند =     gi=1-p

مجموع g × p ها برای تمام سئوال = Zpigi

..

مثال :

فرمول کودر ریچاردسون21 برابر محاسبه پایایی

مثال 

عوامل مؤثر بر پایایی آزمون

1- با افزودن تعداد سئوالات یک آزمون ، پایایی آن نیز افزایش می یابد

2- با متناجس تر و همگون تر کردن سئوالات یک آزمون ، پایایی آزمون افزایش می یابد .

3- افزودنتعدادی سئوال دارای ضریب دشواری متوسط ، پایایی آزمون افزایش می یابد .

4- آزمونهای سرعت معمولاً از آزمونهای دارای سرعت کمتر ضریب پایایی بیشتری نشان می دهند

 

خطای معیار اندازه گیری

یکی از فواید ضریب پایایی آزمون این است که با استفاده از آن می توان خطای معیار اندازه گیری آزمون را تعیین کرد . خطای معیار اندازه گیری عبارت است از انحراف معیار توزیع نمرات خطا .

فرمول محاسبه خطای معیار اندازه گیری 

Sm= sdt√1-rtt

در این - فرمول :

خطای معیار اندازه گیری بر حسب نمرات خام = sm

انحراف معیار آزمون = sdt

ضریب پایانی آزمون = rtt

مثال

فرض کنید ضریب پایانی یک آزمون که با روش دو نیم کردن آزمون محاسبه شده 91/0 و انحراف معیار آن 10 باشد . طبق فرمول بالا ، مقدار خطای معیار اندازه گیری این آزمون برابر است با :

 

Sm = 10 √ 1-0/91

      = 10 √ 0/09

      = 10×   0/13

       = 3

مثال دیگر از خطای معیار اندازه گیری 

یک مثال واقعی از محاسبه خطای معیار اندازه گیری آزمونهای گروهی استعداد که در مورد کودکان سالهای آخر دبستان اجرا می شوند به دست داده اند . برای این آزمونها ضریب پایانی 85/0 و انحراف معیار 15 گزارش شده است . با استفاده از فرمول خطای معیار اندازه گیری ، خطای معیار این آزمونها برابر است با :

Sm = 15 √ 1-0/85

      = 15 √ 0/15

      = 15×   0/387

       = 5/8

 

نتیجه گیری : 

بر اساس خطای 8/5 می توان گفت که احتمال 1 در 2 وجود دارد که نمره به دست آمده برای دانش آموز از نمره واقعی او 8/5 ( یک خطای معیار اندازه گیری فاصله داشته باشد . یا احتمال 1 در 19 وجود دارد که نمره به دست آمده از نمره واقعی فرد 6/11 (دو خطای معیار اندازه گیری ) فرق کند .

 

موفق باشید