|
|
|
|
3.6. Визначення надійності тесту |
Тест зазвичай вважається надійним, якщо з його допомогою виходять одні і ті ж показники для кожного обстежуваного при повторному тестуванні.
У психометриці термін надійність має два значення. На одному з них — надійності по внутрішній узгодженості — ми не зупинятимемося детально, посилаючи читача до відповідних довідників і керівництва, відзначивши лише, що вимога до внутрішньої узгодженості тесту не випадково. Цілком природно вважати, що якщо деяка змінна вимірюється частиною тесту, то інші його частини, не будучи погодженими з першою, вимірюють щось інше. Для того, щоб бути валідним, тест має бути погодженим. Існує декілька способів визначення надійності.
Надійність ретестовая — передбачає повторне пред'явлення того ж самого тесту тим же випробовуваним і приблизно в тих же умовах, що первинне, а потім встановлення кореляції між двома рядами даних. При використанні цього способу визначення надійності потрібно усвідомлювати те, що випробовувані можуть запам'ятати свої відповіді і відтворити їх удруге, тому повторне тестування має бути відокремлене від першого більш-менш значним тимчасовим інтервалом, зазвичай не менше місяця. Деякі психологи наполягають на інтервалі між тестуваннями не менше 6 місяців (Клайн, 1994).
Ми не рахуємо вимогу П. Клайна про обов'язковий 6 місячному інтервалі між тестуваннями безумовним. В підтвердження пошлемося на результати дослідження канадських психологів. За допомогою особового опитувальника були обстежені 302 студенти з інтервалом в 3 тижні. Умови повторного тестування варіювалися. Стандартний коефіцієнт ретестової надійності, рівний 0,872, не відрізнявся від коефіцієнтів надійності, отриманих в трьох групах випробовуваних, отримуючих одну з трьох специфічних інструкцій: 1) продумувати відповіді; 2) використовувати спогади про минулі відповіді; 3) виконувати паралельну форму тесту. Було виявлено, що стандартний коефіцієнт надійності вищий за коефіцієнт, отриманий при інструкції відтворювати минулі відповіді.
Найменшим задовільним значенням для ретестової надійності є коефіцієнт кореляції, рівний 0,7. Правда, для деяких тестів цей показник може бути декілька нижче.
Надійність паралельних форм передбачає створення еквівалентних форм опитувальника і пред'явлення їх одним і тим же випробовуваним для того, щоб потім оцінити кореляцію між отриманими результатами. Основна проблема, що перешкоджає широкому поширенню цього способу визначення надійності, — необхідність підготовки два наборів завдань, що надзвичайно складно, оскільки потрібні переконливі докази їх еквівалентності.
Надійність частин тесту визначається шляхом ділення опитувальника на дві частини (зазвичай на парні і непарні завдання), після чого і розраховується кореляція між цими частинами. Зазвичай до цього способу визначення надійності рекомендується прибігати лише в тих випадках, коли необхідно швидко отримати результати.
Для визначення ретестової надійності і надійності паралельних форм кореляції підраховується на основі коефіцієнта твору моментів Пірсону. Ця процедура підрахунку розглядалася нами раніше, в розділі, присвяченому аналізу завдань. Для визначення надійності частин тесту раніше розрахований коефіцієнт твору моментів Пірсону (між двома половинами тесту) використовується у формулі Спірмена—брауна.
Підкреслимо, що найкращою процедурою визначення надійності є проведення повторних досліджень через більш менш значні тимчасові інтервали.
Всі дослідження надійності повинні виконуватися на чималих (рекомендується 200 і більш випробовуваних) і репрезентативних вибірках. Надійність — важлива характеристика тесту, але сама по собі цінності не представляє. Вона необхідна для досягнення валідності. |
|
|
|
|
|