***
Главная » Психодіагностика » 3.9. Стандартизація тесту



3.9. Стандартизація тесту

Однією з важливих відмінностей психометричних тестів є те, що вони стандартизовані, а це дозволяє порівняти показники, отримані одним випробовуваним, з такими в генеральній сукупності або відповідних групах.

Тим самим досягається адекватна інтерпретація показника окремого випробовуваного. Таким чином, стандартизація тесту найбільш важлива в тих випадках, коли здійснюється порівняння показників обстежуваних. При цьому вводиться поняття норми, або нормативних показників. Для здобуття стандартних норм потрібно ретельно відібрати більшу кількість випробовуваних відповідно до ясно позначеного критерію. При формуванні вибірки стандартизації слід враховувати її об'єм і репрезентативність. У керівництві по тестах найчастіше вказується на те, що для простого зменшення стандартної погрішності достатньою буде вибірка з 500 випробовуваних. Проте репрезентативність вибірки не залежить від її об'єму. Наприклад, для того, щоб отримати нормативні показники для всієї популяції дітей, що виучуються в початковій школі, буде потрібно вибірку об'ємом більше 10 тисяч, тоді як вибірка з такої обмеженої популяції, як шеф-пілоти авіакомпаній, не може бути настільки значною. Репрезентативність вибірки, таким образом, параметр важливіший, ніж її об'єм. В деяких випадках доводиться формувати декілька груп стандартизації або стратифікувати групу стандартизації відносно таких параметрів, як вік, пів, соціальний статус. Встановлювати норми не завжди обов'язково. При використанні психологічних тестів в науковому дослідженні норми не настільки важливо і досить «сирих» показників тесту.

Норми для кожної групи мають бути представлені в середніх величинах і показнику стандартного відхилення. Розрахунок середньої величини елементарний і добре відомий, а стандартне відхилення визначається за допомогою формули (дивитеся лекції з SPSS).

Сьогодні на практиці все більше використовується такий тип похідної оцінки, як стандартні показники, що задовольняє більшості вимог, що пред'являються до психологічного виміру. Такі показники виражають відмінність індивідуального результату випробовуваного від середнього в одиницях стандартного відхилення відповідного розподілу. Стандартні показники отримують двома шляхами: лінійним і нелінійним перетворенням первинних («сирих») оцінок. В разі лінійного перетворення зберігаються всі властивості вихідного розподілу «сирих» оцінок, і такі показники називаються стандартними або z-показателями. Для обчислення г-показника знаходять різницю між первинною оцінкою і середнім для нормативної групи і ділять її на стандартне відхилення нормативної групи. Формула має вигляд (дивитеся лекції з SPSS).

Тут необхідно сказати про те, що основною причиною перетворення первинних оцінок в деяку похідну шкалу є бажання отримати показники, які порівнянні між собою незалежно від того, по якому тесту вони отримані. Лінійне перетворення дозволяє отримати показники порівнянні лише у тому випадку, коли розподіли «сирих» оцінок, по яких вони розраховуються, мають приблизно однакову форму. Для того, щоб зіставляти показники, отримані на основі розподілів різної форми, удаються до нелінійного перетворення, або до нормалізованих стандартних показників. Процедура нелінійного перетворення досить проста і описана в багаточисельному керівництві за математичною статистикою. Такі показники зазвичай розраховують за допомогою таблиць. У цих таблицях наводиться відсоток випадків, що доводяться на ділянки, які отстоят від середнього нормальній кривій на деяке число одиниць стандартного відхилення. Спочатку визначають відсоток осіб, чиї показники превышают кожну «сиру» оцінку, а потім по цьому відсотку в таблиці відшукують відповідне значення нормалізованого стандартного показника. Ці показники, як і лінійно перетворені, матимуть середнє (X), рівне 0, і стандартне відхилення (SD), рівне 1. Нульове значення показує, що випробовуваний попадає в точку, відповідну середньому нормальною кривою, перевершуючи 50 % групи. У випадку, якщо показник рівний —1, випробовуваний перевершує приблизно 16 % групи, а якщо + 1 — перевершує 84 % групи. Нормалізованим стандартним показникам можна надати будь-яку зручну форму, наприклад, помноживши його на 10 і додавши твір до 50, отримуємо так званий «T-показатель» і в цьому випадку Т, рівне 50, відповідає середньому, рівному 60 — перевищує середнє на одне стандартне відхилення і так далі З іншими, не менш популярними нелінійними перетвореннями «сирих» показників тесту, можна ознайомитися у відповідній літературі.

Створенням стандартізованного тесту і його публікацією зазвичай завершується робота психолога, проте слід пам'ятати і про те, що з часом необхідний той, що передивляється (ревізія) тесту. Досить пригадати про тести інтелекту (див. гл. 4), норми по яких застарівають через кожних 5 років, і можна передбачити, що процес їх старіння прискорюватиметься. Для наочності етапи конструювання тесту представлені на рис нижче.

Приклад з практики: визначення надійності опитувальника 16 PF Кеттелла. Особовий опитувальник Раймонда Кеттелла 16 PF(16 особових чинників) відноситься до найбільш поширених психодіагностичних інструментів і не потребує спеціальної вистави. Вже без малого 50 років психологи всього світу використовують його для вирішення всіляких прикладних і наукових завдань. Проте як в колишньому СРСР, так і нині в знов освічених країнах цей опитувальник, не дивлячись на чималу популярність, використовується непрофесійно, з порушенням всіх норм і правил, що пред'являються до психологічних тестів.

Окрім різних перекладів опитувальника, які істотно відрізняються один від одного, в російськомовній літературі часто зустрічаються і різні «ключі» до його чинників. Опубліковані в багаточисельних збірках і брошурах варіанти опитувальника не захищені (!) від помилок і довільного втручання в його текст. Якщо додати до цього відсутність нормативних даних, а також те, що не проводилася перевірка гомогенності шкал опитувальника на вітчизняних зиборках, то незрозуміло, якого роду результати отримували його багаточисельні користувачі, якими діагностичними висновками вони оперували. За останні п'ятнадцять років у нас з'явилися лише три (!) роботи, в яких ставилося завдання перевірки факторної структури 16pf на. національних вибірках: це статті В. М. Русалова і О. В. Гусевой (1990), Ю. М. Забродіна, В. І. Похилько і А. Г. Шмельова (1987), нарешті, українського психолога А. Г. Віноградова (1997). Читачеві неважко порівняти цю кількість публікацій з тим безліччю робіт, в яких опитувальник використовувався для здобуття «діагностично значимих результатів». Сказане дозволяє зробити вивід про те, що за допомогою опитувальника 16pf ізмеряєтся щось, що має неясне відношення до чинників особи, виділених і описаним Кеттеллом.

Займаючись роботою по психометричній адаптації особових опросников1, ми не могли обійти увагою і настільки широко поширений, як 16pf. За основу була узята форма «А» опитувальника 16pf. Було обстежено 227 чоловік (135 жінок і 92 чоловіки) у віці від 16 до 51 року. Середній вік досліджуваних складав 28 років. Це були люди, які проходілі відбір на різні посади в комерційні організації Києва, всі вони мали вищу або середню спеціальну освіту (бухгалтери, комерційні діректори, менеджери різного рівня).

Як відомо, точність виміру за допомогою психодіагностичного інструменту визначається його надійністю. З метою з'ясувати, наскільки точний прогноз, що дається психологом на підставі результатів 16pf, дані, спочатку отримані нами, були оцінені по авторських ключах на внутрішню узгодженість за допомогою коефіцієнта Кронбаха, що обчислюється за наступною формулою (дивитеся лекції з SPSS).

Смотреть другие вопросы в разделе: Психодіагностика





Все материалы размещены исключительно с целью ознакомления и принадлежат их авторам. Любое копирование строго запрещено. Если вы являетесь автором того или иного труда и не хотите, чтобы он был здесь опубликован, свяжитесь с администрацией