Тестирование как метод психологических исследований. Тестирование

Как и процесс разработки, процесс последующего тестирования программного обеспечения также следует определенной методологии. Под методологией в данном случае мы понимаем разнообразные комбинации принципов, идей, методов и концептов, к которым вы прибегаете во время работы над проектом.

В настоящее время существует довольно большое количество разнообразных подходов к тестированию, каждый со своими отправными точками, продолжительностью выполнения и методами, используемыми на каждом этапе. И выбор того или иного из них может быть довольно непростой задачей. В этой статье мы рассмотрим разные подходы к тестированию ПО и поговорим об их основных особенностях, чтобы помочь вам сориентироваться в существующем многообразии.

Каскадная модель (Линейная последовательная модель жизненного цикла ПО)

Каскадная модель (Waterfall Model) является одной из наиболее старых моделей, которую можно применять не только для разработки или тестирования ПО, но также практически для любого другого проекта. Его базовым принципом является последовательный порядок выполнения задач. Это значит, что мы можем переходить к следующему шагу разработки или тестирования только после того, как предыдущий был успешно завершен. Эта модель подходит для небольших проектов и применима только в том случае, если все требования точно определены. Главными достоинствами этой методологии являются экономическая эффективность, простота использования и управления документацией.

Процесс тестирования ПО начинается после завершения процесса разработки. На этой стадии все необходимые тесты переносятся с юнитов на системное тестирование для того, чтобы контролировать работу компонентов как по отдельности, так и в комплексе.

Помимо упомянутых выше достоинств, данный подход к тестированию также имеет и свои недостатки. Всегда существует вероятность обнаружения критических ошибок в процессе тестирования. Это может привести к необходимости полностью изменить один из компонентов системы или даже всю логику проекта. Но подобная задача невозможна в случае каскадной модели, поскольку возвращение на предыдущий шаг в этой методологии запрещено.

Узнайте больше о каскадной модели из предыдущей статьи .

V-Model (Модель верификации и валидации)

Как и каскадная модель, методика V-Model основана на прямой последовательности шагов. Основным отличием между этими двумя методологиями является то, что тестирование в данном случае планируется параллельно с соответствующей стадией разработки. Согласно этой методологии тестирования ПО, процесс начинается как только определены требования и становится возможным начать статическое тестирование, т.е. верификацию и обзор, что позволяет избежать возможных дефектов ПО на поздних стадиях. Соответствующий план тестирования создается для каждого уровня разработки ПО, что определяет ожидаемые результаты, а также критерии входа и выхода для данного продукта.

Схема данной модели показывает принцип разделения задач на две части. Те, которые относятся к дизайну и разработке, размещены слева. Задачи, относящиеся к тестированию ПО, размещены справа:

Основные этапы этой методологии могут изменяться, однако обычно они включают следующие:

  • Этап определения требований . Приемочное тестирование относится к этому этапу. Его основная задача состоит в оценке готовности системы к финальному использованию
  • Этап, на котором происходит высокоуровневое проектирование, или High-Level Design (HDL) . Этот этап относится к системному тестированию и включает оценку соблюдения требований к интегрированным системам
  • Фаза детального дизайна (Detailed Design) параллельна фазе интеграционного тестирования, во время которой происходит проверка взаимодействий между различными компонентами системы
  • После этапа написания кода начинается другой важный шаг — юнит-тестирование. Очень важно убедиться в том, что поведение отдельных частей и компонентов ПО корректно и соответствует требованиям

Единственным недостатком рассмотренной методологии тестирования является отсутствие готовых решений, которые можно было бы применить, чтобы избавиться от дефектов ПО, обнаруженных на этапе тестирования.

Инкрементная модель

Данная методология может быть описана, как мультикаскадная модель тестирования ПО. Рабочий процесс разделяется на некоторое количество циклов, каждый из которых также делится на модули. Каждая итерация добавляет определенный функционал к ПО. Инкремент состоит из трех циклов:

  1. дизайн и разработка
  2. тестирование
  3. реализация.

В этой модели возможна одновременная разработка разных версий продукта. Например, первая версия может проходить этап тестирования в то время, как вторая версия находится на стадии разработки. Третья версия в то же самое время может проходить этап дизайна. Этот процесс может продолжаться до самого завершения проекта.

Очевидно, что данная методология требует обнаружения максимально возможного количества ошибок в тестируемом ПО настолько быстро, насколько это возможно. Так же, как и фаза реализации, которая требует подтверждения готовности продукта к доставке к конечному пользователю. Все эти факторы существенно увеличивают весомость требований к тестированию.

В сравнении с предыдущими методологиями, инкрементная модель имеет несколько важных преимуществ. Она более гибкая, изменение требований ведет к меньшим затратам, а процесс тестирования ПО является более эффективным, поскольку гораздо проще проводить тестирование и дебаггинг за счет использования небольших итераций. Тем не менее, стоит отметить, что общая стоимость все же выше, чем в случае каскадной модели.

Спиральная модель

Спиральная модель это методология тестирования ПО, которая основана на инкрементном подходе и прототипировании. Она состоит из четырех этапов:

  1. Планирование
  2. Анализ рисков
  3. Разработка
  4. Оценка

Сразу после того, как первый цикл завершен, начинается второй. Тестирование ПО начинается еще на этапе планирования и длится до стадии оценки. Основным преимуществом спиральное модели является то, что первые результаты тестирования появляется незамедлительно после появления результатов тестов на третьем этапе каждого цикла, что помогает гарантировать корректную оценку качества. Тем не менее, важно помнить о том, что эта модель может быть довольно затратной и не подходит для маленьких проектов.

Несмотря на то, что эта модель является довольно старой, она остается полезной как для тестирования, так и для разработки. Более того, главная цель многих методологий тестирования ПО, включая спиральную модель, изменилась в последнее время. Мы используем их не только для поиска дефектов в приложениях, но также и для выяснения причин, их вызвавших. Такой подход помогает разработчикам работать более эффективно и быстро устранять ошибки.

Читайте подробнее o спиральной модели в предыдущем блог посте .

Agile

Методология гибкой (Agile) разработки и тестирование ПО может быть описана как набор подходов, ориентированных на использование интерактивной разработки, динамического формирования требований и обеспечения их осуществления как результата постоянного взаимодействия внутри самоорганизующейся рабочей группы. Большинство гибких методологий разработки ПО нацелены на минимизацию рисков посредством разработки в рамках коротких итераций. Одним из главных принципов этой гибкой стратегии является возможность быстрого реагирования на возможные изменения, нежели стремление положиться на долгосрочное планирование.

Узнайте больше об Agile (прим. — статья на английском языке) .

Экстремальное программирование (XP, Extreme Programming)

Экстремальное программирование является одним их примеров гибкой разработки ПО. Отличительной особенностью этой методологии является “парное программирование”, ситуация, когда один разработчик работает над кодом, в то время как его коллега постоянно проводит обзор написанного кода. Процесс тестирования ПО является довольно важным, поскольку начинается даже раньше, чем написана первая строка кода. Каждый модуль приложения должен иметь юнит-тест, чтобы большинство ошибок могло быть исправлено на стадии написания кода. Другим отличительным свойством является то, что тест определяет код, а не наоборот. Это значит, что определенная часть кода может быть признана завершенной только в том случае, если все тесты пройдены успешно. В противном случае, код отклоняется.

Главными достоинствами такой методологии являются постоянное тестирование и короткие релизы, что помогает обеспечить высокое качество кода.

Scrum

Scrum — Часть методологии Agile, итеративный инкрементный фреймворк, созданный для управления процессом разработки ПО. Согласно принципам Scrum, команда тестировщиков должна участвовать в следующих этапах:

  • Участие в Scrum планировании
  • Поддержка в юнит-тестировании
  • Тестирование пользовательских историй
  • Сотрудничество с заказчиком и владельцем продукта для определения критериев приемлемости
  • Предоставление автоматического тестировании

Более того, участники QA-отдела должны присутствовать на всех ежедневных собраниях, как и другие члены команды, чтобы обсудить, что было протестировано и сделано вчера, что будет протестировано сегодня, а также общий прогресс тестирования.

В то же время принципы Agile методологии в Scrum к появлению специфических особенностей:

  • Оценка усилий, необходимых для каждой пользовательской истории является обязательной
  • Тестировщик должен быть внимательным к требованиям, поскольку они могут постоянно изменяться
  • Риск регрессии возрастает вместе с частыми изменениями в коде
  • Одновременность планирования и выполнения тестов
  • Недопонимание между членами команды в случае если требования заказчика не до конца ясны

Узнайте больше о методологии Scrum из предыдущей статьи .

Заключение

В заключение важно отметить, что сегодня практика использования той или иной методологии тестирования ПО подразумевает мультиверсальный подход. Иными словами, не стоит рассчитывать на то, что какая-то одна методология окажется подходящей для всех типов проектов. Выбор одной из них зависит от большого числа аспектов, таких как тип проекта, требования заказчика, поставленные сроки, а также многих других. С точки зрения тестирования ПО, для некоторых методологий характерно приступать к тестированию на ранних этапах разработки, в то время как при работе с другими принято ожидать до тех пор, пока система не готова полностью.

Если вам нужна помощь с разработкой программного обеспечения или тестированием, выделенная команда разработчиков и QA инженеров готова к работе.


Министерство образования и науки Российской Федерации

Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования

«Рязанский государственный радиотехнический университет»

Гуманитарный институт

Кафедра политологии и социальных наук

Курсовая работа
по дисциплине «Методика исследования в социальной работе»
на тему: «Тестирование как метод психодиагностики»

Выполнила:
студентка группы 869
Кузина К.Ю.

Проверила:
Серебрякова Н.Н.

Рязань 2011г.

Приложение 1

Введение.

На современном этапе развития общества актуальность темы курсовой работы заключается в роли психологического тестирования для психотерапевтической и психодиагностической практики. В этих областях метод тестирования решает следующие задачи:
1. Обнаружение психических свойств личности, и исходя из обнаруженных характеристик, строить свои дальнейшие отношения. Т. е. психотерапевт получает сведения о личности больного еще до начала психотерапевтического процесса.
2. Применение методик способствует налаживанию контакта с больным, т. к. дает психотерапевту представление и об интеллектуальном уровне, о внушаемости, о характере коммуникативных особенностей больного и о многих других параметрах личности больного.
В отличие от других некоторых методов психодиагностики метод тестирования обладает высокой надёжностью, валидностью и стандартизированностью процедуры, что означает его устойчивость, согласованность результатов теста при первичном и повторном его применении на одних и тех же испытуемых, а также высокое качество измерения исследуемого свойства.
Объектом курсовой работы является конкретная семья.
Предмет курсовой работы – технология тестирования как метода психодиагностики.
Цель курсовой работы – применить на практике технологию тестирования.
Для достижения поставленной цели необходимо решить следующие задачи:
    Дать общую характеристику метода тестирования;
    Рассмотреть классификацию тестов;
    Выявление недостатков и достоинств метода;
    Проанализировать механизм проведения тестирования;
    Применить на практике технологию тестирования.
Методологической базой исследования являются «Психодиагностика» Бурлачук Л.Ф., «Психология» книга 3 Немов Р.С., «Основы профессиональной психодиагностики» Кулагин Б.В., “Психология” Л.А. Венгер, В.С. Мухина.
Курсовая работа «Тестирование как метод психодиагностики» состоит из трёх глав.
В первой главе рассмотрены теоретические аспекты метода тестирования, история появления и развития метода, учёные, внесшие вклад в распространение и совершенствование тестирования, представлена классификация тестов, а также выделены все достоинства и недостатки метода.
Во второй главе рассмотрены и проанализированы правила и различные методики проведения тестирования.
В третьей главе проведено практическое исследование на примере «Теста родительского отношения».
В заключении сделаны выводы по каждой главе и подведены итоги курсовой работы.

Глава 1. Общая характеристика метода психодиагностики – тестирования.

1.1 Тестирование: понятие, история возникновения и развития.

Тестирование (англ. test - испытание, проверка) - экспериментальный метод психодиагностики, применяемый в эмпирических социологических исследованиях, а также метод измерения и оценки различных психологических качеств и состояний индивида.
Тестовые методы принято связывать с бихевиоризмом. Методологическая концепция бихевиоризма основывалась на том, что между организмом и средой существуют детерминационные отношения. Организм, реагируя на стимулы внешней среды, стремится изменить ситуацию в благоприятную для себя сторону и приспосабливается к ней. В соответствии с этими представлениями цель диагностики сводилась первоначально к фиксации поведения. Именно этим занимались первые психодиагносты, разработавшие метод тестов (термин введен Ф. Гальтоном). Первым исследователем, употребившим в психологической литературе термин «интеллектуальный тест», был Дж. М. Кеттелл. Этот термин после статьи Кеттелла «Интеллектуальные тесты и измерения», опубликованной в 1890 г. в журнале «Mind», приобрел широкую известность. В статье Кеттелл писал о том, что применение серии тестов к большому числу индивидов позволит открыть закономерности психических процессов и тем самым приведет к преобразованию психологии в точную науку. Вместе с тем он высказал мысль о том, что научная и практическая ценность тестов возрастет, если условия их проведения будут одинаковыми. Так впервые была провозглашена необходимость стандартизации тестов, для того чтобы стало возможным сравнение их результатов, полученных разными исследователями на разных испытуемых. Дж. Кеттелл предложил в качестве образца 50 тестов, включавших различного рода измерения чувствительности, времени реакции, времени, затрачиваемого на называние цветов, количества звуков, воспроизводимых после однократного прослушивания, и др. Вернувшись в Америку после работы в лаборатории В. Вундта и чтения лекций в Кембридже, он немедленно стал применять тесты в устроенной им при Колумбийском университете лаборатории (1891). Вслед за Кеттеллом и другие американские лаборатории начали применять метод тестов. Возникла необходимость организовать специальные координационные центры по использованию этого метода. В 1895–1896 гг. в США были созданы два национальных комитета, призванных объединить усилия тестологов и придать общее направление тестологическим работам. Метод тестов получил широкое распространение. Новый шаг в его развитии был сделан французским врачом и психологом А. Бине (1857–1911) , создателем самой популярной серии тестов. До Бине определялись, как правило, различия в сенсомоторных качествах – чувствительности, быстроте реакции и т. д. Но практика требовала информации о высших психических функциях, обозначаемых обычно понятиями «ум», «интеллект». Именно эти функции обеспечивают приобретение знаний и успешное выполнение сложной приспособительной деятельности.
В 1904 г. министерство образования поручило Бине заняться разработкой методик, с помощью которых можно было бы отделить детей, способных к учению, но ленивых и не желающих учиться, от страдающих врожденными дефектами и не способных учиться в нормальной школе. Нужда в этом возникла в связи с введением всеобщего образования. Одновременно потребовалось создание специальных школ для умственно неполноценных детей. Бине в сотрудничестве с Анри Симоном провел серию экспериментов по изучению внимания, памяти, мышления у детей разного возраста (начиная с 3 лет). Проведенные на многих испытуемых экспериментальные задания были проверены по статистическим критериям и стали рассматриваться как средство определения интеллектуального уровня. Первая шкала (серия тестов) Бине – Симона появилась в 1905 г. Затем она несколько раз пересматривалась авторами, которые стремились изъять из нее все задания, требующие специального обучения. Бине исходил из представления о том, что развитие интеллекта происходит независимо от обучения, в результате биологического созревания.
Задания в шкалах Бине были сгруппированы по возрастам (от 3 до 13 лет). Для каждого возраста подбирались определенные тесты. Они считались соответствующими данной возрастной ступени, если их решало большинство детей данного возраста (80–90 %). Детям до 6 лет предлагали четыре задания, а детям старше 6 лет – шесть заданий. Задания подбирались путем исследования большой группы детей (300 человек). Испытание начиналось с предъявления тестовых заданий, соответствующих хронологическому возрасту ребенка. Если он справлялся со всеми заданиями, ему предлагались задания более старшей возрастной группы. Если он решал не все, а некоторые из них, испытание прекращалось. Если же ребенок не справлялся со всеми заданиями своей возрастной группы, ему давались задания, предназначенные для более младшего возраста. Испытания проводились до тех пор, пока не выявлялся возраст, все задания которого решались испытуемым. Максимальный возраст, все задания которого решаются испытуемым, называют базовым умственным возрастом. Если, кроме того, ребенок выполнял также некоторое количество заданий, предназначенных для более старших возрастных групп, то каждое задание оценивалось числом «умственных» месяцев. Тогда к числу лет, определяемых базовым умственным возрастом, прибавлялось и некоторое число месяцев. Несовпадение умственного и хронологического возраста считалось показателем либо умственной отсталости (если умственный возраст ниже хронологического), либо одаренности (если умственный возраст выше хронологического). Вторая редакция шкалы Бине послужила основой работы по проверке и стандартизации, проведенной в Стэнфордском университете (США) коллективом сотрудников под руководством Л. М. Термена. Этот вариант тестовой шкалы Бине был предложен в 1916 г. и имел так много серьезных изменений по сравнению с основным, что был назван шкалой Стэнфорд – Бине. Основных отличий от тестов Бине было два: введение в качестве показателя по тесту коэффициента интеллектуальности (IQ), определяющегося отношением между умственным и хронологическим возрастом, и применение критерия оценки тестирования, для чего вводилось понятие статистической нормы.
Коэффициент IQ был предложен В. Штерном, считавшим существенным недостатком показателя умственного возраста то, что одна и та же разность между умственным и хронологическим возрастом для различных возрастных ступеней имеет неодинаковое значение. Чтобы устранить этот недостаток, Штерн предложил определять частное, получаемое при делении умственного возраста на хронологический. Этот показатель, умноженный на 100, он и назвал коэффициентом интеллектуальности. Используя этот показатель, можно классифицировать нормальных детей по степени умственного развития.
Другим нововведением стэнфордских психологов явилось использование понятия статистической нормы. Норма стала тем критерием, с которым можно было сравнивать индивидуальные тестовые показатели и тем самым оценивать их, давать им психологическую интерпретацию.
Следующий этап развития психологического тестирования характеризуется изменением формы проведения тестового испытания. Все тесты, созданные в первом десятилетии XX в., были индивидуальными и позволяли вести опыт только с одним испытуемым. Использовать их могли лишь специально подготовленные люди, имевшие достаточно высокую психологическую квалификацию. Эти особенности первых тестов ограничивали их распространение. Практика же требовала тестировать большие массы людей с целью отбора наиболее подготовленных к тому или иному виду деятельности, а также распределения по разным видам деятельности людей в соответствии с их индивидуальными особенностями. Поэтому в США в период Первой мировой войны появилась новая форма тестовых испытаний – групповое тестирование.
Необходимость как можно быстрее отобрать и распределить полуторамиллионную армию рекрутов по различного рода службам, школам и училищам заставила специально созданный комитет поручить А. С. Отису разработку новых тестов. Так появились две формы армейских тестов – «Альфа» и «Бета». Первая предназначалась для работы с людьми, знающими английский язык, вторая – для неграмотных и иностранцев. После окончания войны эти тесты и их модификации продолжали широко применять.
Групповые (коллективные) тесты не только делали реальными испытания больших групп, но наряду с этим допускали упрощение инструктир ования, процедуры проведения и оценки результатов тестирования. К тестированию начали привлекаться люди, не имевшие настоящей психологической квалификации, а всего лишь обученные проведению тестовых испытаний.
В то время как индивидуальные тесты, такие как шкала Стэнфорд – Бине, в основном применялись в клинике и для консультирования, групповые тесты использовались преимущественно в системе образования, промышленности и армии. 1920-е гг. характеризовались настоящим тестовым бумом. Быстрое и широкое распространение тестологии было обусловлено прежде всего ее направленностью на оперативное решение практических задач. Измерение интеллекта с помощью тестов рассматривалось как средство, позволяющее научно, а не эмпирически подойти к вопросам обучения, профотбора, оценки достижений и т. д.
На протяжении первой половины XX в. специалистами в области психологической диагностики было создано множество разнообразных тестов. При этом, разрабатывая методическую сторону тестов, они доводили ее до совершенства. Все тесты тщательным образом стандартизировались на больших выборках; тестологи добивались того, что все они отличались высокой надежностью и хорошей валидностью, т.е. были однозначны, устойчивы относительно измеряемых свойств объекта.

1.2 Классификация тестов.

Тесты можно классифицировать в зависимости от того, какой признак взят за основание деления.
По форме тесты могут быть индивидуальные и групповые; устные и письменные; бланковые, предметные, аппаратурные и компьютерные; вербальные и невербальные (практические).
Индивидуальные тесты - это такой тип методик, когда взаимодействие экспериментатора и испытуемого происходит один на один. Эти тесты имеют большую историю. С них началась психодиагностика. Индивидуальное тестирование имеет свои преимущества: возможность наблюдать за испытуемым (за его мимикой, другими непроизвольными реакциями), слышать и фиксировать непредусмотренные инструкцией высказывания, что позволяет оценить отношение к тестированию, функциональное состояние испытуемого и др. Кроме того, психолог, опираясь на уровень подготовленности испытуемого, может по ходу эксперимента заменить один тест другим. Индивидуальная диагностика необходима при работе с детьми младенческого и дошкольного возраста, в клинической психологии - для тестирования лиц с соматическими или нервно-психическими нарушениями, людей с физическими недостатками и т.д. Необходима она и в тех случаях, когда нужен тесный контакт экспериментатора и испытуемого с целью оптимизации его деятельности. Для индивидуального тестирования нужно, как правило, много времени. Оно предъявляет высокие требования к уровню квалификации экспериментатора. В этом отношении индивидуальные тесты менее экономичны по сравнению с групповыми.
Групповые тесты - это такой тип методик, который позволяет одновременно проводить испытания с очень большой группой людей (до нескольких сот человек). Одно из главных преимуществ групповых тестов - массовость испытаний. Другое преимущество - инструкции и процедура проведения достаточно просты, и от экспериментатора не требуется высокой квалификации. При групповом тестировании в большой степени соблюдается единообразие условий проведения эксперимента. Обработка результатов обычно носит более объективный характер. Результаты большинства групповых тестов могут обрабатываться на ЭВМ. Еще одно преимущество группового тестирования - относительная легкость и быстрота сбора данных и как следствие более благоприятные по сравнению с индивидуальным тестированием условия для сопоставления с критерием. Однако следует отметить и определенные недостатки группового тестирования. Так, у экспериментатора гораздо меньше возможностей добиться взаимопонимания с испытуемым, заинтересовать его и заручиться его согласием сотрудничать. Любые случайные состояния испытуемого, такие, как болезнь, утомление, беспокойство и тревожность, которые могут влиять на выполнение заданий, гораздо труднее выявить в групповом тестировании. В целом лица, незнакомые с такой процедурой, скорее покажут более низкие результаты в групповых тестах, нежели в индивидуальных. Поэтому в тех случаях, когда принимаемое по результатам тестирования решение важно для испытуемого, желательно дополнить результаты группового тестирования либо индивидуальной проверкой неясных случаев, либо информацией, полученной из других источников.
Устные и письменные тесты. Эти тесты различаются по форме ответа. Устными чаще всего бывают индивидуальные тесты, письменными - групповые. Устные ответы в одних случаях могут формулироваться испытуемым самостоятельно ("открытые" ответы), в других - он должен из нескольких предложенных ответов выбрать и назвать тот, который считает правильным ("закрытые" ответы). В письменных тестах ответы даются испытуемым или в тестовой тетради, или на специально разработанном бланке ответов. Письменные ответы также могут носить "открытый" или "закрытый" характер.
Бланковые, предметные, аппаратурные, компьютерные тесты различаются по материалу оперирования. Бланковые тесты (другое широко известное название - тесты "Карандаш и бумага") представлены в виде тетрадей, брошюр, в которых содержится инструкция по применению, примеры решения, сами задания и графы для ответов (если тестируются дети младшего возраста). Для старших подростков предусмотрены варианты, когда ответы заносятся не в тестовые тетради, а на отдельные бланки. Это позволяет использовать одни и те же тестовые тетради многократно, до тех пор, пока они не износятся. Бланковые тесты могут применяться как при индивидуальном, так и при групповом тестировании.
В предметных тестах материал тестовых задач представлен в виде реальных предметов: кубиков, карточек, деталей геометрических фигур, конструкций и узлов технических устройств и т.п.
Аппаратурные тесты - это такой тип методик, который требует применения специальных технических средств или специального оборудования для проведения исследования или регистрации полученных данных. Широко известны приборы для исследования времени реакции (реактометры, рефлексометры), устройства для изучения особенностей восприятия, памяти, мышления. В последние годы аппаратурные тесты широко используют компьютерные устройства. С их помощью моделируются различные виды деятельности (например, водителя, оператора). Это особенно важно для профессиональной диагностики, ориентированной на определенный критерий. В большинстве случаев аппаратурные тесты проводятся индивидуально.
Компьютерные тесты. Это автоматизированный вид тестирования в форме диалога испытуемого и ЭВМ. Тестовые задания предъявляются на экране дисплея, а ответы испытуемый вводит в память ЭВМ с помощью клавиатуры; таким образом, протокол сразу создается как набор данных (файл) на магнитном носителе. С помощью компьютера экспериментатор получает для анализа такие данные, которые без ЭВМ получить практически невозможно: время выполнения заданий теста, время получения правильных ответов, количество отказов от решения и обращения за помощью, время, затрачиваемое испытуемым на обдумывание ответа при отказе от решения, время ввода ответа (если он сложен) в ЭВМ и т.д. Эти особенности испытуемых можно использовать для углубленного психологического анализа в процессе тестирования.
Вербальные и невербальные тесты. Эти тесты различаются по характеру стимульного материала. В вербальных тестах основным содержанием работы испытуемых являются операции с понятиями, мыслительные действия, осуществляемые в словесно-логической форме. Составляющие эти методики задания апеллируют к памяти, воображению, мышлению в их опосредованной речевой форме. Они очень чувствительны к различиям в языковой культуре, уровню образования, профессиональным особенностям. Вербальный тип заданий наиболее распространен среди тестов интеллекта, тестов достижений, при оценке специальных способностей (например, творческих). Невербальные тесты - это такой тип методик, в которых тестовый материал представлен в наглядной форме (в виде картинок, чертежей, графических изображений и т.п.). Они включают речевую способность испытуемых только в плане понимания инструкций, само же выполнение этих заданий опирается на перцептивные, психомоторные функции. Невербальные тесты уменьшают влияние языковых и культурных различий на результат обследования. Они также облегчают процедуру обследования испытуемых с нарушением речи, слуха или с низким уровнем образования.
По содержанию тесты обычно делятся на четыре класса, или направления: тесты интеллекта, тесты способностей, тесты достижений и тесты личности.
Тесты интеллекта. Предназначены для исследования и измерения уровня интеллектуального развития человека. Они являются наиболее распространенными психодиагностическими приемами.
Под интеллектом как объектом измерения подразумеваются не любые проявления индивидуальности, а прежде всего те, которые имеют отношение к познавательным процессам и функциям (к мышлению, памяти, вниманию, восприятию). По форме тесты интеллекта могут быть групповыми и индивидуальными, устными и письменными, бланковыми, предметными и компьютерными.
Тесты способностей. Это тип методик, предназначенных для оценки возможностей индивида в овладении знаниями, навыками, умениями, необходимыми для одной или нескольких деятельностей. Принято выделять общие и специальные способности. Общие способности обеспечивают овладение многими видами деятельности. Общие способности отождествляются с интеллектом, и поэтому часто они называются общими интеллектуальными (умственными) способностями. В отличие от общих специальные способности рассматриваются в отношении к отдельным видам деятельности. В соответствии с таким делением разрабатываются тесты общих и специальных способностей.
По своей форме тесты способностей носят разнообразный характер (индивидуальный и групповой, устный и письменный, бланковый, предметный, аппаратурный и т.д.).
Тесты достижений, или, как их можно назвать по-другому, тесты объективного контроля успешности (школьной, профессиональной, спортивной) предназначены для оценки степени продвинутости способностей, знаний, навыков, умений после прохождения человеком обучения, профессиональной и другой подготовки. Таким образом, тесты достижений в первую очередь измеряют влияние, которое оказывает на развитие индивида относительно стандартный набор воздействий. Они широко используются для оценки школьных, учебных, а также профессиональных достижений. Этим объясняется их большое количество и разнообразие. Тесты школьных достижений являются в основном групповыми и бланковыми, но могут быть представлены и в компьютерном варианте.
Профессиональные тесты достижений обычно имеют три разные формы: аппаратурные (тесты исполнения или действия), письменные и устные.
Тесты личности. Это психодиагностические приемы, направленные на оценку эмоционально-волевых компонентов психической деятельности - мотивации, интересов, эмоций, отношений (в том числе и межличностных), а также способностей поведения индивида в определенных ситуациях. Таким образом, тесты личности диагностируют неинтеллектуальные проявления.
По процедуре могут быть выделены стандартизированные и нестандартизированные тесты. Стандартизация психологами понимается в двух аспектах:
· стандартизация процедуры и условий проведения тестирования, способов обработки и интерпретации результатов, которые должны привести к созданию равных условий для испытуемых и минимизировать случайные ошибки и погрешности, как на этапе проведения, так и на этапе обработки результатов и интерпретации данных;
· стандартизация результатов, то есть получение нормы, шкалы оценки, которая служит основанием для определения уровня овладения тем, что выясняет данный тест, при этом не важно, какого рода нормы получаются и какие шкалы используются.
По ведущей ориентации:
· тесты скорости, содержащие простые задачи, время решения которых ограничено настолько, что ни один испытуемый не успевает решить все задачи в заданное время (Кольца Ландольта, Бурдона, «шифровка» из набора Векслера);
· тесты мощности или результативности, включающие трудные задачи, время решения которых либо вовсе не ограничено, либо мягко лимитировано. Оценке подлежит успешность и способ решения задачи. Примером такого рода тестовых заданий могут быть задания для письменных итоговых экзаменов за курс школы;
· смешанные тесты, которые объединяют в себе черты двух вышеперечисленных. В таких тестах представлены задачи различного уровня сложности: от самых простых до очень сложных. Время испытания в данном случае ограничено, но достаточное для решения предлагаемых задач большинством обследуемых. Оценкой в данном случае служат как скорость выполнения заданий (количество выполненных заданий), так и правильность решения. Эти тесты наиболее часто применяются на практике.
По виду нормирования:
· ориентированные на статистические нормы - тесты, основанием для сравнения в которых служат соответствующим образом обоснованные статистически полученные значения выполнения данного теста репрезентативной выборкой испытуемых;
· критериально ориентированные - тесты, предназначенные для определения уровня индивидуальных достижений испытуемого относительно некоторого заданного критерия, существующего в реальной практике и заранее известного уровня знаний, умений, навыков, необходимых для выполнения определенного вида деятельности. Критерий может быть определен на основании экспертной оценки (например, критерий школьной успешности может быть определен путем опроса педагогов, работающих в данном классе или с данным ребенком) либо практической деятельности испытуемых (критерий школьной успешности может быть определен по оценкам за четверть или год);
· прогностические, ориентированные на успешность дальнейшей деятельности;
· ненормированные.

1.3 Достоинства и недостатки метода тестов.

Метод тестов является одним из основных в современной психодиагностике. По уровню популярности в образовательной и профессиональной психодиагностике он прочно удерживает первое место в мировой психодиагностической практике уже фактически в течение столетия. Популярность метода тестов объясняется следующими главными его достоинствами:
1) стандартизацией условий и результатов. Тестовые методики относительно независимы от квалификации пользователя (исполнителя), на роль которого можно подготовить даже лаборанта со средним образованием. Это, однако, не означает, что для подготовки комплексного заключения по батарее тестов не надо привлекать квалифицированного специалиста с полноценным высшим психологическим образованием;
2) оперативностью и экономичностью. Типичный тест состоит из серии кратких заданий, на выполнение каждого из которых требуется, как правило, не более полминуты, а весь тест занимает, как правило, не более часа. Тестированию одновременно подвергается сразу группа испытуемых, таким образом, происходит значительная экономия времени на сбор данных;
3) количественным дифференцированным характером оценки. Дробность шкалы и стандартизованность теста позволяют рассматривать его как «измерительный инструмент», дающий количественную оценку измеряемым свойствам. Количественный характер тестовых результатов дает возможность применить хорошо разработанный аппарат психометрики, позволяющий оценить, насколько хорошо работает данный тест на данной выборке испытуемых в данных условиях;
4) оптимальной трудностью. Профессионально сделанный тест состоит из заданий оптимальной трудности. При этом средний испытуемый набирает примерно 50 % из максимально возможного количества баллов. Это достигается за счет предварительных испытаний – психометрического эксперимента (или пилотажа). Если в ходе пилотажа становится известным, что с заданием справляется примерно половина из обследованного контингента, то такое задание признается удачным, и его оставляют в тесте;
5) надежностью. Лотерейный характер современных экзаменов с вытягиванием счастливых или несчастливых билетов давно уже стал притчей во языцах. Лотерейность для экзаменующегося здесь оборачивается низкой надежностью для экзаменатора – ответ на один фрагмент учебной программы, как правило, не показателен для уровня усвоения всего материала. В отличие от этого любой грамотно построенный тест охватывает основные разделы учебной программы. В результате возможность для «хвостистов» выбиться в отличники, а для отличника вдруг провалиться резко сокращается;
6) справедливостью. Является важнейшим социальным следствием перечисленных выше достоинств. Ее следует понимать как защищенность от предвзятости экзаменатора. Хороший тест ставит всех в равные условия; 7) возможностью компьютеризации. В данном случае это не просто дополнительное удобство, сокращающее живой труд квалифицированных исполнителей при массовом обследовании. В результате компьютеризации повышаются все параметры тестирования (например, при адаптированном компьютерном тестировании резко сокращается время тестирования). Компьютерная организация тестирования, предполагающая создание мощных информационных банков тестовых заданий, позволяет технически предотвратить злоупотребления со стороны недобросовестных экзаменаторов. Выбор заданий, предлагаемых конкретному испытуемому, может производить из такого банка сама компьютерная программа прямо в ходе тестирования, и предъявление данному испытуемому определенного задания в этом случае является таким же сюрпризом для экзаменатора, как и для испытуемого.
Во многих странах внедрение метода тестов (равно как и сопротивление этому внедрению) тесно связано с социально-политическими обстоятельствами. Внедрение хорошо технически оснащенных тестовых служб в образование – важнейший инструмент в борьбе с коррупцией, поражающей правящую элиту (номенклатуру) во многих странах. На Западе тестовые службы работают независимо от выпускающих (школы) и принимающих (вузы) организаций и снабжают абитуриента независимым сертификатом о результатах тестирования, с которым он может отправляться в любое учреждение. Эта независимость службы тестирования от выпускающих и принимающих организаций является дополнительным фактором демократизации процесса селекции профессиональных кадров в обществе, дающая талантливому и просто работоспособному человеку лишний шанс проявить себя.
Метод тестов обладает некоторыми весьма серьезными недостатками, не позволяющими свести всю диагностику способностей и знаний исключительно к тестированию, такими как:
1) опасность «слепых» (автоматических) ошибок. Слепая вера низкоквалифицированных исполнителей в то, что тест должен сработать правильно автоматически, порождает иногда тяжелые ошибки и казусы: испытуемый не понял инструкции и стал отвечать совсем не так, как требует стандартная инструкция, испытуемый по каким-то причинам применил искажающую тактику, возник сдвиг в приложении трафарета-ключа к бланку ответов (при ручном, некомпьютерном подсчете баллов) и т. п.;
2) опасность профанации. Не секрет, что внешняя легкость проведения тестов прельщает людей, не пригодных ни к какому квалифицированному труду. Оснастившись тестами, им самим непонятного качества, но с громкими рекламными названиями, профаны от тестирования агрессивно предлагают свои услуги всем и вся. Все проблемы предполагается решать с помощью 2–3 тестов – на все случаи жизни. К количественному тестовому баллу приклеивается новый ярлык – заключение, создающее видимость соответствия диагностической задаче;
3) потеря индивидуального подхода, стрессогенность. Тест – самый общий ранжир, под который подгоняют всех людей. Возможность упустить яркую индивидуальность нестандартного человека, к сожалению, довольно вероятна. Это чувствуют сами испытуемые, и это их нервирует, особенно в ситуации аттестационного тестирования. У людей с пониженной стрессоустойчивостью возникает даже определенное нарушение саморегуляции – они начинают волноваться и ошибаться в элементарных для себя вопросах. Вовремя заметить такую реакцию на тест – задача, которая под силу квалифицированному и добросовестному исполнителю;
4) потеря индивидуального подхода, репродуктивность. Тесты знаний апеллируют прежде всего к стандартному применению готовых знаний;
5) отсутствие возможности раскрыть индивидуальность при наличии стандартных, заданных ответов – ничем не восполнимый недостаток метода тестов. С точки зрения выявления творческого потенциала больш
и т.д.................

Тестирование программного обеспечения - это оценка разрабатываемого программного обеспечения/продукта, чтобы проверить его возможности, способности и соответствие ожидаемым результатам. Существуют различные типы методов, используемые в области тестирования и обеспечения качества о них и пойдет речь в данной статье.

Тестирование программного обеспечения является неотъемлемой частью цикла разработки программного обеспечения.

Что такое тестирование программного обеспечения?

Тестирование программного обеспечения - это не что иное, как испытание куска кода к контролируемым и неконтролируемым условиям эксплуатации, наблюдение за выходом, а затем изучение, соответствует ли он предварительно определенным условиям.

Различные наборы тест-кейсов и стратегий тестирования направлены на достижение одной общей цели - устранение багов и ошибок в коде, и обеспечения точной и оптимальной производительности программного обеспечения.

Методика тестирования

Широко используемыми методами тестирования являются модульное тестирование, интеграционное тестирование, приемочное тестирование, и тестирование системы. Программное обеспечение подвергается этим испытаниям в определенном порядке.

3) Системное тестирование

4) Приемочные испытания

В первую очередь проводится модульный тест. Как подсказывает название, это метод испытания на объектном уровне. Отдельные программные компоненты тестируются на наличие ошибок. Для этого теста требуется точное знание программы и каждого установленного модуля. Таким образом, эта проверка осуществляется программистами, а не тестерами. Для этого создаются тест-коды, которые проверяют, ведет ли программное обеспечение себя так, как задумывалось.


Отдельные модули, которые уже были подвергнуты модульному тестированию, интегрируются друг с другом, и проверяются на наличие неисправностей. Такой тип тестирования в первую очередь выявляет ошибки интерфейса. Интеграционное тестирование можно осуществлять с помощью подхода "сверху вниз", следуя архитектурному сооружению системы. Другим подходом является подход «снизу вверх», который осуществляется из нижней части потока управления.

Системное тестирование

В этом тестировании, вся система проверяется на наличие ошибок и багов. Этот тест осуществляется путем сопряжения аппаратных и программных компонентов всей системы, и затем выполняется ее проверка. Это тестирование числится под методом тестирования "черного ящика", где проверяются ожидаемые для пользователя условия работы программного обеспечения.

Приемочные испытания

Это последний тест, который проводится перед передачей программного обеспечения клиенту. Он проводится, чтобы гарантировать, что программное обеспечение, которое было разработано отвечает всем требованиям заказчика. Существует два типа приемо-сдаточных испытаний - то, которое осуществляется членами команды разработчиков, известно, как внутреннее приемочное тестирования (Альфа-тестирование), а другое, которое проводится заказчиком, известно, как внешнее приемочное тестирования.

Если тестирование проводится с помощью предполагаемых клиентов, оно называется приемочными испытаниями клиента. В случае если тестирование проводится конечным пользователем программного обеспечения, оно известно, как приемочное тестирование (бета-тестирование).

Есть несколько основных методов тестирования, которые формируют часть режима тестирования программного обеспечения. Эти тесты обычно считаются самодостаточными в поиске ошибок и багов во всей системе.

Тестирование методом черного ящика

Тестирование методом черного ящика осуществляется без каких-либо знаний внутренней работы системы. Тестер будет стимулировать программное обеспечение для пользовательской среды, предоставляя различные входы и тестируя сгенерированные выходы. Этот тест также известен как Black-box, closed-box тестирование или функциональное тестирование.

Тестирование методом белого ящика

Тестирование методом "Белого ящика", в отличие от "черного ящика", учитывает внутреннее функционирование и логику работы кода. Для выполнения этого теста, тестер должен иметь знания кода, чтобы узнать точную часть кода, имеющую ошибки. Этот тест также известен как White-box, Open-Box или Glass box тестирование.

Тестирование методом серого ящика

Тестирование методом серого ящика или Gray box тестирование, это что-то среднее между White Box и Black Box тестированием, где тестер обладает лишь общими знаниями данного продукта, необходимыми для выполнения теста. Эта проверка осуществляется посредством документации и схемы информационных потоков. Тестирование проводится конечным пользователем, или пользователям, которые представляются как конечные.

Нефункциональные тесты

Безопасность приложения является одной из главных задач разработчика. Тестирование безопасности проверяет программное обеспечение на обеспечение конфиденциальности, целостности, аутентификации, доступности и безотказности. Индивидуальные испытания проводятся в целях предотвращения несанкционированного доступа в программный код.

Стресс-тестирование является методом, при котором программное обеспечение подвергается воздействию условий, которые выходят за рамки нормальных условий работы программного обеспечения. После достижения критической точки, полученные результаты записываются. Этот тест определяет устойчивость всей системы.


Программное обеспечение проверяется на совместимость с внешними интерфейсами, такими как операционные системы, аппаратные платформы, веб-браузеры и т.д. Тест на совместимость проверяет, совместим ли продукт с любой программной платформой.


Как подсказывает название, эта методика тестирования проверяет объем кода или ресурсов, которые используются программой при выполнении одной операции.

Это тестирование проверяет аспект удобства и практичности программного обеспечения для пользователей. Легкость, с которой пользователь может получить доступ к устройству формирует основную точку тестирования. Юзабилити-тестирование охватывает пять аспектов тестирования, - обучаемость, эффективность, удовлетворенность, запоминаемость, и ошибки.

Тесты в процессе разработки программного обеспечения

Каскадная модель использует подход "сверху-вниз", независимо от того, используется ли она для разработки программного обеспечения или для тестирования.

Основными шагами, участвующими в данной методике тестирования программного обеспечения, являются:

  • Анализ потребностей
  • Тест дизайна
  • Тест реализации
  • Тестирование, отладка и проверка кода или продукта
  • Внедрение и обслуживание

В этой методике, вы переходите к следующему шагу только после того, как вы завершили предыдущий. В модели используется не-итерационный подход. Основным преимуществом данной методики является ее упрощенный, систематический и ортодоксальный подход. Тем не менее, она имеет много недостатков, так как баги и ошибки в коде не будут обнаружены до этапа тестирования. Зачастую это может привести к потере времени, денег, и других ценных ресурсов.

Agile Model

Эта методика основана на избирательном сочетании последовательного и итеративного подхода, в дополнение к довольно большому разнообразию новых методов развития. Быстрое и поступательное развитие является одним из ключевых принципов этой методологии. Акцент делается на получение быстрых, практичных, и видимых выходов. Непрерывное взаимодействие с клиентами и участие является неотъемлемой частью всего процесса разработки.

Rapid Application Development (RAD). Методология быстрой разработки приложений

Название говорит само за себя. В этом случае методология принимает стремительный эволюционный подход, используя принцип компонентной конструкции. После понимания различных требований данного проекта, готовится быстрый прототип, а затем сравнивается с ожидаемым набором выходных условий и стандартов. Необходимые изменения и модификации вносятся после совместного обсуждения с заказчиком или группой разработчиков (в контексте тестирования программного обеспечения).

Хотя этот подход имеет свою долю преимуществ, он может быть неподходящим, если проект большой, сложный, или имеет чрезвычайно динамический характер, в котором требования постоянно меняются.

Спиральная модель

Как видно из названия, спиральная модель основана на подходе, в котором есть целый ряд циклов (или спиралей) из всех последовательных шагов в каскадной модели. После того, как начальный цикл будет завершена, выполняется тщательный анализ и обзор достигнутого продукта или выхода. Если выход не соответствует указанным требованиям или ожидаемым стандартам, производится второй цикл, и так далее.

Rational Unified Process (RUP). Рациональный унифицированный процесс

Методика RUP также похожа на спиральную модель, в том смысле, что вся процедура тестирования разбивается на несколько циклов. Каждый цикл состоит из четырех этапов - создание, разработка, строительство, и переход. В конце каждого цикла продукт/выход пересматривается, и далее цикл (состоящий из тех же четырех фаз) следует при необходимости.

Применение информационных технологий растет с каждым днем, также и важность правильного тестирования программного обеспечения выросло в разы. Многие фирмы содержат для этого штат специальных команд, возможности которых находятся на уровне разработчиков.

Тестирование – это исследовательский метод, который позволяет выявить уровень знаний, умений и навыков, способностей и других качеств личности, а также их соответствие определенным нормам путем анализа способов выполнения испытуемым ряда специальных заданий. Такие задания принято называть тестами. Тест – это стандартизированное задание или особым образом связанные между собой задания, которые позволяют исследователю диагностировать меру выраженности исследуемого свойства у испытуемого, его психологические характеристики, а также отношение к тем или иным объектам. В результате тестирования обычно получают некоторую количественную характеристику, показывающую меру выраженности исследуемой особенности у личности. Она должна быть соотносима с установленными для данной категории испытуемых нормами.

Значит, с помощью тестирования можно определить имеющийся уровень развития некоторого свойства в объекте исследования и сравнить его с эталоном или с развитием этого качества у испытуемого в более ранний период.

Существуют определенные правила проведения тестирования и интерпретации полученных результатов. Эти правила достаточно четко проработаны, и основные из них имеют следующий смысл:

1) информирование испытуемого о целях проведения тестирования;

2) ознакомление испытуемого с инструкцией по выполнению тестовых заданий и достижение уверенности исследователя в том, что инструкция понята правильно;

3) обеспечение ситуации спокойного и самостоятельного выполнения заданий испытуемыми; сохранение нейтрального отношения к тестируемым, уход от подсказок и помощи;

4) соблюдение исследователем методических указаний по обработке полученных данных и интерпретации результатов, которыми сопровождается каждый тест или соответствующее задание;

5) предупреждение распространения полученной в результате тестирования психодиагностической информации, обеспечение ее конфиденциальности;

6) ознакомление испытуемого с результатами тестирования, сообщение ему или ответственному лицу соответствующей информации с учетом принципа «Не навреди!»; в этом случае возникает необходимость решения серии этических и нравственных задач;

7) накопление исследователем сведений, полученных другими исследовательскими методами и методиками, их соотнесение друг с другом и определение согласованности между ними; обогащение своего опыта работы с тестом и знаний об особенностях его применения.

Выделяют также несколько типов тестов, каждому из которых сопутствуют соответствующие процедуры тестирования.

Тесты способностей позволяют выявить и измерить уровень развития тех или иных психических функций, познавательных процессов. Такие тесты чаще всего связаны с диагностикой познавательной сферы личности, особенностей мышления и обычно называются также интеллектуальными.

К ним относятся, например, тест Равена, тест Амтхауэра, соответствующие субтесты теста Векслера и т.д., а также тесты-задания на обобщение, классификацию и множество других тестов исследовательского характера.

Тесты достижений ориентированы на выявление уровня сформированности конкретных знаний, умений и навыков и как меры успешности выполнения, и как меры готовности к выполнению некоторой деятельности. В качестве примеров могут служить все случаи тестовых экзаменационных испытаний. На практике обычно применяются «батареи» тестов достижений.

Личностные тесты предназначены для выявления свойств личности испытуемых. Они многочисленны и разнообразны: существуют опросники состояний и эмоционального склада личности (например, тесты тревожности), опросники мотивации деятельности и предпочтений, определения черт характера личности и отношений.

Имеется группа тестов, называемых проективными, которые позволяют выявить установки, неосознаваемые потребности и побуждения, тревоги и состояние страха.

Применение тестов всегда связано с измерением проявления того или иного психологического свойства и оценкой уровня его развития или сформированности. Поэтому важное значение имеет качество теста. Качество теста характеризуется критериями его точности, т.е. надежностью и валидностью.

Надежность теста определяется тем, насколько получаемые показатели являются стабильными и насколько они не зависят от случайных факторов. Разумеется, речь идет о сравнении показаний одних и тех же испытуемых. Это значит, что надежному тесту должна быть свойственна согласованность показателей тестирования, полученных при повторном тестировании, и можно быть уверенным в том, что тест выявляет одно и то же

свойство. Применяются разные способы проверки надежности тестов.

Один способ – это только что упомянутое повторное тестирование: если результаты первого и через определенное время проводимого повторного тестирования покажут наличие достаточного уровня корреляции, то это будет свидетельствовать о надежности теста. Второй способ связан с применением другой эквивалентной формы теста и наличием высокой корреляции между ними. Возможно и применение третьего способа оценки надежности, когда тест допускает его расщепление на две части и одна

и та же группа испытуемых обследуется с применением обеих частей теста. Надежность теста показывает, насколько точно измеряются психологические параметры и насколько высокой может быть мера доверия исследователя к полученным результатам.

Валидность теста отвечает на вопрос о том, что именно выявляет тест, насколько он пригоден для выявления того, для чего он предназначен. Например, тесты способностей нередко выявляют несколько иное: натренированность, наличие соответствующего опыта или, наоборот, его отсутствие. В таком случае тест не отвечает требованиям валидности.

В психодиагностике выделяют разные виды валидности. В простейшем случаеь валидность теста обычно определяется путем сопоставления полученных в результате тестирования показателей с экспертными оценками о наличии данного свойства у исследуемых (текущая валидность или валидность «по одновременности»), а также путем анализа данных, полученных в результате наблюдения за обследуемыми в различных ситуациях их жизни и деятельности, и их достижений в соответствующей области.

Вопрос о валидности теста может быть решен еще и сравнением его данных с показателями, полученными с помощью методики, связанной с данной методикой, валидность которой считается установленной.

Изучение продуктов деятельности – это исследовательский метод, который позволяет опосредованно изучать сформированность знаний и навыков, интересов и способностей человека на основе анализа продуктов его деятельности. Особенность этого метода заключается в том, что исследователь не вступает в контакт с самим человеком, а имеет дело с продуктами его предшествующей деятельности или размышлениями о том, какие

изменения произошли в самом испытуемом в процессе и в результате его включенности в некоторую систему взаимодействий и отношений.

В переводе с английского языка «тест» - испытание, проба, проверка. В психологии, социологии, педагогике и других науках о человеке это слово употребляется в качестве термина, обозначающего систему заданий, подобранных с таким расчетом, чтобы можно было точно и обоснованно охарактеризовать конкретные особенности лиц, выполнивших эти задания. Они конструируются, выверяются, используются и интерпретируются по строгим и независящим от специфики той или иной науки правилам, призванным обеспечить качество выводов.

Рассмотрим метод исследования, предусматривающий анализ деятельности испытуемых с такими заданиями. В психодиагностике под тестированием понимают стандартизированное испытание, предназначенное для установления количественных (и качественных) индивидуально-психологических различий. Подчеркивая точность вычисления результатов и максимальную изолированность их от влияния людей, организующих данную процедуру, о тестировании часто говорят как об «измерении» особенностей психики.

Следует заметить, что ключевое понятие в приведенном выше определении - стандартизированность. Что это такое?

Во-первых, это обозначение единообразия требований ко всем условиям тестирования и инструкциям по его проведению и обработке результатов. В отношении разных лиц тест применяется унифицированно, по одному и тому же стандарту. Тем самым обеспечивается определенная гарантия уравнивания ситуативных факторов, способных поставить часть испытуемых в более выгодное положение по сравнению с остальными. Без стандартизации становится невозможным сопоставление индивидуальных результатов.

Так, например, инструкции обычно предъявляются в письменном виде или (реже) зачитываются, но никак не формулируются по памяти, своими словами. После этого никому не дается персональных пояснений, индивидуальных комментариев и т. п.

Во-вторых, стандартизированностью называют перевод первичных («сырых») тестовых баллов, отражающих количество выполненных заданий, в более обобщенную шкалу, характеризующую степень индивидуальной выраженности данного психического свойства или функции.

Допустим, при выполнении теста интеллекта испытуемый успешно решил определенное количество заданий. Зная только это, мы не можем еще ничего сказать о том, каков уровень его интеллекта. В самом деле, много им сделано или мало? Хорошо прошло для него испытание или плохо? Часто ли такой показатель встречается у других? А сколько заданий следовало бы выполнить, чтобы засвидетельствовать высокий уровень интеллекта?

На все эти вопросы невозможно дать ответ, не имея единой для всех системы отсчета, некоего эталона. В качестве последнего обычно выступают итоги тестирования многочисленной и репрезентативной выборки. Сравнивая одного испытуемого с другими, делавшими ранее тот же тест, мы осуществляем стандартизацию по статистической норме. В последнее время все чаще применяется и несколько иной вид стандартизации, когда результаты испытуемого сопоставляют не с другими результатами, а с описанием требований общества к развитию данной функции или свойства, то есть с социально-психологическим нормативом. Как бы то ни было, стандартизация обеспечивает возможность перехода от сведений по выполнению конкретного теста тем или иным лицом к психологическим характеристикам, лежит в основе единообразия интерпретации.

Обратимся к истории начального этапа развития метода тестов.

Известно, что уже в глубокой древности существовали более или менее типовые процедуры выявления индивидуальных различий между людьми. Так, в Китае более четырех тысяч лет назад высшие чиновники обязаны были выдержать в присутствии императора строгий экзамен по знанию ритуалов и церемоний, стрельбе из лука, верховой езде, умению писать, считать, музицировать. В древнем Вавилоне и в Египте претендент на должность писца должен был доказать обладание соответствующими навыками, разбираться в финансах, законах, сельском хозяйстве. В библии описаны своеобразные способы отбора воинов на особо трудные и опасные задания в зависимости от их действий на привале. В античной Греции и Риме разрабатывались весьма подробные классификации характеров и закономерности их определения по поведенческим признакам...

Несмотря на то, что все это и многое другое исторически предшествовало тестированию, возникновение научных тестов следует отнести лишь к концу девятнадцатого века. Сам термин был введен создателем первых антропометрических тестов Френсисом Гальтоном (1822 -1911), занимавшимся исследованием остроты зрения и слуха, мускульной силы и т. п. Однако наибольшую популярность этот термин приобрел после выхода в свет в 1890 году статьи «Умственные тесты и измерения», написанной американским психологом, родоначальником современного тестирования Джеймсом Кеттеллом (1860-1944). В этой статье Кеттелл писал о том, что применение серии статистически обрабатываемых заданий к большому количеству индивидов как ничто другое способствует преобразованию психологии в точную науку. Им же впервые была высказана мысль о необходимости стандартизации ситуации обследования.

Кеттелл разработал несколько десятков тестов, направленных на оценку элементарных сенсомоторных процессов (чувствительности, времени реакции, количества воспроизводимых звуков после разового прослушивания и др.).

Довольно быстро возникла потребность в ориентации тестов на высшие психические функции. Качественный рывок в этом направлении связан с именем Альфреда Бине (1857-1911), составившего по поручению министерства образования Франции в 1905 году серию тестов интеллекта.

Тестирование по шкале Бине начиналось с предъявления заданий, соответствующих хронологическому возрасту ребенка (то есть тех, которые успешно решались подавляющим большинством его сверстников). Если он успешно справлялся с работой, предлагался материал, рассчитанный на более старших детей. В случае, если ребенок решал лишь часть новых заданий, испытание прекращалось. При этом к количеству лет базового умственного возраста (тому, где были все задания решены) прибавлялось несколько месяцев умственного возраста (пропорционально количеству решенных заданий для более старших). Если же ребенок не справлялся со всеми заданиями своей возрастной группы, ему давался материал для более младших, пока не доходили до возраста, все задания которого успешно решались.

По А. Бине, характеристикой интеллекта являлась разность между умственным и хронологическим возрастами. Однако, как легко заметить, одна и та же разность для той или иной возрастной ступени приобретает неодинаковое значение. Такое обстоятельство весьма неудобно. Для его устранения немецкий психолог Вильям Штерн (1875-1938) предложил в 1912 году определять не разность, а соотношение (частное) умственного и хронологического возрастов, то есть делить показатели один на другой. Полученное число, умноженное на 100, он назвал величиной коэффициента интеллекта (IQ).

Заметим, что в большинстве современных тестов интеллекта принята иная процедура определения коэффициента, предложенная американским психологом и психиатром Дэвидом Векслером (1896-1981). Она основана на применении единицы стандартных отклонений, показывающей, как соотносятся результаты испытуемого с интеллектом группы его сверстников.

Тесты, созданные в начале века, были индивидуальными. Использовать их могли лишь высококвалифицированные психологи. В период первой мировой войны в Америке возникла необходимость массовых обследований призывников на предмет оптимального распределения их с учетом индивидуальных особенностей. По поручению военного ведомства Артур Отис (1888-1963) разработал первые групповые тесты - «альфа» и «бета». Одна из форм предназначалась для определения интеллекта у лиц, хорошо знающих английский язык, а другая была ориентирована на малограмотных и иностранцев. Эти тесты были значительно упрощены по процедуре применения и оценке результатов.

С 20-х гг. началось широкое распространение тестирования во всем мире. При этом, наряду с тестами общего интеллекта, стало активно развиваться и более конкретное, приближенное к потребностям повседневной диагностической практики тестирование специальных способностей и профессиональных достижений. В 30-е - 40-е гг. происходит становление психодиагностики личности, осуществляемой при помощи тестов, опросников, проективных методик.

Именно тогда на несколько десятилетий были прекращены все психодиагностические исследования в СССР. Это стало следствием постановления ЦК ВКП(б), осудившего (1934 г.) существовавшую в то время педологию - науку о целостном изучении ребенка с помощью комплекса методов психологии, анатомии, физиологии, медицины и педагогики.

В настоящее время в нашей стране, как и во всем мире, тестирование является одним из основных методов психологического исследования. Динамично развивается его инструментарий, непрерывно совершенствуются способы обработки и интерпретации информации.

Одним из наиболее важных вопросов разработки теста следует признать необходимость тщательного выявления качества измерения. На последних страницах журналов иногда печатают так называемые «популярные тесты». В отечественной школе все чаще применяются «тесты учителей». В строгом смысле слова те и другие нельзя отнести к тестам, так как показатели их надежности и валидности не установлены.

Надежность - это помехоустойчивость теста, независимость его результатов от действия случайных факторов.

Можно ли в дальнейшем применять тест, если на этапе проверки его качества испытуемые каждый раз получают оценки, значительно расходящиеся с предыдущими своими оценками? Ведь если исследуемый признак по своей природе стабилен, то результаты повторных тестирований одних и тех же лиц должны быть сходными, почти не отличающимися от полученных ранее. Надежность является характеристикой точности измерения. Она позволяет судить о том, в какой мере можно доверять данным тестирования.

Причинами недостаточной надежности тестов являются:

  • - разнообразие ситуационных условий испытания, меняющихся от одного случая к другому (различия в манере поведения тестирующего лица, наличие посторонних помех, непредусмотренное присутствие других людей, вариативность освещенности помещения и температуры воздуха и т. д.);
  • - несовершенство разработанного теста (нечеткость инструкций, принципиальная разнородность заданий, допущение элементов субъективизма при интерпретации выполнений и т. д.);
  • - изменения внутренних состояний испытуемых (усталость, раздражение, апатия, нервозность и др.), а также их отношений к тестированию.

Максимальное устранение названных причин способствует достижению приемлемой надежности теста.

Количественным выражением данной характеристики служат коэффициенты надежности. Каждый из них освещает какую-либо сторону, определенный аспект точности измерения. Прежде чем мы перейдем к рассмотрению типов надежности, заметим, что процедура исчисления значений коэффициентов обычно предполагает установление корреляции рангов всех членов выборки, в отношении которых тест проверяется составителями перед внедрением его в психодиагностическую практику. В связи с тем, что корреляционный анализ в дальнейшем изучается как самостоятельный метод, укажем лишь одно: величина коэффициента надежности тем больше, чем неизменнее место (ранг) испытуемых по отношению ко всем другим рангам в выборке. Иначе говоря, положение результатов каждого испытуемого в общем ряду показателей выполнения теста должно всякий раз сохраняться.

На практике применяются чаще всего следующие типы данной характеристики теста:

1. Ретестовая надежность, определяемая при повторном обследовании тестом одних и тех же лиц.

Здесь есть одна проблема: если интервал времени между тестированиями небольшой, то заметно влияние эффекта тренировки, если же временной промежуток значителен, то за этот период вполне может измениться сам исследуемый признак. Тем не менее, ретестовая надежность является важной характеристикой, она позволяет установить степень независимости результатов тестирования от воздействий проводящих его людей, а также от возможных изменений ситуаций обследования.

Считается необходимым, чтобы коэффициент такой надежности был не ниже 0,80. В противном случае точность измерения недостаточна, процедура тестирования нуждается в дополнительной стандартизации.

2. Надежность частей теста, которая характеризует степень однородности (или, как говорят, гомогенности) всех его заданий. Это свидетельство, что разработанный тест отражает актуальное состояние только одного психического феномена, а все его задания взаимно согласованы, непротиворечивы и неразнонаправленны.

Чаще всего для применения этого способа задания делятся на четные и нечетные. Результаты выполнения людьми тех и других обрабатываются отдельно, а затем сопоставляются.

Тест считается надежным, если полученный при сопоставлении коэффициент превышает 0,75. В том случае, когда данный показатель не достигает указанной величины (а это не редкость при разработке теста), составителю необходимо выявить, какие именно задания следует переделать или изъять из употребления.

3. Надежность параллельных форм устанавливается, если составителем разработано несколько взаимозаменяемых наборов заданий, то есть тех, которые по своему содержанию являются весьма сходными, но не идентичными, напоминая варианты заданий школьной контрольной работы.

Принятая процедура определения такой надежности предусматривает, что выборка делится на две равные части, затем одной из них предлагается первая форма теста, а другой - вторая. Через некоторое время производится повторное тестирования, но в обратном порядке. Коэффициент надежности устанавливается методом корреляционного анализа результатов обоих тестирований. Его величина не должна быть менее 0,75. В противном случае становится необходимой проверка степени стандартизированности испытания и изменение содержания тех заданий, которые оказались несоответствующими своим аналогам из параллельной формы.

Итак, надежность теста характеризует степень точности измерения, не сообщая о том, что же именно измеряется. Она является предпосылкой наличия другого важного качества - валидности.

Валидность (от англ. «действительный», «пригодный», «имеющий силу») - комплексная характеристика теста, указывающая на обоснованность и эффективность его применения.

В классической тестологии выделяется множество типов валидности. Проанализируем наиболее распространенные из них.

Такая валидность имеет особое значение в критериально-ориентированных тестах (КОРТ) и тестах достижений, о которых речь пойдет ниже.

2. Конструктная валидность отражает степень соотнесения результатов теста с базовыми для него теоретическими понятиями (конструктами). Определяется, когда предмет измерения существует в неявном, комплексном виде, требует специального анализа.

Например, если тест разрабатывается для установления степени понимания речи, то необходимо, как минимум, представлять, какие компоненты образуют этот конструкт. Выберите из предложенного здесь перечня только те пункты, которые относятся к «пониманию речи»:

  • - ребенок может ответить на вопросы;
  • - он очень внимателен при слушании;
  • - он может пересказать услышанное своими словами;
  • - он может дословно запомнить текст с первого раза;
  • - он может составить план текста;
  • - он задает экспериментатору много вопросов по услышанному...

Очевидно, что только часть из них имеет отношение к рассматриваемому конструкту. Осуществив анализ проблемы, мы можем в дальнейшем составить задания, отражающие разные аспекты понимания речи.

После этого формулируется ряд гипотез о том, каким образом данные разрабатываемого теста будут коррелировать с широким кругом других тестов, направленных как на близкие конструкты, так и на отдаленные. Гипотезы проверяются методами корреляционного и факторного анализа. Подтверждение или опровержение совокупности теоретически ожидаемых связей становится характеристикой конструктной валидности теста.

  • 3. Критериальная валидность показывает, как результаты тестирования соотносятся с теми оценками измеряемого качества или свойства, которые получены другими (нетестовыми) способами, а именно: с мнениями специалистов, данными наблюдений и экспериментов, анализом продуктов деятельности испытуемых и т. д. Она может быть двух типов:
    • - валидностью текущей, когда результаты теста сопоставляются с данными из других источников, собираемых одновременно с тестированием;
    • - валидностью прогностической (предсказывающей), когда результаты теста сопоставляются с более поздним поведением испытуемого в данной сфере. К примеру, итоги тестирования учебных достижений в выпускном классе могут быть подтверждены, а могут быть и опровергнуты фактами о поступлении членов выборки в высшие учебные заведения.

Иногда применительно к некоторым из описанных типов валидности употребляют обозначение «эмпирическая валидность». Так называют те из них, при определении степени выраженности которых использовались статистические способы анализа данных, то есть коэффициенты вычислялись путем корреляций.

Каким образом соотносятся между собой характеристики эмпирической валидности и надежности?

Если высокая надежность теста свидетельствует, что он точно измеряет нечто, то высокая валидность указывает, что тест измеряет именно то, для чего он был разработан. Поэтому коэффициенты валидности не могут превышать значений коэффициентов надежности.

Обе рассмотренные характеристики непременно определяются составителями в ходе подготовки теста. Психолог, использующий тест в своей работе, благодаря этому получает представление о качестве измерения. Следует сказать и о том, что повторную проверку на надежность и валидность обычно проходят тесты, заимствованные, переведенные на другой язык. Без этого невозможно судить о качестве их социокультурной адаптации к новым условиям использования.

Бывает так, что тест обладает адекватной валидностью и надежностью, но тем не менее, почти не находит применения в исследовательской практике. Это может быть обусловлено излишней сложностью процедуры интерпретации, чрезмерно высокими требованиями к квалификации тестирующего, значительной трудоемкостью и длительностью применения и т. д. Необходимо считать существенной еще одну характеристику психологического измерения - его экономичность.

Под экономичностью понимают целесообразность применения теста, определяемую наличием допустимого соотношения затрат на тестирование (времени, труда, финансов) и пользы от него.

Сказанное, разумеется, не означает, что тестирование непременно должно быть легким, коротким и «дешевым», пусть даже в ущерб другим качествам измерения. Речь идет именно о допустимом соотношении надежности, валидности и экономичности.

Перейдем к изучению основных видов тестов. Для этого воспользуемся одной из наиболее распространенных классификаций. В зависимости от особенностей интерпретации выполнения тесты подразделяются на два вида:

  • - ориентированные на статистическую норму;
  • - критериально-ориентированные (КОРТ).

Первые из них предполагают использование традиционного приема математической статистики - «нормирования» результатов. Что это такое?

Процедура разработки такого теста обязательно предусматривает установление норм его выполнения путем предварительного тестирования репрезентативной выборки лиц, для которых он предназначен. При этом выявляется диапазон тестовых баллов, характерный для низкого уровня развития данного психического свойства или функции, среднего уровня и высокого. В дальнейшем результаты испытуемого сравнивают с данными, полученными при тестировании выборки, определяя тем самым относительное его место в общем ряду.

Следует заметить, что задания ориентированного на статистическую норму теста подбираются таким образом, чтобы итоги их выполнения выборкой приближались к кривой нормального распределения Гаусса.

Описание подобного распределения результатов может быть сделано с помощью двух показателей: среднего арифметического (х) и стандартного отклонения (у). Оба они получается путем несложных расчетов:

формула среднего арифметического и стандартного отклонения

Где n - число членов выборки, ?N - сумма полученных ими результатов, ?d - сумма значений всех индивидуальных отклонений от среднего арифметического.

Нормальным считается такое распределение результатов, при котором в пределах одного стандартного отклонения (х ± у) находится 68 % испытуемых (то есть 34 % меньше среднего, 34 % больше среднего). Тогда в пределах двух стандартных отклонений останется 94,45 % испытуемых, а в пределах трех стандартных отклонений - почти все из них (99,73 %). Зачем это все необходимо?

Тем самым и достигается возможность классифицировать испытуемых по отношению ко всей популяции, то есть судить о том, что они входят в группу людей с показателями выше или ниже нормы.

Для удобства работы осуществляют преобразование «сырых» баллов в стандартные единицы (стандартизацию). Сохраняя относительные позиции испытуемых, изменяют среднее арифметическое и стандартное отклонение путем добавления некоей константы к каждой отдельной величине. В психологии широко используется несколько таких шкал стандартных норм. Например, шкала Т-величин имеет среднее арифметическое 50 и стандартное отклонение 10, а, скажем, шкала коэффициента интеллекта имеет среднее равным 100, со стандартным отклонением 15 и т.д.

Интерпретируются эти показатели следующим образом: все результаты, которые не выходят за границы (х ± у), находятся в пределах нормы. Те же лица, кто по тесту интеллекта получил значение IQ менее 85, находятся ниже нормы, а те, чьи результаты более 115 - выше нормы, далее, результаты от 115 до 130 интерпретируются как «несколько выше нормы», а от 130 до 145 - «значительно выше нормы». Соответственно классифицируются и результаты, располагающиеся ниже нормы.

Критериально-ориентированные тесты не предполагают подобного сопоставления данных испытуемых с итогами предварительного тестирования выборки. За точку отсчета в них принято не нормальное распределение, а определенный объем требований общества к психическому и личностному развитие его членов. Этот весьма обобщенный по своей природе феномен выражается в разрабатываемой составителями совокупности конкретных критериев.

В формулировке каждого такого критерия выделяется две части:

  • - содержательно-операциональная, четко характеризующая особенности действий испытуемых при выполнении тестовых заданий (типа «объясняет», «вычисляет», «подразделяет», «выбирает» и т. д.);
  • - соотносительно-предметная, детально описывающая тот или иной фрагмент области содержания знания на материале которого составлены тестовые задания. Обычно эта часть получает конкретизацию в ходе анализа составителями учебных программ, образовательных стандартов, действующих учебно-методических пособий и указаний.

Другими словами, одна часть критерия определяет, как надо сделать работу (каким образом), а другая - что надо сделать из предназначенного для усвоения (какой материал).

Разумеется, не каждая область знания поддается последовательной формализации для выражения в виде совокупности критериев. КОРТы, как правило, разрабатываются для диагностики сформированности умственных действий, а также для контроля за состоянием знаний, умений и навыков обучаемых. В этих случаях их применение позволяет, по словам А. Анастази, осуществлять интерпретацию с упором на то «что индивид может делать и что он делает, а не на то, как он выглядит на фоне других».

Заметно большее распространение в настоящее время имеют тесты, интерпретация выполнения которых ориентирована на статистическую норму.

В зависимости от предмета измерения выделяют тесты:

  • - интеллекта, обеспечивающие изучение уровня развития мышления и познавательных процессов в целом;
  • - способностей, оценивающие обучаемость, возможность и легкость овладения определенными знаниями, умениями и навыками. Сюда относят тесты общих и специальных способностей;
  • - достижений, определяющие обученность, то есть уровень овладения знаниями, умениями и навыками в какой-либо области (учебной, профессиональной, спортивной);
  • - личности, направленные на изучению различных аспектов личностного развития, таких как интересы, мотивы, эмоции, отношения и др.;
  • - межличностные, предусматривающие оценку человеческих отношений в группе, выявление специфики коммуникативных процессов.

По характеру тестовых заданий различают следующие виды тестов:

  • - вербальные, материал которых представлен в словесной форме;
  • - образные, где работа испытуемых производится с рисунками, схемами на основе возникающих при этом наглядных представлений;
  • - практические, выполняемые при манипулировании реальными объектами или их заместителями;
  • - комбинированные, объединяющие в себе как вербальный, так и невербальный материал заданий.

По форме предъявления заданий тесты подразделяются на бланковые («бумаги и карандаша»), аппаратурные, рисуночные и устные.

В зависимости от количества испытуемых тесты делятся на индивидуальные и групповые.

По времени выполнения тесты бывают двух видов:

  • - скорости, в которых основным показателем работы испытуемых является темп решения заданий. Оценивается либо общее количество правильно выполненных заданий за отведенное время, либо объем времени, затраченного на выполнение теста;
  • - результативности, где показатель скорости работы испытуемых не имеет соотнесения с результатами тестирования, не влияет на них. Временное ограничение (если оно есть) не является жестким, оно служит лишь целям обеспечения стандартизации процедуры измерения.

Следует заметить, что в психодиагностической практике наряду с тестами находят активное применение личностные опросники. Это методики, задания которых представлены в виде вопросов или утверждений. Задача испытуемого - дать письменные или устные ответы, сообщить информацию о себе, выразить отношение, сформулировать мнения.

По своей сути, опросники предполагают осуществление испытуемым субъективного самоотчета. От анкет, которые будут детально рассмотрены нами в дальнейшем, личностные опросники отличаются следующим:

  • 1) направленностью на изучение психологических особенностей;
  • 2) стандартизацией процедур применения и интерпретации;
  • 3) опорой на содержание определенной научной концепции, теории;
  • 4) наличием норм выполнения или соответствующих критериев развития, по отношению к которым осуществляется стандартизация индивидуальных результатов.
  • 5) проверкой степени валидности и надежности.

Все это, а также нередко более искусная постановка вопросов, маскирующая их диагностическую специфику, и тщательная разработка контроля за достоверностью и искренностью ответов («шкалы лжи»), позволяют считать их «тестами-опросниками», а не методиками самонаблюдения или традиционного опроса.

Примерами таких тестов-опросников являются Миннесотский многоаспектной личностный перечень (ММРI), разработанный С. Хатуэем и Дж. Маккинли в 1940 году и до сих пор широко использующийся в клинической психодиагностике, Патохарактерологический диагностический опросник (ПДО), предложенный А. Е. Личко (1970) для определения психопатического развития личности и акцентуаций характера, методика многофакторного исследования личности Р. Кеттелла (16-ти факторный опросник) и т. д.

В заключение, необходимо отметить следующее: использование метода тестов для исследований требует наличия как общепсихологических знаний, так и компетентности в области теории и практики измерения. Дело в том, что изучение сложных психических феноменов не сводится к чисто «технической» деятельности по предъявлению заданий и регистрации решений. Недостаток квалификации нередко оборачивается потерей индивидуального подхода, грубейшими дефектами интерпретации результатов, увеличением числа ошибок при организации процедуры испытания.