Понятие и задачи факторного анализа
Факторный анализ относится к статистическим методам психологии. Сущность метода состоит в наличии так называемого "фактора". Смысл фактора состоит в том, что им определяется некоторая ненаблюдаемая и прямо не измеряемая величина, категория, связанная с множеством близких к ней характеристик, которые могут быть измерены [1].
Типы факторного анализа
Факторный анализ в психологии призван использоваться при обработке больших массивов экспериментальных данных. В него входит комплекс аналитических методов, позволяющих выявить скрытые латентные признаки, а так же причины их возникновения и внутренние закономерности их взаимосвязи.
Факторный анализ – это раздел многомерного статистического анализа, объединяющий методы оценки размерности множества наблюдаемых переменных посредством исследования структуры ковариационных или корреляционных матриц [2].
Ключевые задачи факторного анализа представлены на рисунке ниже.
Задачи факторного анализа
Задачи факторного анализа определяют специфику его использования, а именно: факторный анализ используется как метод сокращения данных или как метод структурной классификации.
Важное отличие факторного анализа от всех других методов в том, что его нельзя применять для обработки первичных, или, как говорят, "сырых", экспериментальных данных, т.е. полученных непосредственно при обследовании испытуемых. Материалом для факторного анализа служат корреляционные связи, а точнее – коэффициенты корреляции Пирсона, которые вычисляются между переменными, включенными в обследование. Иными словами, факторному анализу подвергаются корреляционные матрицы.
Этапы факторного анализа
Факторный анализ рассматривается в психологии как статистический метод. Именно по этой причине особую ценность представляет возможность генеза гипотез и их проверки посредством факторного анализа.
Реализация факторного анализа происходит в несколько этапов:
- вычисление корреляционной матрицы для всех переменных, участвующих в анализе
- извлечение факторов
- вращение факторов для создания упрощенной структуры
- интерпретация факторов.
Формулы факторного анализа
Во всех современных статистических пакетах есть программы для корреляционного и факторного анализов. Компьютерная программа по факторному анализу по существу пытается "объяснить" корреляции между переменными в терминах небольшого числа факторов.
Факторы анализ проводится с использованием формул. Формулы варьируются в зависимости от модели. Так, аддитивные модели факторного анализа представляют собой алгебраическую сумму показателей и имеют вид:
Мультипликативные модели факторного анализ а в обобщенном виде могут быть представлены формулой:
Кратные модели факторного анализа рассчитываются по формуле:
Смешанные модели представляют собой комбинацию перечисленных выше моделей и могут быть описаны с помощью специальных выражений:
Пример матрицы
Из матрицы видно, что корреляция между переменной V1 и первым фактором = 0,91. Чем выше факторная нагрузка, тем больше ее связь с фактором.
Существует одно принципиально важное свойство коэффициента корреляции, благодаря которому составляются описательные характеристики. Коэффициент корреляции, возведенный в квадрат, показывает, какая часть дисперсии (вариативности) признака является общей для двух переменных, или, говоря проще, насколько эти переменные перекрываются. Например, 2 переменные с корреляцией 0,9 перекрываются со степенью 0,9 * 0,9 = 0,81. Т.е. 81% дисперсии той и другой переменной являются общими, т.е. совпадают. Чтобы вычислить собственные значения фактора 1, нужно возвести в квадрат факторные нагрузки и сложить их по столбцу. 0,91*0,91 + 0,20*0,20 + 0,94*0,94 = 1,7517. Если собственное значение фактора разделить на число переменных, полученное число покажет, какая доля дисперсии объясняется данным фактором. 1,7517: 3 = 0,5839. Фактор 1 объясняет около 58 % информации.
КМО – это коэффициент, характеризующий степень применимости факторного анализа для данной выборки.
КМО 0,9 и больше – безусловная адекватность, 0,8 – высокая применимость, 0,7 – приемлемая, 0,6 – удовлетворительная, 0,5 – низкая, Меньше 0,5 – факторный анализ не приемлем для данной выборки. Значение Bartletta должно быть не меньше 0,05.
Условия применения факторного анализа:
- нельзя факторизовать качественные данные, полученные по шкале наименований, например, цвет волос, глаз и т.д.
- все переменные должны быть независимым, а их распределение должно приближаться к нормальному.
- связи между переменными должны быть приблизительно линейны или не иметь явно криволинейного характера,
- в исходной корреляционной матрице должно быть несколько корреляций по модулю выше 0,3. Иначе – трудно извлечь из матрицы какие-либо факторы.
- выборка испытуемых должна быть достаточно большой (желательно 100 испытуемых).
Литература
- Тугушев Р.Х. Особенности факторного анализа в психологии // Известия Саратовского университета. 2006. Т. 6. Сер. Философия. Психология. Педагогика, вып. 1/2
- Ермолаев О.Ю. Математическая статистика для психологов – М.: Московский психолого-социальный институт, Флинта, 2003.