Measuring Intelligence

Измерение интеллекта

Измерение интеллекта:
Тесты IQ, их ограничения и альтернативные оценки

Более века тесты интеллекта — особенно тесты IQ — служат основным ориентиром для оценки когнитивных способностей. От ранней шкалы Бине-Симона до современных батарей Векслера эти тесты формировали все — от распределения в образовательные учреждения до карьерных перспектив. Однако они также вызвали острые споры. Критики сомневаются, что один балл может отразить богатство человеческого интеллекта, указывая на культурные предвзятости, узкий акцент на навыках и роль теста в воспроизводстве социальных неравенств. В последнее время появились альтернативные меры, ориентированные на эмоциональный интеллект (EQ) и мультикультурную адаптацию, бросающие вызов доминированию чисто академической модели IQ. Эта статья прослеживает эволюцию тестирования IQ, рассматривает его сильные и слабые стороны и исследует дополнительные оценки, направленные на более целостное понимание интеллекта.


Содержание

  1. Происхождение и эволюция тестирования IQ
    1. Шкала Бине–Симона: выявление учащихся «группы риска»
    2. Стэнфорд–Бине и рост концепции IQ
    3. Шкалы Векслера: расширение оценки
    4. Современные тестовые батареи и факторные модели
  2. Теоретические основы IQ
    1. Психометрика и g‑фактор
    2. Многофакторные модели и альтернативные подходы
  3. Критика и ограничения
    1. Культурные и социально-экономические предвзятости
    2. Узкий охват традиционных заданий
    3. Решения с высокими ставками и социальное воздействие
    4. Угроза стереотипов и самоисполняющиеся пророчества
  4. Альтернативные оценки и более широкие концепции
    1. Инструменты эмоционального интеллекта (EQ)
    2. Инструменты, вдохновленные теорией множественных интеллектов
    3. Динамическая оценка и процессно-ориентированные подходы
    4. Культурно-нейтральные и невербальные тесты
  5. Устранение культурных предвзятостей и инклюзивность
    1. Стандарты и руководства по справедливости
    2. Практики адаптации и перевода
    3. Вклад сообщества и совместный дизайн
  6. Взгляд в будущее: интегративные рамки
  7. Заключение

1. Происхождение и эволюция тестирования IQ

Хотя современные тесты IQ стали повсеместными, их происхождение насчитывает чуть более века и связано с педагогами, стремившимися выявить учеников, нуждающихся в специализированном обучении. Из этой благой цели возникло сложное наследие стандартизированной оценки, влияющее на все — от распределения в школы до иммиграционной политики и отбора в армию.

1.1 Шкала Бине–Симона: выявление учащихся «группы риска»

В 1905 году французские психологи Альфред Бине и Теодор Симон создали тест, чтобы помочь школам выявлять детей, которым может потребоваться дополнительная поддержка. Их задания оценивали внимание, память и решение проблем. Критически важно, что Бине предупреждал, что интеллект не является фиксированной, врожденной чертой, и опасался неправильного использования шкалы для ярлыков или дискриминации.1 Тем не менее, его мера проложила путь к идее стандартизированного «интеллектуального уровня».

1.2 Stanford–Binet и становление концепции IQ

Вскоре после этого Льюис Терман из Стэнфордского университета адаптировал шкалу Бине–Симона для американских детей, введя термин коэффициент интеллекта (IQ) и стандартизируя баллы с средним значением 100 и стандартным отклонением около 16.2 Тест Термена Stanford–Binet вскоре стал золотым стандартом в школах США. Однако Терман также поддерживал евгенические идеи и утверждал, что IQ отражает стабильные, наследуемые способности — интерпретацию, против которой сам Бине предупреждал.

1.3 Шкалы Векслера: расширение оценки

В середине XX века Дэвид Векслер разработал многоаспектные шкалы интеллекта для детей (WISC) и взрослых (WAIS), введя перформанс-подтесты (например, конструирование из блоков, завершение картинок) наряду с вербальными. Векслер определил интеллект как «глобальную способность человека целенаправленно действовать, рационально мыслить и эффективно взаимодействовать с окружающей средой», немного выходя за рамки чисто академических навыков.3

1.4 Современные тестовые батареи и факторные модели

Современные IQ-тесты, включая пересмотренные издания Векслера и другие, такие как Woodcock–Johnson или Прогрессивные матрицы Равена, часто опираются на факторно-аналитические модели (например, теорию Кэттелла–Хорна–Кэрролла), которые разбивают интеллект на широкие области (текучее мышление, кристаллизованные знания, рабочая память, визуально-пространственная обработка и т. д.). Каждая область даёт подсчёт, который входит в составной IQ-балл.4


2. Теоретические основы IQ

IQ-тесты происходят из долгой традиции психометрики — отрасли психологии, которая количественно оценивает умственные черты и способности. Но даже по мере того, как тесты становились более точными, продолжаются споры о том, что именно они измеряют — и что могут упускать.

2.1 Психометрика и g‑фактор

Чарльз Спирмен выявил статистический «g‑фактор», указывающий на то, что люди, хорошо справляющиеся с одной когнитивной задачей (например, словарный запас), как правило, хорошо справляются и с другими (например, пространственные головоломки). Этот «общий интеллект» остаётся влиятельным, объясняя около 40–50% вариаций в результатах тестов.5 IQ-тесты стремятся приблизить g с помощью разнообразных подтестов. Хотя g коррелирует со многими реальными результатами (такими как академические достижения), критики отмечают, что он не учитывает творческие, социальные или практические способности, которые также важны для успеха.

2.2 Многофакторные модели и альтернативные подходы

Помимо g, теоретики множественного интеллекта, такие как Говард Гарднер и Роберт Стернберг, подчеркивают различные формы интеллекта — музыкальный, кинестетический, творческий, практический, эмоциональный и др., которые стандартные тесты часто недооценивают или игнорируют.6 Хотя IQ-тесты иногда включают подтесты на «рабочую память» или «скорость обработки», критики считают, что они остаются слишком узкими по сравнению с широтой человеческого познания и решения проблем.


3. Критика и ограничения

Несмотря на широкое использование, IQ-тестирование вызвало повторяющиеся споры о справедливости, валидности и более широких социальных последствиях маркировки определённых групп или отдельных лиц как «умных» или «менее способных».

3.1 Культурные и социально-экономические предубеждения

IQ-тесты часто предполагают знакомство с определённым языком, культурными нормами и стратегиями решения задач, распространёнными в западных, среднеклассных контекстах. Дети из других сред могут показывать худшие результаты не из-за отсутствия когнитивных способностей, а потому что они не знакомы с предпосылками теста или имели меньше доступа к содержанию.7 Социально-экономический статус также может искажать результаты: недоедание, ограниченные школьные ресурсы и стресс из-за небезопасных районов могут снижать баллы, которые затем усиливают системное неравенство.

3.2 Узкий охват традиционных заданий

Большинство заданий IQ-тестов задействуют абстрактное мышление, вербальные знания и визуально-пространственные головоломки. Но успех в реальной жизни может зависеть от практических навыков, межличностных способностей и творческого мышления. Критики утверждают, что сосредоточение на одном числе IQ сводит сложный, многогранный интеллект к короткому списку навыков, которые благоприятствуют академически ориентированным умам.

3.3 Решения с высокими ставками и социальное воздействие

IQ-тесты могут определять участие в программах для одарённых, поступление в колледжи, квалификацию для работы и даже национальную иммиграционную политику (исторически). Некоторые опасаются, что эти баллы чрезмерно используются или неправильно применяются, закрепляя привилегии или дискриминацию. Примеры включают тесты армии США начала XX века, которые подразумевали «низший» статус некоторых этнических групп, предоставляя псевдонаучную поддержку предвзятым иммиграционным квотам.8

3.4 Угроза стереотипа и самоисполняющиеся пророчества

Когда представители стигматизированных групп (например, расовые меньшинства, женщины в математике) боятся подтвердить негативные стереотипы, их тревога может ухудшить результаты теста. Со временем низкие баллы подпитывают больше стигмы в самоисполняющемся цикле, искажая то, что тесты действительно измеряют. Исследования психолога Клода Стилла о «угрозе стереотипа» показывают, как чувство принадлежности или исключения может исказить результаты тестирования.9


4. Альтернативные оценки и более широкие концепции

В ответ на эти критические замечания исследователи и педагоги разработали оценки, которые изучают социально-эмоциональные навыки, творческое мышление и сам процесс обучения, а не просто статический «моментальный» балл.

4.1 Инструменты эмоционального интеллекта (EQ)

Эмоциональный интеллект (EQ) отражает способность воспринимать, понимать и управлять эмоциями у себя и других. В то время как некоторые измерения EQ основаны на самоотчёте (например, Опросник черт эмоционального интеллекта), другие, такие как Тест эмоционального интеллекта Майера–Саловея–Карузо (MSCEIT), используют задания на выполнение для оценки эмпатии, распознавания эмоций и навыков регуляции.10 Хотя они менее валидированы, чем IQ-тесты в некоторых контекстах, они подчёркивают межличностные и аффективные способности, которые стандартные когнитивные батареи не охватывают.

4.2 Инструменты, вдохновлённые теорией множественных интеллектов

Рамки Множественных интеллектов (МИ) Говарда Гарднера вызвали интерес к измерениям музыкальных, кинестетических, межличностных или натуралистических способностей. Хотя немногие основные психометрические тесты строго следуют МИ, некоторые образовательные программы или наблюдательные чек-листы отслеживают результаты в различных областях — танцы, музыка, лидерство в группе, природные активности — чтобы создать более комплексный профиль сильных сторон учащихся.6

4.3 Динамическая оценка и процессно-ориентированные подходы

Динамическая оценка (ДА), основанная на концепции «зоны ближайшего развития» Льва Выготского, оценивает, как человек учится с помощью направляющей поддержки, а не проверяет уже имеющиеся знания. Экзаменатор предоставляет подсказки или поддержку, чтобы увидеть, как обучающийся адаптируется. Этот метод, особенно используемый в языковых или читательских интервенциях, фокусируется на потенциале обучения, а не на статических результатах, и может уменьшить культурные или языковые недостатки.11

4.4 Культурно-нейтральные и невербальные тесты

«Культурно-нейтральные» тесты, такие как Прогрессивные матрицы Равена или , в основном основаны на невербальных, абстрактных задачах на распознавание паттернов, чтобы минимизировать языковой или культурный контент. Хотя они могут быть полезными инструментами скрининга, они остаются несовершенными: даже абстрактные визуальные образы могут содержать культурные предположения (например, знакомство с определёнными формами или форматами головоломок). Тем не менее, они часто показывают меньшие различия между группами с разным происхождением.12


5. Решение вопросов культурной предвзятости и инклюзивности

5.1 Стандарты и руководства по справедливости

Профессиональные ассоциации, такие как Американская психологическая ассоциация, издают руководства для обеспечения справедливости, требуя от издателей тестов подтверждать валидность инструментов в различных группах и минимизировать «дифференциальное функционирование элементов».13 Психометрики исследуют, не ставят ли вопросы систематически в невыгодное положение какую-либо подгруппу, корректируя или удаляя предвзятые вопросы.

5.2 Практики адаптации и перевода

Перевод теста с английского на испанский, например, включает не только замену слов. Тонкая адаптация учитывает культурные ссылки, идиомы и контекст. Подтверждение того, что тест измеряет одни и те же конструкторы в разных популяциях, имеет решающее значение для валидности.

5.3 Вклад сообщества и совместное проектирование

Растущее движение выступает за «совместное проектирование» инструментов оценки с участием заинтересованных сторон сообщества — учителей, родителей, культурных лидеров — чтобы обеспечить соответствие тестов местным ценностям, диалектам и определениям когнитивной компетентности. Этот партисипативный подход может повысить релевантность и снизить навязывание сверху стандартизированных западных норм.


6. Взгляд в будущее: интегративные рамки

Учитывая напряженность между практичностью и предсказательной силой тестов IQ с одной стороны и их культурными ограничениями и узкой направленностью с другой, многие эксперты сейчас призывают к плюралистическим подходам. Например, студент может пройти общий когнитивный тест для определения базовой академической готовности, а также оценки EQ или совместного решения проблем для более полного понимания социальной и эмоциональной компетентности. Школы также могут включать динамическую оценку и оценку на основе портфолио для более тонкой картины прогресса в обучении.

Некоторые крупномасштабные проекты, такие как глобальная оценка OECD’s PISA, начали экспериментировать с упражнениями по совместному решению проблем, которые отслеживают не только конечный ответ, но и то, как учащиеся выполняют задачи в командах. Технологические платформы могут записывать данные о процессе в реальном времени, показывая, как учащиеся подходят к решению задач шаг за шагом. Хотя эти инновации еще находятся в стадии развития, они намекают на будущее, в котором стандартизированное тестирование выйдет за рамки единого числового показателя IQ, охватывая многослойную сложность человеческого мышления.


7. Заключение

Тесты IQ, изначально созданные для выявления детей, нуждающихся в академической поддержке, превратились в мощные — и иногда спорные — инструменты, формирующие образовательные, профессиональные и общественные результаты. Их основное преимущество заключается в надежности и сильной корреляции с успеваемостью в школе, но их ограничения также значительны: культурные предвзятости, риск неправильного использования и, возможно, ограниченный взгляд на когнитивные способности, который маргинализирует роль творчества, сотрудничества, практических навыков и эмоциональной осведомленности. Усилия по разработке более инклюзивных и целостных мер, будь то тесты, свободные от культурных предубеждений, оценки EQ или динамические, ориентированные на процесс подходы, стремятся усовершенствовать способы оценки разнообразных способностей, составляющих «интеллект».

По мере того как мировое сообщество становится все более взаимосвязанным, растет потребность в контекстно-чувствительных и культурно осведомленных оценках. Будущее измерения интеллекта, вероятно, объединит психометрическую строгость с более широкими представлениями о том, что значит быть умным, культурно грамотным, эмоционально настроенным и адаптивным в быстро меняющемся мире. Понимание как сильных сторон, так и ограничений существующих тестов IQ является важным шагом на этом пути — обеспечивая, что мы измеряем не только то, что легко поддается количественной оценке, но и то, что действительно важно для человеческого роста, справедливости и коллективного успеха.


Ссылки

  1. Binet, A., & Simon, T. (1905). Новые методы диагностики интеллектуального уровня аномальных. L’Année Psychologique, 11, 191–244.
  2. Terman, L. M. (1916). Измерение интеллекта. Houghton Mifflin.
  3. Wechsler, D. (1958). Измерение и оценка взрослого интеллекта (4-е изд.). Williams & Wilkins.
  4. McGrew, K. S. (2009). Теория CHC и проект человеческих когнитивных способностей. Intelligence, 37, 1–10.
  5. Spearman, C. (1904). «Общий интеллект», объективно определённый и измеренный. American Journal of Psychology, 15, 201–293.
  6. Gardner, H. (1983). Рамки ума: Теория множественных интеллектов. Basic Books.
  7. Helms-Lorenz, M., & van de Vijver, F. J. R. (1995). Когнитивная оценка в образовании в мультикультурных обществах. Educational Psychologist, 30(3), 203–219.
  8. Gould, S. J. (1981). Ошибочные измерения человека. W. W. Norton.
  9. Steele, C. M. (1997). Угроза в воздухе: Как стереотипы формируют интеллектуальную идентичность и результаты. American Psychologist, 52(6), 613–629.
  10. Mayer, J. D., Caruso, D. R., & Salovey, P. (1999). Эмоциональный интеллект соответствует традиционным стандартам интеллекта. Intelligence, 27(4), 267–298.
  11. Haywood, H. C., & Lidz, C. S. (2007). Динамическая оценка на практике. Cambridge University Press.
  12. Raven, J. C. (1936). Психические тесты, используемые в генетических исследованиях: Результаты родственников на тестах преимущественно образовательного и преимущественно репродуктивного характера. Неопубликованная магистерская диссертация, Лондонский университет.
  13. American Educational Research Association, American Psychological Association, & National Council on Measurement in Education. (2014). Standards for Educational and Psychological Testing. AERA.

Отказ от ответственности: Эта статья предназначена только для информационных целей и не должна рассматриваться как профессиональный психологический или образовательный совет по тестированию. Лицам, обеспокоенным интерпретацией тестов или академическим размещением, следует обратиться к квалифицированным психологам или образовательным специалистам.

 

← Предыдущая статья                    Следующая статья →

 

·        Определения и взгляды на интеллект

·        Анатомия и функции мозга

·        Типы интеллекта

·        Теории интеллекта

·        Нейропластичность и обучение на протяжении всей жизни

·        Когнитивное развитие на протяжении жизни

·        Генетика и окружающая среда в интеллекте

·        Измерение интеллекта

·        Мозговые волны и состояния сознания

·        Когнитивные функции

 

Наверх

      Вернуться к блогу