Science for Education Today, 2025, Т. 15, № 4, С. 246–272
УДК: 
316.77+808.5+001.891.57+371.279

Проблема обеспечения аутентичности и надежности LSP-тестов в рамках интегративной модели валидизации: тематический обзор

Балыгина Е. А. 1 (Москва, Россия), Яровикова Ю. В. 1 (Москва, Россия), Гузова А. В. 1 (Москва, Россия)
1 Московский государственный психолого-педагогический университет
Аннотация: 

Проблема и цель. В статье представлен обзор научной литературы по проблеме обеспечения аутентичности и надежности LSP-тестов (Language for Specific Purposes) в рамках интегративной модели валидизации. Исследуются актуальные вопросы валидизации LSP-тестов, выявляются основные проблемы, связанные с их низкой валидностью, подчеркивается важность интеграции требований профессионального контекста в процесс тестирования. Цель статьи заключается в систематизации теоретико-методологических оснований интегративной модели валидизации и выявлении условий преодоления ключевого противоречия между аутентичностью и надежностью LSP-тестов.
Методология. Исследование носит обзорный характер и основано на систематическом анализе отечественных и зарубежных работ, посвященных валидизации LSP-тестов. Использованы методы сравнительно-сопоставительного анализа, синтеза и обобщения данных.
Результаты. Основные результаты заключаются в следующем: установлены основные принципы интегративного подхода к валидизации LSP-тестов (контекстуальная детерминированность валидности, социально обусловленный характер тестового конструкта и непрерывность процесса валидизации); выявлено ключевое преимущество интегративного подхода, заключающееся в гибкости и адаптивности, позволяющее учитывать динамику профессиональной среды; определены ограничения, такие как неопределенность конструкта, субъективность оценивания и высокая ресурсоемкость. Для преодоления противоречия между аутентичностью и надежностью предложены методологические условия: четкое определение границ конструкта, разработка эмпирически обоснованных критериев оценки и стандартизация процедуры оценивания с учетом требования адаптивности к профессиональному контексту. Авторы отмечают, что унификация эмпирически подтвержденной системы дескрипторов в рамках контекстно-ориентированного подхода создает условия для преодоления противоречия между требованиями аутентичности и стабильности измерений.
Заключение. В заключении делается вывод о том, что интегративная модель валидизации предоставляет теоретико-методологическую основу для создания LSP-тестов, которые сочетают высокую надежность с аутентичностью. Это открывает новые перспективы для разработки инструментов оценки, соответствующих современным требованиям профессиональной коммуникации.

Ключевые слова: 

LSP-тесты (Language for Specific Purposes); интегративная модель валидизации; аутентичность тестирования; надежность языковых тестов; стандартизация критериев оценки; профессионально ориентированная коммуникация; измерительные инструменты; методология языкового тестирования

Библиографическая ссылка:
Балыгина Е. А., Яровикова Ю. В., Гузова А. В. Проблема обеспечения аутентичности и надежности LSP-тестов в рамках интегративной модели валидизации: тематический обзор // Science for Education Today. – 2025. – № 4. – С. 246–272. DOI: http://dx.doi.org/10.15293/2658-6762.2504.11
Список литературы: 
  1. Whyte S. Revisiting Communicative Competence in the Teaching and Assessment of Language for Specific Purposes // Language Education & Assessment. – 2019. – Vol. 2 (1). – P. 1–19. DOI: https://doi.org/10.29140/lea.v2n1.33.hal-02120612
  2. Бондарева Е. В., Польшина Ю. А., Сорокина В. В. Основные свойства теста в терминосистемах языкового тестирования и оценивания в английском, русском и испанском языках // Вестник Самарского технического университета. Серия: Психолого-педагогические науки. – 2020. – № 1. – С. 20–36. URL: https://www.elibrary.ru/item.asp?id=42668685 DOI: http://doi.org/10.17673/vsgtu-pps.2020.1.2
  3. Inozemtseva K. M., Morozova E. V., Kolesnikov I. M. Assessment of ESP students’ learning outcomes in a digital learning environment // RUDN journal of informatization in education. – 2022. – № 19 (4). – С. 300–311. URL: https://www.elibrary.ru/item.asp?id=50144997 DOI: http://doi.org/10.22363/2312-8631-2022-19-4-300-311
  4. Khosravani M., Rostamian M., Ashraf H. A structural equation modeling of English tests’ social and educational consequences: exploring target, leverage, risk, and critical variables // Language Testing in Asia. – 2022. – Vol. 12 (1). – P. URL: https://languagetestingasia.springeropen.com/articles/10.1186/s40468-022-00177-2  DOI: https://doi.org/10.1186/s40468-022-00177-2
  5. Ван Ц. Валидность тестовых заданий «Гаокао» на понимание русскоязычного текста // Ярославский педагогический вестник. – 2024. – № 4. – С. 51–61. URL: https://elibrary.ru/ILLDUX DOI: http://dx.doi.org/10.20323/1813-145X-20244-139-51
  6. Knoch U., Chapelle C. Validation of rating processes within an argument-based framework // Language Testing. – 2017. – Vol. 35 (4). – P. 477–499. DOI: https://doi.org/10.1177/0265532217710049
  7. Chapelle C. A. An introduction to language testing’s first virtual special issue: Investigating consequences of language test use // Language Testing. – 2020. – Vol. 37 (4). – P. 638–645. DOI: https://doi.org/10.1177/0265532220928533
  8. Eckes T. Operational rater types in writing assessment: Linking rater cognition to rater behavior // Language Assessment Quarterly An International Journal. – 2012. – Vol. 9 (3). – P. 270–292. DOI: http://dx.doi.org/10.1080/15434303.2011.649381
  9. Gauthier G., St-Ong C., Tavares W. Rater cognition: Review and integration of research findings // Medical Education. – 2016. – Vol. 50 (5). – P. 511–522. DOI: https://doi.org/10.1111/medu.12973

10. Luo L. Pursuing Authenticity in ESP Testing – the need for interdisciplinary collaboration // The Journal of Teaching English for Specific and Academic Purposes. – 2019. – Vol. 7 (2). – P. 159–169. DOI: https://doi.org/10.22190/JTESAP1902159L

11. Giraldo F. Language Assessment Practices and Beliefs: Implications for Language Assessment Literacy. – 2019. – Vol. 26 (1). – P. 35–61. DOI: https://doi.org/10.19183/how.26.1.481

12. Dong M. Structural relationship between learners’ perceptions of a test, learning practices, and learning outcomes: A study on the washback mechanism of a high-stakes test // Studies in Educational Evaluation. – 2020. – Vol. 64. – P. 100824. URL: https://www.sci-hub.ru/10.1016/j.stueduc.2019.100824 DOI: https://doi.org/10.1016/j.stueduc.2019.100824

13. Davies A. The logic of testing languages for specific purposes // Language Testing. – 2001. – Vol. 18 (2). – P. 133–147. DOI: http://dx.doi.org/10.1177/026553220101800202

14. Kane M. T. Explicating validity // Assessment in Education: Principles, Policy and Practice. – 2015. – Vol. 23 (2). – P. 198–211. DOI: http://doi.org/10.1080/0969594X.2015.1060192

15. Shepard L. A. Evaluating test validity: reprise and progress // Assessment in Education: Principles, Policy & Practice. – 2016. – Vol. 23 (2). – P. 268–280. DOI: http://dx.doi.org/10.1080/0969594X.2016.1141168

16. Green P., Flaro L. Results from three Performance Validity Tests in children with intellectual disability // Applied Neuropsychology. Child. – 2016. – Vol. 5 (1). – P. 25–34. DOI: http://doi.org/10.1080/21622965.2014.935378

17. Lu W., Zeng Y., Chen J. Proposing a Framework of Validity Evidence for a Score Report // Creative Education. – 2021. – Vol. 12 (8). – P. 1912–1925. DOI: http://doi.org/10.4236/ce.2021.128146

18. Варакута А. А., Шеломенцев П. Ю., Андриенко Е. В. Определение различных типов системы оценки и оценочных процедур в контексте исторического развития // Science for Education Today. – 2021. – № 6. – С. 121–141. URL: https://www.elibrary.ru/item.asp?id=47447641 DOI: http://dx.doi.org/10.15293/2658-6762.2106.07

19. Palmour L. Assessing speaking through multimodal oral presentations: The case of construct underrepresentation in EAP contexts // Language Testing. – 2023. – Vol. 41(1). – P. 9 –34. DOI: https://doi.org/10.1177/02655322231183077

20. Pill J., McNamara T. How much is enough? Involving occupational experts in setting standards on a specific-purpose language test for health professionals // Language testing. – 2016. – Vol. 33 (2). – P. 217–234. DOI: https://doi.org/10.1177/0265532215607402

21. Elder C., McNamara T., Kim H., Pill J., Sato T. Interrogating the construct of communicative competence in language assessment contexts: What the non-language specialist can tell us // Language and Communication. – 2017. – Vol. 57. – P. 14–21. DOI: https://doi.org/10.1016/j.langcom.2016.12.005

22. Wu W. M., Stansfield C. W. Towards authenticity of task in test development // Language Testing. – 2001. – Vol. 18 (2). – P. 187–206. DOI: https://doi.org/10.1177/026553220101800205

23. Deygers B., Van Gorp K., Demeester T. The B2 Level and the Dream of a Common Standard // Language Assessment Quarterly. – 2018. – Vol. 15 (1). – P. 44–58. DOI: https://doi.org/10.1080/15434303.2017.1421955

24. Hulstijn J. H. The shaky ground beneath the CEFR: Quantitative and qualitative dimensions of language proficiency // The Modern Language Journal. – 2007. – Vol. 91 (4). – P. 663–667. DOI: https://doi.org/10.1111/j.1540-4781.2007.00627_5.x

25. Hulstijn J. H. The Common European Framework of Reference for Languages: A challenge for applied linguistics // ITL-International Journal of Applied Linguistics. – 2014. – Vol. 165 (1). – P. 3–18. DOI: https://doi.org/10.1075/itl.165.1.01hul

26.  Xi X.  Validating TOEFL® iBT Speaking and Setting Score Requirements for ITA Screening // Language Assessment Quarterly An International Journal. – 2007. – Vol. 4 (4). – P. 318–351. DOI: https://doi.org/10.1080/15434300701462796

Дата публикации 31.08.2025