«Мы впервые предложили математически обоснованный и экспериментально проверенный метод оценки сложности текстов на русском языке. Он поможет повысить качество образования и уровень обучения в России и ускорит ее продвижение в международных рейтингах», – отмечает Валерий Соловьев, профессор Казанского федерального университета.
Соловьев и его коллеги расширили возможности искусственного разума, создав систему машинного обучения, способную оценивать удобочитаемость и сложность текста для определенной категории публики не хуже, чем это делает человек.
Система российских ученых учитывает не только количество слов в предложениях и слогов в словах, но и гораздо больше различных особенностей текста – как много глаголов содержит текст, доля слов в именительном и родительном падеже, пропорции различных частей речи и многие другие факторы, которые так или иначе влияют на удобочитаемость.
Для подобных экспериментов ученые выбрали учебники по обществознанию и социологии, так как они почти не содержат в себе схем, формул, карт и других нетекстовых форм подачи информации, и активно используются школьниками сегодня при подготовке к ЕГЭ. Уровень их удобочитаемости, соответственно, будет напрямую влиять на качество сдачи экзаменов и то, какие знания смогут усвоить их читатели.
Удалив из этих текстов цитаты из конституции и прочие сложные фразы, не имеющие отношения к творчеству авторов этих учебников, ученые использовали эти пособия в качестве материала для тренировки их системы машинного обучения. Это позволило Соловьеву и его коллегам подготовить ИИ, способный очень точно оценивать удобочитаемость текста.
Данная система, как отмечают исследователи, позволит не только подготовить более понятные и доступные учебники для школьников, но и создать качественные пособия для иностранцев, желающих выучить русский язык. Для них уровень удобочитаемости особенно критичен, так как они знают далеко не все слова, речевые обороты и синтаксические конструкции.