Система голосового мониторинга Voice Screening Model (VSM) для анализа русскоязычной речи и помощи в диагностике психических заболеваний

Ковриго, А. В.

Voice Screening Model (VSM) for monitoring and analysis of russian speech to assist in the diagnosis of mental disorders

Открыть

564_569.pdf (374.7Kb)

Дата

2025

Автор

Ковриго, А. В.

Metadata

Показать полную информацию

Аннотации

Диагностика психических заболеваний, таких как депрессия и шизофрения, традиционно основана на субъективных методах оценки, что ограничивает раннее выявление и объективный мониторинг состояния пациентов. Голосовые аудиомаркеры – объективные характеристики речи (высота голоса, темп, качество звучания) – отражают изменения психоэмоционального состояния и могут служить инструментом для неинвазивного скрининга. В работе представлена система голосового мониторинга Voice Screening Model (VSM), предназначенная для автоматизированного анализа русскоязычной речи с целью выявления признаков психических расстройств. Система объединяет два подхода: извлечение акустических параметров голоса (высота тона, вариативность, энергия, темп речи, качество голоса) и анализ глубинных речевых характеристик с помощью современных методов искусственного интеллекта. Разработанная система готова к пилотному клиническому тестированию и позволяет создать базу голосовых аудиомаркеров для диагностики депрессии, шизофрении и других психических заболеваний. Предварительные результаты демонстрируют способность системы выявлять отклонения голосовых параметров от нормы с указанием конкретных признаков (повышенная напряженность речи, снижение выразительности, изменение энергетики голоса).

Diagnosis of mental disorders such as depression and schizophrenia has traditionally been based on subjective assessment methods, which limits early detection and objective monitoring of patients’ conditions. Voice biomarkers–objective speech characteristics (pitch, speech rate, quality of phonation)–reflect changes in psycho-emotional status and can serve as a tool for noninvasive screening. This work presents the Voice Screening Model (VSM), a voice monitoring system for automated analysis of Russian-language speech to identify signs of mental disorders. The system combines two approaches: extraction of acoustic voice parameters (pitch, variability, energy, speech rate, voice quality) and the analysis of deep speech features using modern artificial intelligence methods. The developed system is ready for pilot clinical testing and enables the creation of a database of voice audio biomarkers for the diagnosis of depression, schizophrenia, and other mental illnesses. Preliminary results demonstrate the system’s ability to detect deviations of voice parameters from the norm, indicating specific features (increased vocal tension, reduced expressiveness, changes in vocal energy).

Библиографическое описание

Ковриго, А. В. Система голосового мониторинга Voice Screening Model (VSM) для анализа русскоязычной речи и помощи в диагностике психических заболеваний / А. В. Ковриго ; науч. рук. В. Г. Объедков // MedMinsk-2025 : сб. материалов междунар. науч.-практ. конф. студентов и молодых ученых до 35 лет, Минск, 18–19 дек. 2025 г. / М-во здравоохранения Респ. Беларусь, Бел. гос. мед. ун-т ; под ред. С. П. Рубниковича, М. Ю. Ревтовича. – Минск, 2025. – Вып. 2. – С. 564–569.

URI

https://rep.bsmu.by/handle/BSMU/58491

Collections

MedMinsk-2025 [213]
Научные публикации ученых БГМУ. 2025 [4588]