Ученые Самарского национального исследовательского университета имени академика С.П. Королева научили нейросеть понимать сценарии падения людей на улице, связанные с резким ухудшением здоровья. В дальнейшем это поможет службам спасения оперативно реагировать на каждый такой случай. Статья опубликована в журнале Applied Sciences.
Распознавание поведения людей с помощью компьютерного зрения – ключевой элемент перспективных систем безопасности. Они могут быть ориентированы не только на предотвращение правонарушений, но и на оказание экстренной медицинской помощи, объяснили авторы исследования. По их словам, им удалось обойти главную трудность нейросетевого подхода к этой задаче – сбор обучающих данных с реальных камер наблюдения.
Одна из наиболее важных задач этого типа, по словам исследователей Самарского университета имени С.П. Королева, состоит в адекватном распознавании падений людей в публичных пространствах, на производстве и в других ситуациях. Как правило, такие инциденты связаны с резким ухудшением самочувствия, поэтому от времени прибытия "скорой" напрямую зависит шанс выживания человека.
Однако, чтобы обучить нейросеть корректному определению таких событий, требуется огромный массив видеозаписей, собрать который естественным путем практически невозможно. Специалисты Самарского университета имени С.П. Королева решили эту проблему, предложив метод генерации обучающих данных с помощью трехмерной среды Unreal Engine 4.
“Мы разработали универсальное средство моделирования сцен падения человека, позволяющее варьировать рост, вес, параметры одежды и окружения. На основе сгенерированных таким образом данных мы обучили сверточную нейросеть на базе Mask-RCNN с возможностью сегментации пикселей по классам, что обеспечивает высокое качество распознавания”, – рассказал старший преподаватель кафедры суперкомпьютеров и общей информатики Самарского университета имени С.П. Королева Денис Жердев.
Испытания подтвердили эффективность системы, успешно определившей 97,6% инцидентов при работе с синтезированными данными и 95% при распознавании реальных видеозаписей с камер наблюдения, рассказали ученые.
“В работе мы учитывали физику конечностей при движении и падении, возможное взаимодействие с окружающими предметами, а также генерировали случайное "поведение" цифрового человека, что повысило реалистичность моделирования”, – отметил Денис Жердев.
Достигнутые результаты, по мнению авторов, будут также полезны при создании продвинутых тренинговых и игровых систем дополненной или виртуальной реальностей, которые учитывают психофизическое состояние пользователя. Исследования проводились совместно со специалистами Самарского государственного медицинского университета.
Источник: ria.ru