Международная группа ученых из Мичиганского университета в США и Национального института астрофизики, оптики и электроники в Мексике разработала инструмент на основе искусственного интеллекта (ИИ), способный интерпретировать значение звуков, которые издают собаки. Исследование опубликовано на портале нерецензированных научных материалов arXiv.
Результаты проекта представили на конференции по компьютерной лингвистике и языковым ресурсам.
Исследователи собрали набор данных о лае 74 собак. Животные в возрасте от пяти до 84 месяцев со средним возрастом 35 месяцев преимущественно были представлены породами чихуахуа, французскими пуделями и шнауцерами.
Ученые подвергали собак воздействию различных стимулов, призванных вызвать различные типы вокализации. Эти стимулы включали такие ситуации, как присутствие незнакомца, игровое общение, ласковые разговоры владельца и даже имитацию нападения на хозяина. Затем аудиоклипы разделили на короткие фрагменты продолжительностью от 0,3 до пяти секунд и вручную аннотированы в зависимости от контекста.
В основе анализа лежало использование сложной модели искусственного интеллекта, известной как Wav2Vec2, изначально разработанной для распознавания человеческой речи.
Исследователи доработали эту модель с помощью своего набора данных о вокализации собак, исследуя несколько задач. Эти задачи включали в себя идентификацию отдельных собак по их лаю, определение породы собаки на основе ее вокализации, предсказание пола собаки и сопоставление лая с конкретным контекстом.
Модель искусственного интеллекта продемонстрировала способность распознавать отдельных собак по их лаю, достигнув точности в 50%. Также ИИ научился отличать агрессивный лай от обычного.
“Наши результаты показывают, что звуки и модели, полученные из человеческой речи, могут служить основой для анализа и понимания акустических моделей других звуков, таких как вокализация животных”, — отметили авторы исследования.
Ранее ученые назвали лучший способ дрессировки собак.