Исследователи из Университета Мичигана, Национального института астрофизики Мексики и Института оптики и электроники используют модели искусственного интеллекта для расшифровки языка собак. Новое исследование, представленное на международной конференции, демонстрирует, как современные ИИ-модели могут помочь людям в понимании животных.
Рада Михалча, директор Лаборатории ИИ Университета Мичигана, подчеркнула значимость этого исследования: “Мы многого не знаем о животных, с которыми делим этот мир. Достижения в области ИИ могут революционизировать наше понимание общения животных”.
Для исследования использовалась передовая модель распознавания речи Wav2Vec2, способная определять эмоции, пол и породу собаки по лаю. Были использованы два разных набора данных для обучения и сравнения: один обучен исключительно на собачьих лаях, другой – на человеческой речи и доработан на лаях.
Модель, предварительно обученная на 1000 часах записей человеческой речи, показала лучшие результаты. После доработки на наборе данных, включающем вокализации 74 собак (42 чихуахуа, 21 французский пудель и 11 шнауцеров), она смогла определить эмоции с точностью 62%, породу – с точностью 62%, пол – с точностью 69%, и конкретную собаку среди группы – с точностью 50%.
Эти результаты превышают показатели модели, обученной только на собачьих лаях, что указывает на то, что звуки и паттерны, выявленные в человеческой речи, могут стать основой для понимания животных.
Предыдущие исследования показывают, что звуки, издаваемые обезьянами и луговыми собачками (грызунами из семейства беличьих), можно предсказать по контексту. Исследователи предполагают, что вокализация собак также тесно связана с контекстом.
В этом исследовании к эмоциям собак были отнесены агрессивный лай, обычный лай, негативные визги и ворчание. Несмотря на то, что собаки испытывают гораздо больше эмоций, именно эти звуки были представлены в наборе данных.
Михалча отметила: “Используя модели обработки речи, первоначально обученные на человеческой речи, наше исследование открывает новое окно в том, как можно использовать уже созданные технологии для понимания нюансов собачьих лаяний”.