Ученые выяснили, как работает музыка речи

Ученые из лаборатории профессора Элиши Мозеса в Институте Вейцмана в Израиле раскрывают, что интонация речи — просодия — работает как отдельный язык со своими “словами” и “правилами синтаксиса”. Открытие может кардинально изменить подход к созданию искусственного интеллекта, способного понимать не только слова, но и интонации — то, как мы на самом деле передаем смысл. Работа опубликована в журнале Proceedings of the National Academy of Sciences (PNAS).

Просодия включает в себя такие характеристики, как интонация, громкость, темп и тембр голоса. Эти элементы существовали в общении задолго до появления слов — их используют и шимпанзе, и киты. У людей просодия позволяет выражать настроение, эмоции и отношение к сказанному. Например, короткая пауза или изменение тона может полностью изменить смысл фразы.

Команда исследователей под руководством лингвиста доктора Надава Маталона и нейробиолога доктора Эяля Вайнреба проанализировала огромные массивы аудиозаписей спонтанных разговоров — от телефонных до кухонных бесед. Они выделили сотни повторяющихся мелодических “слов” — коротких звуковых паттернов длительностью около секунды, и начали формировать словарь их значений и функций.

“Мы обнаружили, что каждая мелодия может выполнять разные функции — указывать, задает ли человек вопрос или делает утверждение, но при этом обычно передает одно конкретное эмоциональное состояние, например, удивление или одобрение”, — отметил Маталон.

Также ученые выявили простую “грамматику” просодии: определенные мелодии следуют друг за другом по предсказуемым правилам, формируя пары, похожие на короткие предложения, каждое из которых передает новую идею.

Эти данные открывают путь к созданию нового поколения ИИ, способного понимать тонкости человеческой речи и адаптироваться под эмоциональное состояние собеседника.

Ранее ученые придумали способ защитить личную жизнь от “прослушивающих” микрофонов.