Ученые из России и других стран представили новый алгоритм, который использует нейронную сеть для оценки степени неупорядоченности в данных и помогает классифицировать данные с помощью машинного обучения. В качестве примера ученые применили свой алгоритм к электроэнцефалограммам здоровых людей и пациентов с болезнью Альцгеймера и смогли отличить их с точностью более 70%. Работа, поддержанная Российским научным фондом, опубликована в журнале Algorithms.
Для анализа данных из разных областей науки и практики часто используется понятие энтропии, которое характеризует степень хаоса, беспорядка и неопределенности в данных. Чем выше энтропия, тем сложнее предсказать поведение системы или события. Существует много способов вычисления энтропии, однако они не всегда точны и устойчивы к помехам. Поэтому ученые разработали новый метод, который использует нейронную сеть для определения специального типа энтропии – энтропии NNetEn (Neural Network Entropy – энтропия на нейронной сети).
Нейронная сеть обучается на временных рядах – последовательностях чисел или случайных величин, которые меняются во времени. В качестве обучающих данных ученые использовали базу данных MNIST, состоящую из рукописных цифр от 0 до 9. Нейронная сеть преобразовывала цифры во временные ряды и вычисляла их энтропию NNetEn. Затем ученые применяли свой алгоритм к другим типам данных, например, к электроэнцефалограммам.
Электроэнцефалограмма (ЭЭГ) – это запись электрической активности мозга, которая может служить диагностическим инструментом для разных заболеваний. Одно из таких заболеваний – болезнь Альцгеймера, которая приводит к постепенной потере памяти и когнитивных функций. Ученые взяли готовую базу данных 65 пациентов, 29 из которых были здоровыми, а 36 – с болезнью Альцгеймера. Задача нейронной сети была разделить эти две группы по величине энтропии NNetEn.
Оказалось, что одной энтропии NNetEn недостаточно для точной классификации, поэтому ученые использовали комбинацию разных типов энтропий, которые по-разному реагируют на хаотичность данных. Так, при добавлении к энтропии NNetEn другой энтропии, например, примерной, приблизительной, перестановочной или фуззи энтропии, точность классификации повышалась до 73%. Это означает, что новая энтропия NNetEn дает синергетический эффект в сочетании с другими энтропиями и может быть полезна для выявления ранних признаков болезни Альцгеймера.
Ученые отмечают, что их метод может применяться не только к ЭЭГ, но и к другим типам данных, которые имеют хаотичную структуру. Например, к аудио сигналам, сейсмическим колебаниям, кардиограммам и графикам валютных пар. Нейронная сеть для вычисления энтропии NNetEn находится в открытом доступе и может быть использована другими исследователями для своих задач.