Стремительное развитие современных информационных технологий зародило новую эпоху, новый этап глобализации – цифровую экономику. Сегодня ИИ (искусственный интеллект) уже становится реальностью и преображает все процессы повседневной жизни. Новая эпоха повлекла за собой широкое использование Больших Данных (Big Data). Цифровая революция меняет все – включая потребительское поведение, социальное взаимодействие и бизнес-модели.
Одни из самых крупных владельцев Больших Данных в мире – это операторы сотовой связи, через чьи биллинговые системы ежедневно проходят потоки информации о миллионах абонентов, и всю эту информацию можно использовать с целью развития бизнеса. Как только бизнес это понимает, Big Data превращается из тренда в необходимость, под которую начинает перестраиваться вся структура компании.
За счет гибкости предложений и контента операторы могут удерживать клиентов и привлекать новых, а аналитика Big Data дает им возможность диагностировать потребности рынка и тем самым развивать существующие и готовить новые продукты, удовлетворяя динамично меняющиеся потребности клиентов.
Лидер рынка сотовой связи страны ООО Azercell Telecom стал первым мобильным оператором, внедрившим в свою деятельность передовые технологии на основе Больших Данных. Тем самым компания заложила основу рынка Больших Данных, являющегося важным звеном в развитии современных информационных технологий и цифровой экономики в Азербайджане.
Сегодня компания готова делиться со всеми желающими собственным опытом. О том, как лидер сотового рынка страны использует Большие Данные, читайте в нашем интервью с директором департамента Больших Данных и Аналитики, руководителем бизнес-структуры потребительского сегмента Azercell Азадом Гусейновым.
– Интересно, когда и как в Azercell было принято решение начать использовать Big Data?
– Мечта о создании этого департамента зародилась еще 6-7 лет назад. Я понимал, что Большие Данные будут одним из ключевых факторов, способствующих цифровой трансформации нашей компании и откроют перед нами неограниченные возможности. Мысль о том, что, в то время пока мы стоим на месте, технология Big Data в мире стремительно развивается, пробудила желание заняться самообразованием в этой сфере. Так я взял первый курс в Стэнфордском университете. В 2015 году наша компания участвовала «ML competition» в Швеции, и мы смогли занять четвертое место среди 15 операторов, которые в тот момент входили в состав Telia. Эти события дали новый стимул тому, чтобы еще больше расширить свои знания в этой сфере и углубиться в ее изучение.
В марте 2018 года, в преддверии ребрендинга Azercell, меня пригласили в департамент Управления Человеческим Капиталом и сообщили, что в компании открывается структура нового департамента Big Data. Вы просто не представляете мои чувства, особенно после того, как я узнал, что становлюсь директором этого департамента! Это было очень неожиданно и страшно, особенно когда я осознал масштаб предстоящей работы. Я всегда был уверен, что Azercell готов взбудоражить рынок своими инновациями, но и не предполагал, что буду управлять этим «взрывом».
Мы стали пионерами, первыми внедрив технологию Big Data на рынке сотовой связи в Азербайджане. Так как на тот момент в стране рынок Больших Данных только начал формироваться и не было компании, у которой можно было бы перенять опыт работы в этой сфере, мы всем департаментом посетили Turkcell по программе обмена опытом. Отмечу, что Turkcell входит в Топ-5 европейских операторов по внедрению Больших Данных в компании. Практика в этой сфере, реальные проекты, над которыми мы работали на протяжении семи месяцев, буквально перевернули наше понятие о возможностях использования Big Data.
По возвращении в Баку для нашего департамента было организовано экспресс-обучение под руководством одного из ведущих лекторов, специализирующегося на искусственном интеллекте и машинном обучении. Посещая занятия без отрыва от работы, нам удалось пройти этот курс всего в течение одного месяца. И уже после этого, в ноябре 2019 года, мы поняли, что можем стоять на ногах. Была готова новая стратегия и даже дорожная карта до 2022 года. Цель звучала амбициозно – привнести аналитику Больших Данных и искусственный интеллект в Азербайджан.
Начали с построения первой модели. Когда создается модель, ее, безусловно, надо тестировать и проверять на ошибки. Наша первая модель показала высокие результаты. И мы двинулись дальше. Кстати, после общения с другими зарубежными операторами, мы понимали, что это только начало. У них используется более 100 моделей в день, работающих параллельно. Запуск последней модели, разработанной нами, и работу которой вы можете сегодня увидеть в приложении Azercell «Kabinetim», состоялся в начале этого месяца.
– Создание моделей – трудоемкий процесс?
– Создать модель – это самое простое. Самое сложное – это работа с данными. Сначала эти данные надо получить, «очистить» их, проанализировать. Потом по необходимости добавляются новые данные. Вспомните историю с Cambridge Analytica, когда использовалось 4 500 видов данных на одного человека. У нас до Big Data было 80, а сегодня этот показатель в разы больше. И вот выбор необходимых данных занимает больше всего времени. Так что по срокам создание модели занимает от трех до шести месяцев, а может и больше, потому что периодически в случае, если модель не дала желаемого результата, приходится возвращаться в начальный этап разработки. На последнем этапе, если модель срабатывает и дает желаемый результат, она переходит в фазу тестирования. На сегодняшний день мы разработали 30 моделей, но это далеко не предел, потому что мы только начинаем пробовать возможности искусственного интеллекта. Для развития этого направления нужны не столько Большие Данные, в объеме которых мы не испытываем недостатка. Нужны примеры и перспективы использования, а их в Азербайджане пока еще очень мало. Но страна развивается и искусственный интеллект будет использоваться все больше и больше.
У нас на создание Big Data ушло порядка 7-8 месяцев, итогом чего стало появление Data Lake – Озера Данных, куда мы сливаем все свои данные и откуда извлекаем их. Если раньше мы делали выборку по числу наших абонентов, то сегодня можем извлекать 180-230 миллионов строк данных.
– А как обстоит ситуация с кадрами на рынке? Ведь с развитием проектов и появлением новых моделей департамент тоже должен расти.
– В нашей стране эта сфера только начала развиваться. Да, многие кандидаты прошли соответствующие курсы. Они неплохо развивают теоретические знания, но на практике это совсем другое. Ощущается нехватка опытных кадров в области Больших Данных. Мы брали на работу тех, кто больше всего подходит по профилю, и переучивали. И хочу сказать, что спрос на наших сотрудников после такого обучения есть во всем мире.
На протяжении своей деятельности наша компания всегда уделяла особое внимание развитию молодежи, вносила свой вклад в подготовку квалифицированных кадров, в частности, в области информационных технологий. С чувством большой гордости хотел бы поделиться с вами еще одной новостью. В рамках Azercell Академии мы решили создать школу Big Data. Сегодня, после двух лет упорной работы, мы можем способствовать профессиональному развитию молодых кадров в этой области. Далее будем расширять и развивать этот проект.
– Вы затронули очень интересную тему. Стране нужны молодые специалисты в этой области. Как еще Azercell поощряет их развитие?
– Расскажу о планах на постпандемийный период. Мы планируем провести в Баку большую конференцию на тему Big Data. Пригласить всех своих знакомых в этой области из Европы. И у нас обязательно будет хакатон. У Azercell очень много интересных данных, с которыми будет не менее интересно работать. Членами жюри станут известные специалисты в сфере Big Data из Европы и Азии, с которыми мы за 2 года работы наладили прекрасные контакты. Формат обоих мероприятий не позволяет провести их в онлайн-режиме, а в случае с хакатоном также требуется и тесная работа членов команд. Участники хакатона предварительно пройдут у нас обучение, чтобы это было на самом деле очень интересно. Для реализации этих идей мы ждем любой возможности, которая появится после открытия границ и спада пандемии.
– Как работа вашего департамента сказывается на деятельности Azercell?
– Вы знаете в чем ценность нашей Big Data? Столько данных, сколько есть у оператора, нет у других компаний. Это дает нам преимущество в проведении более глубокого анализа. И мы планируем использовать все эти возможности. Но самое важное в Big Data – это возможность принимать решения в самые короткие сроки, а именно в режиме реального времени. Если раньше мы получали результаты текущего дня только на следующий день, то сегодня этот инструмент дает возможность следить за любыми данными компании в режиме реального времени. Это бесценно, так как позволяет не только динамично реагировать на меняющуюся на рынке ситуацию, но и моментально давать рекомендации.
Мониторинг деятельности компании сегодня осуществляется через информационные панели в режиме oнлайн. Решения тоже принимаются здесь, потому что видна информация по трафику, по продуктам и массе других деталей, без которых невозможна жизнь мобильного оператора. Благодаря Big Data мы также находим моменты, которые помогают решать вопросы с оптимизацией продуктов, выбирать правильные сегменты среди абонентских групп для их позиционирования. Данные, получаемые с помощью Big Data, служат на благо не только компании, но и клиента, так как позволяют использовать индивидуальный подход. Чем лучше компания знает свою целевую аудиторию, тем более выгодное предложение она может подготовить или запустить для них индивидуальную программу лояльности. Сегодня мы используем Big Data при создании любого продукта Azercell.
– Жалеете о каких-то данных, которые были утеряны из-за того, что их просто не собирали раньше?
– Если взять любой момент в истории Azercell, он всегда был самым лучшим именно в тот период времени. И даже если сегодня нам понадобятся данные 2010 года, мы в состоянии их извлечь, ведь они хранились всегда. Я могу вам привести данные, например, по SMS-кампании 2006 года. Но со временем хранить такие объемы информации на серверах стало невыгодно, и они просто архивируются. Сейчас мы храним на серверах информацию за последние год-полтора, но в общем доступе в виде архивов находятся данные за 3 года. Могли бы и больше, но обычно в компании приходят запросы на данные двухлетней давности, не больше.
– Вы сказали, что готовитесь перейти к использованию искусственного интеллекта. Где и как абоненты смогут это почувствовать?
– Сейчас мы занимаемся внедрением ИИ на уровне одного из наших департаментов. Все это пока еще находится на стадии разработки, но я надеюсь получить первичные результаты в I квартале 2022 года. Хочу отметить, что мы не прибегаем к помощи экспатов и всей разработкой занимаемся непосредственно в компании. Но когда мы это сделаем, это будет настоящий прорыв. Присутствие искусственного интеллекта будет ощущаться и в вопросах оптимизации задач, а в перспективе он появится и в нашем чат-боте Telegram. Не исключено, что это будет система Speech To Text или Text To Speech. Очень хотелось бы использовать возможности искусственного интеллекта для создания первого голосового помощника, который будет понимать азербайджанскую речь. Для того чтобы в будущем наши пользователи обращались к национальной Siri или Алисе, нам нужно основательно потрудиться.
– Планов у вас действительно очень много. Какими еще вы можете с нами поделиться?
– Наша главная задача – успеть за динамично меняющимися потребностями. Сегодня именно Большие Данные позволяя предугадывать и осуществлять то, что раньше казалось невозможным, дают преимущество и повышают конкурентоспособность.
Естественно, мы будем увеличивать количество моделей, созданных на основе Big Data. Модель может строиться на основе месячных данных. Это самая легкая модель. Там данных ровно столько, сколько абонентов. Благодаря нашим инженерам Big Data, мы уже перешли на ежедневные модели и не боимся такого массива данных. Data Lake позволяет их хранить и быстро обрабатывать. Конечно, их нужно более тщательно отбирать и избавляться от ненужных. Но сегодня у нас в планах переход на событийные модели. Как я уже говорил, мы нацелены на работу в режиме реального времени. Big Data и искусственный интеллект открывают широкие возможности, которые мы бы хотели использовать во благо общества, а именно предложить решения, упрощающие жизнь наших клиентов.
Говоря о долгосрочных планах, мы бы хотели попытаться интегрироваться в сферу здравоохранения, но это желание пока находится на уровне продумывания возможностей. Например, сегодня в мире практикуется следующая модель Big Data. По результатам МРТ или КТ модель определяет, положительный или отрицательный у пациента тест на COVID-19. Далее абоненту приходят уведомления с рекомендациями о дальнейших действиях. Эта модель существенно облегчила работу врачей во время пандемии в Турции. На данный момент мы, к сожалению, просто физически не успели запустить подобную практику в Азербайджане.
– А как технология Big Data может сказаться на повышении эффективности управления базовыми станциями?
– С помощью предиктивной аналитики можно выяснить, когда той или иной станции понадобится обслуживание в зависимости от физической неисправности, износа оборудования, наплыва абонентов и т.д. Один такой объект каждую миллисекунду генерирует огромные массивы данных, на основе которых можно сделать великолепную модель. Но, учитывая затраты на создание модели, пока нам целесообразнее отправить в сторону такой станции бригаду техников. В перспективе, с расширением и модернизацией сети, мы можем прийти и к разработке таких моделей.
– Насколько точны данные, полученные с помощью этой технологии?
– Исключения есть всегда и в каждом сегменте. Но в рамках этих ошибок, которых, кстати, бывает не так уж и много, можно двигаться вперед. Например, в здравоохранении процент ошибок на уровне 1% – это слишком много. В телекоммуникационном секторе бывает по-разному. Где-то может быть и 40%, что является вполне приемлемым вариантом. А есть модели, где эта цифра составляет 30%. У нас от модели к модели этот показатель тоже варьируется. Минимальный процент ошибок в наших моделях – 12%.
– Расскажите о рабочем процессе вашего департамента. Как вы управляете терабайтами информации?
– Big Data в Azercell включает пять направлений. Первое – это сбор «сырых» данных из всевозможных источников – от базовых станций до абонентов. Далее к обработке данных приступают инженеры, которые избавляются от неструктурированных данных, отсеивая ненужную информацию и делая эти данные структурированными. На следующем этапе данные попадают в Business Intelligence. А это наши информационные панели, аналитика, разработка новых продуктов и предложений. На четвертом этапе данные попадают уже к группе Data Scientist. Эти люди занимаются машинным обучением и непосредственно создают модели. И последнее новое направление, над созданием которого мы сейчас работаем, – искусственный интеллект, куда входят такие элементы, как Speech To Text, Text To Speech, Face Recognition и другие.
Хочу немного остановиться на таком направлении, как Business Intelligence. Раньше в Azercell это направление было децентрализованным и у каждого департамента оно было собственным. С созданием департамента Big Data мы стали центром BI компании, куда может обратиться любой сотрудник. С помощью программного обеспечения Jira и разработанного нами интерфейса решаются запросы любого департамента. И после централизации BI, если ранее у нас в месяц было около 50 запросов, их число возросло до 300-350. Сейчас у нас около 20 оптимизированных панелей управления, которые в состоянии решить их все. Например, если вам нужно получить информацию о роуминге, эти данные выгружаются в удобном для анализа формате. После такой оптимизации число запросов перестало увеличиваться. Но в любом случае нам есть куда расти и на стороне BI.
– Кстати, ваш департамент недавно прошел аудиторскую проверку. Как она завершилась?
– К услугам аудиторов мы решили обратиться сами в 2020 году. По итогам проверки получили 4 по пятибалльной шкале, что является достаточно хорошим результатом. Техническое исполнение и уровень обеспечения безопасности данных были высоко оценены, а основные советы были по обеспечению документирования всех происходивших процессов. Когда мы выйдем на следующий уровень, то обязательно пройдем аудит еще раз. И мне даже интереснее, если аудиторы открыто указывают на совершенные ошибки, потому что по-другому развиваться просто невозможно. Нельзя просто на словах оперировать термином Big Data. Нужно на деле показать возможности использования этой технологии в компании!