Интервью с Ион Морару, руководителем дирекции аналитических систем и баз данных в maib
Ион, добрый день. Думаю, вам не привыкать, что для большинства людей «дирекция аналитических систем и баз данных», особенно с появлением искусственного интеллекта, это как загадочный «черный ящик», где что-то происходит, но мало кто понимает, что и как?
Не спорю. Так часто бывает.
Если бы вы выступали перед школьниками младших классов, как бы вы объяснили им, чем занимаетесь?
Всегда лучше, если вы можете представить информацию наглядно. Я бы предложил всё, что есть в классе, стулья, парты, тетради, ручки, учебники – собрать для начала в один угол и повесить сверху плакат: «Это – данные». Следующий шаг был бы в том, чтобы попытаться с ними что-то делать, а, для начала, понять для какой цели создана каждая вещь. Мы бы стали упорядочивать хаос и изучать его. Например – ручка. Учитывая ее главное назначение, нам будет важно понять, сколько могут писать все ручки, собранные в классе, на сколько страниц хватит чернил, какие ручки самые эффективные, чтобы в будущем покупать для учеников именно такие…
Тогда у меня немного провокационный вопрос. В классе вы предложили собрать в угол ВСЕ предметы. Получается, что как банк вы стремитесь собирать данные тоже обо всём? Хоть о цвете моего свитера?
Между прочим, как аналитик я уверен, что можно найти взаимосвязь между цветом одежды клиентов и, например, их активностью в получении кредитов или размещении депозитов. Возможно, что и такие данные в будущем будут использоваться в интересах клиентов. Но, конечно, данные с камер наблюдения мы не используем для аналитики. Наши принципы работы максимально корректны в вопросах защиты персональной информации. Поэтому мы собираем данные из открытых источников и из массива информации, созданной самим банком в процессе работы.
У каждого действия есть цель. Какие основные цели преследует сбор данных банком?
Как банк maib, прежде всего, ориентирован на клиента. Изучая данные, мы пытаемся лучше понять нашего клиента. Какой продукт для него более удобный, когда лучше инициировать общение с клиентом по разным темам, например, напомнить о погашении кредита лучше утром или вечером, понять, когда человеку будет удобнее «обработать» это сообщение, в начале рабочего дня или ближе к вечеру. По каким каналам удобнее строить общение, через мобильное приложение, или посредством смс-сообщения.
Получается, что вы отслеживаете десятки, если не сотни параметров. Кто отбирает параметры для накопления в базу данных? По какому принципу?
Для современного этапа бизнеса характерен высокий уровень неопределенности, причем неопределенность только увеличивается со временем, ведь усложняются все окружающие нас системы. Поэтому основополагающим принципом управления базами данных станет стремление по максимуму сохранять данные, даже если сегодня не всегда ясно как эти данные могут быть использованы. Потому что в будущем, возможно, именно наличие тех или иных данных в динамике за ряд лет могут стать конкурентным преимуществом или способом более эффективно выполнить запрос клиента. Поэтому мы строим архитектуру баз данных в концепции Lakehouse. Это позволяет нам хранить данные, назначение которых известно и превращать их в необходимые метрики, а также организовать хранение данных, которые могут потребоваться в будущем.
В базу данных попадают только данные собранные автоматическим образом?
Не только, результаты опроса, который может провести наш колл-центр тоже могут пополнить базу данных.
Получается, что вы все время корректируете архитектуру базы данных, ведь в нее всегда может попасть новая, ранее не поступавшая информация?
Да, мы постоянно корректируем идополняем архитектуру базы данных, чтобы быть готовыми к приему новой информации. Это необходимо, поскольку новые данные могут появляться в любой момент, и наша система должна быть гибкой и масштабируемой. Наша архитектура базы данных построена по принципу Lakehouse, что позволяет нам эффективно интегрировать новые данные и адаптироваться к меняющимся требованиям. Такой подход помогает нам не только сохранять актуальность и полноту данных, но и быстро реагировать на новые запросы и возможности, которые нужны для развития и отвечают нуждам коллег.
Но они никогда не должны нарушать основополагающий принцип – безопасность и защиту персональных данных. Архитектура выстроена так, что, даже внутри банка, сотрудник обрабатывающий данные не знает чьи данные он обрабатывает, доступ организован только в рамках обслуживания клиентов, закрепленных за конкретным менеджером. Внутренние протоколы максимально защищают безопасность персональных данных от вмешательства не только внешнего, но и внутреннего.
Сколько специалистов у вас в дирекции обеспечивают эту работу?
У нас согласованно работают три команды – дата-аналитики, дата-инженеры и дата-сайентисты. Вместе – 12 человек.
12? Успеваете? Не планируете расширение? Это я на тот случай, если интервью, вдруг, поможет вам найти недостающих сотрудников…
Мы действительно в поиске ещё одного дата-сайентиста. Но в остальном мы справляемся с поставленными задачами. Этому помогает и сложившаяся слаженность в работе. Почти 40 процентов команды мы «вырастили» сами. Это был непростой период, но он же увеличил взаимопонимание в команде, привычку делиться знаниями и обмениваться опытом.
А какой лично у вас опыт работы с базами данных?
С 2005 года. Я начал работать с данными, когда процессы аналитики в банках только начинались. Причем получил как опыт автоматизации аналитики, так и бизнес-процессов в банке, поэтому сейчас мне легко общаться со всеми уровнями специалистов, как с техническими, так и с создателями продуктов и операционными работниками.
Я когда-то прочитал фразу, что «в бизнесе не должно быть единицы». В смысле, что важные процессы не могут замыкаться только на одном человеке. Как вы в таком небольшом коллективе справляетесь с этой проблемой?
В первую очередь я начал с самого себя – по максимуму документирую иделюсь своими знаниями и действиями, чтобы команда могла работать какой-то период независимо от меня, либо чтобы мой преемник мог бы разобраться в том, как организована работа. В отношении команды это правило реализуется тем, что мы внедрили процессы по взаимозаменяемости, обмениваемся знаниями, проводим внутренние воркшопы. Это, кстати, помогает и перед началом решения задачи эффективно собраться вместе и обсудить задачу.
Для передачи компетенций я активно участвую в проектах, направленных на привлечение и развитие новых талантов. В частности, благодаря таким инициативам, как Dual Academy, программы стажировок и курсы по аналитике данных, где я выступаю в роли преподавателя, мы стремимся выявлять и развивать потенциал молодых специалистов. Эти мероприятия не только позволяют нам находить будущих ценных профессионалов, но и способствуют укреплению нашей команды новыми выдающимися коллегами. Таким образом, мы поддерживаем динамичную и инновационную организационную культуру, что является ключевым фактором успеха в области анализа данных в maib.
Например, в эти выходные в UTM проходил конкурс по управлению базами данных. Я разрабатывал там тематику потребительских кредитов и, одновременно, выступал в роли председателя жюри конкурса.
Какой фронт работ вы запланировали на 2024 год?
Один из приоритетов – завершить процесс определения основных метрик, например, прибыльность клиента, прибыльность продукта, прибыльность процесса, чтобы менеджмент банка мог строить модели развития на уровне данных, а не предположений.
Хочу больше развивать аспекты в работе связанные с искусственным интеллектом. Мы уже запустили внутренний чат-бот, который автоматически отвечает на многие вопросы, что ускоряет работу сотрудников кол-центра и повышает их эффективность.
Также будем продвигаться в направлении облачных вычислений и инновационной архитектуры баз данных, когда, условно, можно сохранить какие угодно данные без требований к архитектуре, складывать их без видимого порядка, но, при этом, сохранять возможность их эффективной обработки.
Это, как если бы холостяк или ребенок мог бы разбрасывать вещи по всему дому, а они бы моментально находились при необходимости?
Упрощенно говоря – примерно так. Хаос в хранении данных, это ускоряет и упрощает их накопление, но при этом система знает, как их обрабатывать.
Думаю, что в будущем важность данных и сложность их обработки так возрастут, что вам потребуется целая библиотека простых примеров, чтобы объяснить «простым смертным» как это работает.
Задача не усложнять чрезмерно систему, выбирать оптимальные по сложности решения, это тоже один из приоритетов работы как на 2024, так и на последующие годы.