Money AI/ML – машинное обучение и системы искусственного интеллекта в банкинге и финансовых сервисах

Money AI/ML – машинное обучение и системы искусственного интеллекта в банкинге и финансовых сервисах

Данная статья посвящена тематике AI/ML (AI – Artificial Intelligence, ML – Machine Learning) применительно к банкингу и финансовым сервисам, а также общие тенденции и проблематика индустрии. Основной материала стали доклады и панельные дискуссии проходящие на конференции в Октябре 2019 года, Нидерландах, Амстердам, World AI Summit (https://worldsummit.ai/). 

Автор посещал конференцию в 2018 году и после общался с организаторами, где поделился идеей создать отдельный поток и пригласить некоторых экспертов по AI/ML из области финансов на следующую конференцию. К моей большой радости, позже я обнаружил что мое предложение восприняли позитивно и впервые в рамках конференции, отдельным потоком проходил Money AI, который был ориентирован именно на финансовый сектор.

Мероприятие проводилось в здании бывшего индустриального района, а сейчас парка Taets Park расположенного на берегу одного из многочисленных морских каналов города.

Традиционно, саммит нацелен на широкое освещение проблематики и достижений в области искусственного интеллекта и машинного обучения для всех научных и прикладных областей применения. В течении конференции, в разных потоках описывались направления развития и результаты от внедрения абсолютно, казалось бы не связанных областях – от георазведки до медицины, от космоса до молекулярного моделирования. 

Для меня лично было очень значимым аргументом посетить конференцию после выделения темы финансов в отдельный поток. По роду своей деятельности, а также профессиональным обязанностям я активно слежу и изучаю все доступные материалы и технологии по AI/ML относящиеся к финансам. 

Очень часто те материалы которые попадают ко мне в руки носят или очень теоретический характер или покрывают какую либо очень узкую область специализации в области финансов. Например прогнозирование курсов ценных бумаг на бирже. Возможность послушать докладчиков из Visa и Mastercard, а также доклады из ряда крупнейших банков мира позволили увидеть картину немного полнее. Описанные ими сценарии внедрения и полученные результаты дают много пищи для размышлений, а также предостерегают об ошибках которые часто допускаются из за банального отсутствия практического опыта применения. 

Технологии AI/ML достаточно не новое направление, но в области финансов начинает активно применяться впервые, сталкиваясь по пути с рядом препятствий с которыми не сталкиваются прочие компании из нефинансового сектора.

Это и влияние регуляторов и вопросы безопасности, а также, как бы это не удивительно не звучало – вопросы этики. Ниже я постараюсь раскрыть основные тезисы и заключения которые мне удалось кристаллизовать из массы прослушанных докладов.

Я постарался расставить ниже указанные ключевые слова в порядке частоты использования и их значимости с точки зрения докладчиков.

Explainability – Объяснимость. В словаре нет точного перевода этого термина, но суть его заключается в том что применимо к результатам работы AI/ML алгоритмов необходимо иметь способ который позволит перевести на человеко читаемый формат цепочку “умозаключений” алгоритма который в результате привел к одному или другому результату.

Будет справедливо отметить этот термин как ключевой, для многих других докладов, которые не относились к финансам.

Почему это важно? Если слепо доверять результатам выдаваемые машиной не имея возможности проверить их – то легко потерять контроль над ситуацией и начать полагаться на ошибочные данные. В некоторых случаях это грозит жизни и здоровью не только одной персоны но иногда и очень больших социальных групп.

Если машина ставит диагноз и назначает лечение, при неправильном диагнозе существует риск угрозы одному человеку. Когда машина контролирует поведение стрелками на железной дороге – угроза может носить более глобальный масштаб и так далее. Разработчики систем машинного обучения и организации применяющие их в своей деятельности должны иметь возможность в любой момент открыть “черный ящик”,  заглянуть внутрь происходящих процессов и при необходимости провести необходимые настройки или исправления. 

Очень часто, машинные алгоритмы обучения работают в многомерных пространствах вариантов в процессе поиска и принятия решений. Иногда достаточно трудно, а иногда не возможно интерпретировать решения принятые алгоритмом на человеческий язык. Не имея возможности проверить результаты работы, невозможно полностью полагаться на результаты работы. Отсюда следует следующий термин который встречался почти также часто.

Trust/Trustability – Доверие к результатам которые выдала машина в результате обработки данных. Если мы имеем возможность получить объяснения как работает машинный алгоритм – тогда доверие к таким результатам выше. Но, как указано в конце предыдущего раздела, не всегда существует возможность объяснить результаты работы алгоритма и встает проблема, можем ли мы доверять полученным данным и если да – то насколько.

Упрощенно, в терминах машинного обучения 1 – это стопроцентная уверенность в результате. 0,5 – 50% уверенность в результате.

Врач, получая от машины результат в 0,7 (70%) вероятности диагностики смертельного заболевания для пациента – должен или понимать почему машина пришла к такому выводу или слепо довериться данным и начать терапию как можно ранее. Это немедленно поднимает вопросы этики – что если результат был ошибочным и терапия привела к ухудшению здоровья, а не наоборот.

Ethics – Этика. Вопросы этики поднимались также не только в секции финансов, но также и других отраслях промышленности и социальных направлений. Например этично ли отказать в займе одинокой матери троих детей если машина по всем параметрам видит что это “токсичный” клиент. Этично ли страховой компании отказать в страховке персоне – если система предсказывает скорую смерть клиента по причине болезни или по количеству штрафов за превышения скорости. Множество других сценариев может также продемонстрировать влияние применения машинного обучения на повседневную жизнь в ближайшем будущем. Выявляя невидимые и неподвластные анализу мелкие детали, машинные алгоритмы постоянно учатся и совершенствуются. Результатами их работы могут воспользоваться как в благих, так и в противоправных действиях.

Paternalism – Патернализм, некоторыми докладчиками расценивается как новый вид расизма или дискриминации. Компании или государства могут оказывать влияние или наоборот игнорировать некоторые группы людей или персон, которые имеют схожие паттерны поведения вне зависимости от их реального мировоззрения, статуса, реальных действий. Машину легко ввести заблуждение подавая в процессе обучения искаженные или неверные данные – либо неверно их интерпретировать. И если в результате нет возможности объяснить полученные результаты – человек или группа лиц могут столкнуться с непреодолимыми препятствиями в жизни не имея никаких причин для этого.

Explainability/Explainable – возможность объяснить полученные результаты. В машинном обучении очень многое зависит от того как ставится задача и что именно является искомым. Ставя задачу перед машиной – важно заранее понимать как будут интерпретированы полученные результаты. Есть высокий риск оказаться в ситуации из романа Дугласа Абрамса “Автостопом по Галактике”, в котором великому компьютеру был задан вопрос «Главный вопрос жизни, вселенной и всего такого», в результате машина выдала ответ “42”. И этот результат, главный герой пытался интерпретировать или как то объяснить на протяжении всех пяти книг этого прекрасного романа.

В результате обработки данных, вы получите на выходе модель и данные выдаваемые моделью должны носить какой-то осмысленных характер. Если вы не можете объяснить полученные данные – значит где то в процессе сбора данных, постановке и решении задачи были допущены ошибки.

Например для области финансов, Risk and Compliance должны иметь четкие ответы на вопросы почему банк должен отказать этому клиенту или этой транзакции – потому что это прямо влияет на прибыль банка

Interoperability – совместимость. Важный момент в работе с данными и результатами их обработки иметь возможность совмещать данные между собой, или работать в едином формате/структуре данных, которые в свою очередь могут стать входными данными для слоев машинной обработки более высоких уровней. Например в докладе от представителя Visa было рассказано о том как они строят и учат AI бороться с подозрительными и мошенническими операциями. Управляет этими AI, другой AI, более высокого уровня который занимается вопросами координации взаимодействием различных AI в структуре компании Visa.

Transparency – Прозрачность. С точки зрения социума очень важно знать и понимать, как используются персональные данные клиентов или граждан корпорациями и/или государственными структурами во избежание злоупотребления и нарушения основных свобод. Например в некоторых странах на законодательном уровне запрещают использовать технологии распознавания лиц на улицах и в помещениях. Само собой огромное количество данных о персоне и организации собирается внутри финансового учреждения. Банк как никто другой знает почти все о ежедневном поведении клиента. Сколько он зарабатывает, где, когда и сколько тратит, а также множество другой “мета” информации которая может быть применена как для пользы клиента так и против него. Использование этих данных или продажа результатов анализа этих данных третьим компаниям по факту не раскрывает персональных данных клиента и формально не передается, но без участия клиента результаты этих данных были бы недоступны и невозможны к анализу. 

Хочу ли я как персона участвовать в этом или нет? Это и есть вопрос прозрачности обработки данных клиентов в финансовых организациях.

Отдельно отмечу несколько терминов которые в каком то смысле являются синонимами к вышеперечисленному но вносят небольшие коррективы в контекст.

Integrity – Интегрируемость. Возможность бесшовно связать результаты машинного обучения с повседневной работой, постоянно накапливающимися новыми данными, их “до-обучения” машины на основе новых данных. В области финансов наблюдается очень высокая волатильность и вариативность данных и значений. Поэтому машине необходимо постоянно подстраиваться или переобучаться под новые и изменяющиеся условия.

В настоящий момент, алгоритмы распознавания лиц – являются нормой почти во всех, даже бюджетных смартфонах. Это потому что лица людей существенно не меняются и алгоритмы имеют большой датасет данных для обучения.

В финансах, все иначе, нет четких правил проведения транзакций их суммы, частоты и так далее. Много зависит от сезонности, погодных условий и политических факторов, войн и так далее. Сами по себе данные о финансовых операциях часто носят закрытый и приватный характер – поэтому компании которые занимаются обучением антифрод систем часто сталкиваются с проблемой доступа к реальным датасетам.

Resilience – Гибкость. Возможность легко адаптироваться с изменяемым условиям и данным, является ключевой для создания долгосрочных стратегий внедрения AI в финансовом мире. Структуры и форматы данных не фиксированы и подвергаются модификации во времени. Это значит что ранее обученные модели на других структурах данные должны быть переобучены или обучены заново.

Data is a key – Данные это ключ. Без правильно структурированных наборов данных невозможно достичь каких либо ощутимых результатов. Конечно, существуют такие алгоритмы которые могут обучаться на потоке неструктурированных данных но это достаточно редкий случай в отношении финансовых сервисов где чаще всего речь идет о конкретных данных и цифрах.

Исходя из выше указанного, некоторые компании ставят перед собой и сотрудниками цель создать Data Collecting Culture. После того как компания внедрит подобную культуру, вопрос обработки и интерпретации имеющихся данных станет на порядок проще, а следовательно эффективнее и дешевле.

People is a core – люди это основа всего. Все вышеперечисленные тезисы и проблемы не имеют никакого смысла если это не применяется в работе конкретных людей или не помогает в решении конкретных проблем стоящими перед людьми.

Это также относится и к тому, кто эти люди – которые пытаются решить имеющиеся задачи и проблемы с помощью AI/ML. Речь заходит даже о том какими морально этическими принципами должен обладать разработчик или архитектор систем машинного обучения чтобы не принести вред обществу. Например сотрудники компании Google активно противостоят планам компании начать работать над коммерческими контрактами для военных.

В заключение, приведу еще несколько ключевых тезисов которые можно кратко представить не углубляясь в подробности.

Mastercard labs, IBM, Google и прочие технологические гиганты, активно использует в своей работе Opensource и всячески поддерживает открытые технологии машинного обучения. С одной стороны это говорит о том что и другие компании вполне могут применять эти решения для своих задач уже сейчас и что самое важное – бесплатно. С другой стороны AI/ML требует очень серьезных вычислительных мощностей – вычислительные ресурсы могут быть поставлены, правильно, IBM, Google и так далее.

В многих странах мира, существуют правительственные программы поддержки предпринимателей, учетных и компании которые работают в области AI/ML выдавая всякого рода гранты и программы поддержки.

Банки готовятся к новым типам угроз, вектор которых направлен на обман или введение в заблуждение алгоритмов которые борются с подозрительными транзакциями или симулируют биометрию клиента. Например голос клиента для аутентификации транзакций при двухфакторной авторизации.

  Банковская и финансовая индустрия стоят на пороге совершенно новых возможностей открываемых AI/ML но для грамотного их использования и извлечения практической пользы, необходимо начинать применять “Data is a key” подход, в повседневной работе уже прямо сейчас, чтобы в будущем иметь те самые данные к  которым можно применить всю мощь AI/ML.

Ноябрь 2019

Автор статьи

Pavlo Sidelov