Как использовать проверки прокуратуры в мирных целях?
Расскажите, пожалуйста, о чем и для кого ваш проект?
Наш проект выполняется в рамках программы Центра ИИ НИУ ВШЭ совместно с индустриальным партнером Сбербанком. «Кредитная фабрика» Сбербанка построена на ИИ алгоритмах и высокопроизводительных вычислениях, где основную ценность имеют верифицированные данные. Команда ВШЭ сфокусировалась на поиске новых потоков, описывающих уровень развития ESG[1]-практик компании. Мы предложили модель, которая поможет улучшить процесс классификации компаний в зависимости от их подверженности ESG рискам и уровня развития практик управления такими рисками на основе доступной текстовой информации. Это, в свою очередь, позволит сократить затраты ресурсов на кредитный и риск-анализ.
Какие технологии ИИ применялись в проекте?
Большая часть информации о ESG-факторах, в том числе ESG-рисках, компании представлена в текстовом неструктурированном виде. Для оперативного анализа такой информации целесообразно использовать модели анализа текста, основанные на нейросетях, такие как модель BERT. Для достижения интерпретируемости в нашем проекте мы доработали модель BERT. Также изменили финальные слои нейросети с целью явного контроля за поведением функции расстояния в пространстве эмбеддингов[2] отдельных предложений текста. Разработанная модификация модели позволяет получать более понятные результаты анализа текстов, при этом незначительно теряя в точности.
Как можно анализировать ESG-факторы с помощью текстовых документов?
Предполагается, что каждый вид деятельности компании должен быть связан со специфичными рисками. Текстовое описание и информация о компании в сети Интернет зачастую содержит много ценных фактов о виде деятельности компании, о том, как компания решала те или иные сложности. Поэтому специальным образом выполненное ассоциирование рисков с доступной информацией может подсветить риск-факторы компаний.
С какими трудностями вы сталкиваетесь в процессе работы?
Основная трудность заключается в том, что для большинства компаний доступно очень мало информации о специфике их деятельности. Подробную информацию публикуют, в основном, крупнейшие аггрегаторы, либо очень крупный бизнес, о которых у Сбербанка и так достаточно информации. В нашем проекте мы концентрируемся на средних и малых компаниях.
Привлекаете ли вы для работы над проектом студентов и аспирантов?
Да, к работе привлечены 1 бакалавр и 1 аспирант НИУ ВШЭ – Пермь.
Какие этапы проекта уже завершены? Довольны ли вы результатом?
Мы полностью выполнили первый этап работ, наш подход признан успешным и перспективным. На данный момент ведем обсуждение по уточнению анализируемых факторов и перечня отраслей компаний для исследования на следующих этапах. До конца года наша команда планирует сосредоточиться на улучшении качества предсказания текущей модели, а индустриальный партнер проведет в первичное тестирование в контуре Банка наших решений.
Какими вы видите финальные результаты проекта?
ПО, позволяющее на основе всех доступных текстовых источников информации ранжировать компании с точки зрения ESG -риск факторов.
Будут ли результаты проекта востребованы в вопросе импортозамещения?
Многие считают, что уровень развития финансового сектора в нашей стране вомногом превосходит и превосходил зарубежные аналоги. Вопрос импортозамещения здесь не стоит, скорее можно говорить о том, что на данный момент возникают отдельные ситуации отсутствия доступа к актуальным данным о компаниях. Мы как раз создаем уникальный инструмент, который позволит получать и анализировать больше доступной информации.
Как можно будет применить результаты проекта в повседневной жизни?
Мы хотим сделать продукт, максимально ориентированный на нужды партнера, который позволит сократить затраты ресурсов на кредитный и риск-анализ. Внедрение продукта улучшит клиентский путь компаний и в конечном счете потребители заметят это, например, по ускорению времени кредитования бизнеса.
[1] ESG (Environment, Social, Governance) — это стратегия развития компании, которая предусматривает прозрачность в менеджменте, заботу об экологии и людях, с которыми соприкасается компания.
[2] Эмбеддинг (от англ. embedding — вложение) — это процесс или, чаще, результат процесса преобразования языковой сущности — слова, предложения, параграфа или целого текста в набор чисел — числовой вектор. Это понятие часто встречается в описаниях систем ИИ.
Паршаков Петр Андреевич
Руководитель проекта