Data Internals X

Все еще ходите за метриками в BI? Как мы экспериментировали с LLM и не пRAGадали

Машинное обучение и искусственный интеллект в разработке инструментов управления данными

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Отрасль BI активно внедряет ИИ-ассистентов. Но как и всегда между вселяющими оптимизм экспериментами и успешным промышленным внедрением лежит пропасть. Коллегам из Сбербанка удалось преодолеть эту пропасть и создать надёжного BI-ИИ-ассистента для ежедневного анализа данных. Подробности — в докладе.

Целевая аудитория

Доклад будет полезен тем, кто ищет мощное решение поиска нужных метрик среди большого их количества, а также разработчикам, которые хотят погрузиться в создание мультиагентных систем.

Тезисы

Мы — платформа продуктовой аналитики. Собираем события с умных устройств Сбера и других источников, обрабатываем и предоставляем для аналитики и мониторинга технических показателей продуктов. Коротко о нас:

— собираем более 6 млрд событий в день;
— собрано и накоплено 2,5 трлн событий к концу 1 квартала 2025 года;
— DAU — 200+, WAU — 400+, MAU — 700+ (активные пользователи за день, неделю, месяц соответственно);
— несколько BI (Metabase, Superset, Grafana).
Платформа содержит огромное количество данных. Основной BI инструмент — демократичный Metabase, и из-за демократии куча дашбордов в нем. Поиск и выбор достоверных показателей занимает порою очень много времени даже для опытного аналитика, не говоря уже о новых пользователях системы. Для решения этой задачи мы посмотрели в сторону решения на основе LLM-агентов и запросов в API BI системы.

Технологии:

Python — на нем написана основная функциональность AI-помощника.
Mattermost — корпоративный мессенджер, в котором агент будет работать.
GigaChat — в качестве LLM, которая поможет реализовать агентов.

С недавнего времени возглавил техническую команду дата-инженеров. В прошлом занимался разработкой различных бэкендов от простых до самых сложных, в том числе для сервисов рекомендаций под различные устройства с экраном Сбера. Люблю свое дело, всегда интересно пощупать что-то новое.

Видео

Другие доклады секции

Машинное обучение и искусственный интеллект в разработке инструментов управления данными