Data Internals X

Все еще ходите за метриками в BI? Как мы экспериментировали с LLM и не пRAGадали

Машинное обучение и искусственный интеллект в разработке инструментов управления данными

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Отрасль BI активно внедряет ИИ-ассистентов. Но, как и всегда, между вселяющими оптимизм экспериментами и успешным промышленным внедрением лежит пропасть. Коллегам из Сбера удалось преодолеть эту пропасть и создать надежного BI-ИИ-ассистента для ежедневного анализа данных. Подробности — в докладе.

Целевая аудитория

Доклад будет полезен тем, кто ищет мощное решение поиска нужных метрик среди большого их количества, а также разработчикам, которые хотят погрузиться в создание мультиагентных систем.

Тезисы

Мы — платформа продуктовой аналитики. Собираем события с умных устройств Сбера и других источников, обрабатываем и предоставляем для аналитики и мониторинга технических показателей продуктов.

Коротко о нас:
* собираем более 6 млрд событий в день;
* собрано и накоплено 2,5 трлн событий к концу 1 квартала 2025 года;
* DAU — 200+, WAU — 400+, MAU — 700+ (активные пользователи за день, неделю, месяц соответственно);
* несколько BI (Metabase, Superset, Grafana).

Платформа содержит огромное количество данных. Основной BI-инструмент — демократичный Metabase, и из-за демократии — куча дашбордов в нем. Поиск и выбор достоверных показателей занимают порою очень много времени даже у опытного аналитика, не говоря уже о новых пользователях системы. Для решения этой задачи мы посмотрели в сторону решения на основе LLM-агентов и запросов в API BI-системы.

Технологии:
* Python — на нем написана основная функциональность AI-помощника;
* Mattermost — корпоративный мессенджер, в котором агент будет работать;
* GigaChat — в качестве LLM, которая поможет реализовать агентов.

С недавнего времени возглавил техническую команду дата-инженеров. В прошлом занимался разработкой различных бэкендов — от простых до самых сложных, в том числе для сервисов рекомендаций под различные устройства с экраном Сбера. Любит свое дело, всегда интересно пощупать что-то новое.

Видео

Другие доклады секции

Машинное обучение и искусственный интеллект в разработке инструментов управления данными