Начнём с такого определения, как системы бизнес-аналитики.
BI-системы — программы, значительно упрощающие работу бизнес-аналитиков. При их помощи можно выполнять множество различных задач, главной из которых является переработка большого объёма информации для последующего комфортного использования.
Софья Клюйкова
Основные функции BI-систем
- Сбор и объединение информации из различных источников. Эта функция объединяет информацию как из постоянно обновляющихся источников, так и из неизменяющихся. К обновляющимся данным можно отнести, например, погоду или дату, а к постоянным техническую документацию.
- Создание классификаций. Функция позволяет создавать удобные для пользования массивы данных. Из них можно не только формировать кластеры, базы данных и пр., но и сортировать их по датам, общим темам и многим другим параметрам.
- Хранение данных чаще всего осуществляется при помощи создания инфокубов, о которых будет рассказано чуть позже.
- Создание отчётов, списков, таблиц. Этот инструмент автоматизирует процесс, казалось бы, не значительно, то такие детали как автоматическая подстановка порядкового номера или создание строки одним нажатием клавиши, сильно упрощают задачу.
- Создание дашбордов в целом. Функция позволяет создавать различные графические изображения, подписывать их, создавать интерактивные элементы.
- Подсчёт статистик. Здесь может быть посчитана совершенно любая статистика, за любой промежуток времени. В итоге получается график, который может показать и личный успех в работе каждого сотрудника, и продажи, и прибыль.
- Средства поиска закономерностей. Функция указывает на факторы, в той или иной степени влияющие на результат. После, собрав и обработав несколько похожих ситуаций можно выявить общую для показателя закономерность.
- Моделирование бизнес процессов. Инструмент позволяет создавать множество различных похожих ситуаций, изменяя каждый раз один или несколько показателей. В итоге получится найти наиболее выгодный вариант, а также найти некоторые причинно-следственные связи.
- Стратегия. Функция помогает в выработке дальнейшего плана действий, основываясь на полученных ранее данных.
Можно сказать, что главная функция всей системы бизнес аналитики в целом — помощь в принятии наивыгоднейших решений на основе полученных данных. BI-системы позволяют анализировать текущую ситуацию на рынке и следить за меняющимися тенденциями
Софья Клюйкова
Что такое информационный куб
Информационный куб представляет из себя многоуровневую систему данных, представленную в виде взаимосвязанных таблиц. Простейшая модель инфокуба выглядит как общая таблица факторов, дополняемая таблицами измерений.
Такая база данных объединяет информацию о большом количестве бизнес процессов. Такой способ классификации и хранения информации позволяет не потерять её, а также сразу приложить нужные дополнения, такие как, например, ссылки на техническую документацию или графики.
Система OLAP
Для начала выясним что такое OLAP. Итак, система OLAP (online analytical processing) — система, предназначенная для моделирования течения бизнес процессов, расчёта статистика, создания отчётов. Пои её помощи также осуществляется поиск информации. По сути, OLAP-системой можно назвать любое ПО, выполняющее эти функции.
Система Business Intelligence
Business Intelligence можно считать общим названием для различных BI-систем. Business Intelligence в первую очередь предполагает автоматизацию сбора информации, её объединения и хранения.
Российские BI-разработки
- Modus BI. Программа имеет хорошие инструменты визуализации, способна давать прогнозы на будущее развития бизнеса. Платформа разработана российским вендором «БиАй Про».
- Proceset. Решение выделяется гибкостью в работе. При. Его помощи можно создавать собственные модели данных, факторы фильтрации, детализировать интересующие показатели. Также Proceset хороший анализатор процессов. Анализ осуществляется при помощи систем process mining и task mining.
- Yandex DataLens. Главная функция платформы — помощь в создании дашбордов. Она включает в себя множество шаблонов и инструментов для творчества в рамках проекта.
- Visology — ещё один конструктор дашбордов и систем данных.
- Polymatica. ПО, предназначенное для быстрого поиска нужной информации из массива.
Хранение информации: data warehouse (DWH)
В общем, data warehouse представляет из себя многоуровневую корпоративную систему хранения данных, собранных из разных источников. Эта многоуровневая система называется LSA (Layered Scalable Architecture). Её главная особенность состоит в том, что LSA разделяет массив данных на несколько формальных уровней по различным показателям, а после создаёт систему взаимосвязанных элементов.
Таким образом при помощи data warehouse получается соотнести элементы одной области с элементами другой. В итоге получается некая сеть, где каждый из её элементов может быть связан сразу с несколькими и наоборот.
Основная функция DWH — сбор обновляющихся данных в одну единую систему. DWH устраняет разрозненность хранения информации.
Такая разрозненность является большой проблемой, так как анализируя лишь один или несколько источников информации, невозможно получить целостного представления о работе бизнеса.
Чем data warehouse отличается от СУБД
От обычной СУБД data warehouse отличается по нескольким направлениям:
- Широта возможности поиска. В отличие от СУБД здесь можно найти информацию обо всех отраслях бизнеса. Это значит, что DWH может предоставить сразу все доступные данные, а БД только информацию о конкретной области.
- Хранилище для информации. В DWH можно хранить данные за большие промежутки времени, от этого система не перестанет быть удобной для пользования, в то время как СУБД требует постоянного обновления.
Этапы работы LSA
- Первый этап, так называемый Primary Data Layer, заключается в сборе информации из источников данных.
- На этапе «Core Data Layer» формируется разделение информации на группы, а также её частичная переработка, которая включает в себя отсеивание лишнего, то есть «воды».
- После, на этапе создания аналитических витрин, данные окончательно преобразуются в удобные для использования структуры, которые в последующем можно использовать для анализа и создания дашбордов. Также на данном этапе производятся сложные расчёты и выводятся нестандартные решения. В интриге получается единая база созависимых данных, предоставленная в удобном формате.
- Этап «Service Layer» обеспечивает модерацию работы предидущих этапов. На данном этапе также происходит мониторинг и выявление ошибок.
Подведём итоги
Существует множество различных BI-систем, но главная цель для всех них — помощь в анализе данных, их хранении, визуализации.
Список литературы и источники:
- Bigdataschool, Не Hadoop’ом единым: что такое КХД и как его связать с Big Data https://bigdataschool-ru.turbopages.org/bigdataschool.ru/s/blog/lsa-data-warehouse-architecture.html
- Intuit, Проектирование хранилищ данных для приложений систем деловой осведомлённости https://intuit.ru/studies/courses/3402/455/lecture/10161
Автор: Клюйкова Софья. Специализация: аналитика. Опыт: 9 лет.