82 АИС
Для обозначения аналитических технологий и средств в целом принято использовать термин "Business Intelligence" или, сокращенно, - BI. Понятие BI объединяет различные средства и технологии анализа и обработки данных масштаба предприятия. На их основе создаются BI-системы. Их цель - повысить качество информации для принятия управленческих решений. BI-системы больше известны под названием Систем Поддержки Принятия Решений (СППР, DSS, Decision Support System). В качестве синонимов понятия "СППР" оперируют также понятиями "аналитическая система" или "управленческая система".
По оценкам IDC рынок BI состоит из 5 сегментов:
1. OLAP-продукты,
2. инструменты добычи данных,
3. средства построения Хранилищ и Витрин данных,
4. управленческие информационные системы и приложения,
5. инструменты конечного пользователя для выполнения запросов и построения отчетов.
Рассмотрим более подробно каждый сегмент.
OLAP-продукты
На сегодняшний день в мире разработано множество продуктов, реализующих OLAP-технологии. Чтобы легче было ориентироваться среди них, существует несколько классификаций OLAP-продуктов:
по способу хранения данных,
по месту нахождения OLAP-машины,
по степени готовности к применению.
Основная идея OLAP заключается в построении многомерных таблиц, которые будут доступны для запросов пользователей. Многомерные таблицы (многомерные кубы) строятся на основе исходных и агрегатных данных. И исходные и агрегатные данные для многомерных таблиц могут храниться как в реляционных, так и многомерных базах данных. Поэтому в настоящее время применяются три способа хранения данных: MOLAP (Multidimensional OLAP), ROLAP (Relational OLAP) и HOLAP (Hybrid OLAP).
Соответственно, OLAP-продукты по способу хранения данных делятся на три аналогичные категории:.
В случае MOLAP, исходные и многомерные данные хранятся в многомерной БД или в многомерном локальном кубе.
В ROLAP-продуктах исходные данные хранятся в реляционных БД или в плоских локальных таблицах на файл-сервере. Агрегатные данные могут помещаться в служебные таблицы в той же БД.
В случае использования Гибридной архитектуры исходные данные остаются в реляционной базе, а агрегаты размещаются в многомерной.
В серверных OLAP-средствах вычисления и хранение агрегатных данных выполняются отдельным процессом - сервером. Клиентское приложение получает только результаты запросов к многомерным кубам, которые хранятся на сервере.
OLAP-клиент устроен по-другому. Построение многомерного куба и OLAP-вычисления выполняются в памяти клиентского компьютера.
Следующая классификация OLAP-продуктов - по степени готовности к применению. Различают: OLAP-компоненты, инструментальные OLAP - системы и конечные OLAP-приложения.
OLAP-компонента - это инструмент разработчика. С ее помощью разрабатываются клиентские OLAP-программы.
Инструментальные OLAP-системы - это программные продукты, предназначенные для создания аналитических приложений. Различают две категории инструментальных OLAP-систем: системы для программирования и системы для быстрой настройки
по степени готовности к применению относятся конечные OLAP-приложения. Это готовые прикладные решения для конечного пользователя.
Инструменты добычи данных
Knowledge Discovery in Databases (KDD)- это процесс поиска полезных знаний в "сырых" данных. KDD включает в себя вопросы подготовки данных, выбора информативных признаков, очистки данных, применения методов "раскапывания данных" (Data Mining), а также обработки и интерпретации полученных результатов.
Центральным элементом этой технологии являются методы Data Mining, позволяющие обнаруживать знания при помощи математических правил:
Фильтрация.
Деревья решений.
Ассоциативные правила.
Генетические алгоритмы.
Нейронные сети.
Функциональность Data Mining в той или иной степени полноты реализации включена в аналитические системы различных производителей - Oracle, Hyperion, SAS и т.д. Однако, наиболее "продвинутыми" в этом плане являются специализированные системы математического анализа данных. В России авторитетным разработчиком систем в технологии KDD является компания "Лаборатория BaseGroup".
Средства построения Хранилищ и Витрин данных
Хранилища и Витрины данных создаются с применением специализированных средств построения Хранилищвитрин данных. К этим средствам относятся:
средства проектирования Хранилищ данных,
средства извлечения, преобразования и загрузки данных,
готовые предметно-ориентированные ХД.
Средства проектирования Хранилищ данных входят в состав реляционных и многомерных СУБД от таких производителей как Microsoft, Oracle, IBM, Sybase и других. Также часто применяются универсальные CASE-инструменты, такие как BPWin и ErWin. После описания структур хранения данных специальными системными утилитами выполняется их генерация. Такой подход к созданию Хранилища данных позволяет построить индивидуальное Хранилище или Витрину данных в сжатые сроки. В тоже время такой подход затрудняет перенос наработок от одного заказчика к другому и обмен практическим опытом в решении аналитических задач.
Альтернативным способом построения Хранилищ данных является применение других специализированных средств - Студий для построения Хранилищ данных. Такие продукты предлагают набор шаблонов и заготовок для быстрого создания Хранилища. В составе Студии может предоставляться базовая модель Хранилища данных, ориентированная на определенную бизнес-сферу. С помощью таких инструментов можно значительно быстрее создать Хранилище данных, воспользовавшись опытом предыдущих решений и начать его эксплуатацию. Продукты этого класса, в частности, предлагает компания Sybase - это продукт Industry Warehouse Studio.
ETL-средства (extraction, transformation, loading) - средства извлечения, преобразования и загрузки данных) обеспечивают три основных процесса, используемые при переносе данных из одного приложения или системы в другие. ETL-средства извлекают информацию из исходной базы данных, преобразуют ее в формат, поддерживаемый базой данных назначения, а затем загружают в нее преобразованную информацию. Эти средства обычно входят в состав функциональности реляционных и многомерных СУБД или Студий для построения Хранилищ данных. Однако существуют и специализированные системы, реализующие только ETL-функции. Классической ETL-системой является, например, продукт Ascential DataStage компании Ascential Software.
И, наконец, существует еще один способ построения Хранилищ и Витрин данных - это применение готовых предметно-ориентированных Хранилищ данных. Это самый надежный способ построить Хранилище данных в сжатые сроки. Готовые к эксплуатации Хранилища данных характеризуются наличием в них механизмов средств построения Хранилищ/Витрин данных, взаимосвязанных посредством единого словаря метаданных. К ним относятся - процедуры извлечения, преобразования, очистки и загрузки данных, функции генерации баз данных и процедур обработки, механизмы построения выборок данных, интерфейсы просмотра и анализа данных. Ограничением в применении готовых Хранилищ данных является их предметная ориентация. Например, финансовое Хранилище данных невозможно применить для решения задач оптимизации химического производства. Примером готового предметно-ориентированного Хранилища данных является система Контур Корпорация от компании Intersoft Lab. Применение предметно-ориентированных Хранилищ данных отражает общемировую тенденцию развития рынка BI, наметившуюся в последнее время - предоставления платформ для "быстрой" разработки аналитических приложений.
Управленческие информационные системы и приложения
Существует еще один очень разносторонний класс аналитических систем. Это - конечные решения для управленцев и аналитиков. Исторически сложилось так, что технологическая основа реализации таких систем существенно различается. Одни из них построены на современных аналитических инструментах, другие - с применением базовых информационных технологий. Чтобы легче ориентироваться в этих системах вводится 3 классификации:
по виду решаемой задачи,
по масштабу решаемой задачи,
по технологическому построению.
Аналитические системы классифицируются по виду задач, решаемых с их помощью. Среди видов задач можно выделить:
Анализ финансового состояния банка или предприятия, выполняемый по внешним публичным данным
Инвестиционный анализ
Подготовка бизнес-планов, учитывающих вариации схем производства, сбыта и финансирования, комплексного анализа маркетинговой ситуации, чувствительности проекта по основным параметрам.
Маркетинговый анализ
Управление проектами
Бюджетирование
Финансовое управление
Аналитические системы также классифицируются по масштабу решаемой задачи:
Системы автоматизации труда одного специалиста.
Системы для коллективной работы группы сотрудников.
Системы для применения в территориально распределенной корпорации.
По технологическому построению аналитические системы можно условно разделить на монолитные и настраиваемые:
Компромиссом между этими двумя классами систем является реализация аналитической методики в виде Приложения универсальной аналитической системы. Такой подход позволяет выполнять их тиражирование независимо друг от друга.
Инструменты конечного пользователя для выполнения запросов и построения отчетов
Предназначены для формирования запросов к информационным системам в пользовательских терминах, а также их исполнение, интеграцию данных из разных источников, просмотр данных с возможностями детализации и обобщения и построение полноценных отчетов, как экранных, так и печатных. Визуализация результатов запроса может быть представлена пользователю в различном виде - плоские или многомерные таблицы, графики, диаграммы, различные специализированные интерфейсы.