Концепция информационных хранилищ позволяет решить следующие проблемы:
- хранение разнородных данных из различных источников в течение больших периодов времени
- быстрый доступ к данным и поиск релевантной запросу информации
Концепция информационных хранилищ подразумевает использование систем интеграции данных. Причины появления информационных хранилищ:
- Осознание руководством предприятий того, что в данных содержатся скрытые закономерности (знания), характеризующие процесс управления в целом, способные повысить его эффективность;
- снижение стоимости средств хранения информации, дающее возможность хранить данные, накопленные за длительные интервалы времени;
- снижение стоимости элементной базы сложных архитектур;
- переход от массового обслуживания к индивидуальному (учет разнообразных требований заказчика).
Концепция информационных хранилищ:
- Концепция информационных хранилищ позволяет обеспечить:
- хранение разнородных данных из различных источников в течение больших периодов времени;
- быстрый доступ к данным и поиск релевантной запросу информации.
- Концепция информационных хранилищ подразумевает использование систем интеграции данных.
Проблемы интеграции данных:
1. Источники могут использовать различные модели данных и предоставлять различные интерфейсы для доступа к своим данным (реляционные, объектные или унаследованные СУБД).
2. Данные источника могут быть неструктурированными (HTML файлы, текстовые файлы).
3. Источники могут быть автономными.
Задачи интеграции данных:
Хранилища данных
данные из различных источников поступают в хранилище, все запросы к системе интеграции обрабатываются с использованием этих данных.
Виртуальные хранилища
данные хранятся в источниках, а запросы к системе интеграции транслируются в запросы или операции, понятные источнику. Данные, полученные в ответ на эти запросы к источникам, объединяются и предоставляются пользователю.