Особенности построения современных информационных систем


Актуальность проблемы хранения и оперативного поиска данных привела к появлению такого понятия, как хранилище данных. Следует упомянуть о необходимости использования единых ин­формационных хранилищ в аналитических системах и в первую очередь в системах поддержки принятия решений (СППР). СППР пользуются информацией, собранной с помощью компьютерных сетей из множества систем обработки данных (СОД). Данные в СОД собираются, хранятся и по достижении установленного срока выгружаются. В различных СОД данные могут не быть согласо­ваны между собой, информацияв них может быть по-разному струк­турирована, степень ее достоверности определить сразу бывает до­статочно трудно. Все это свидетельствует о том, что архивные дан­ные из СОД без предварительной доработки использовать в ин­формационных хранилищах нецелесообразно.

В настоящее время для совместного использования данных осу­ществляется интеграция различных СОД на основе единого справочника метаданных.

Информационные хранилища для СППР должны обладать не­которыми специфическими свойствами. От них требуется хране­ние информации в хронологическом порядке, так как без отраже­ния хронологии данных нельзя говорить о решении задач прогнози­рования и анализа тенденций (основных задач СППР). Важнейшее требование, предъявляемое к информационным хранилищам, — даже не оперативность, также необходимая, а достоверность ин­формации, которую без согласованности данных обеспечить не­возможно. Дело в том, что различные СОД на один и тот же зап­рос могут дать различные ответы по ряду причин:

•асинхронность модификации данных в разных СОД;

•различия в трактовке событий, понятий и т.д.;

•изменение семантики данных в процессе развития предмет­ной области;

• ошибки при вводе и обработке;

• частичная утрата фрагментов информации из архива и т.п.

Задача создания информационных хранилищ чрезвычайно слож­на, и достаточно часто се решение связано с рядом проблем.

Хранилища данных работают с внешними источниками, т.е. различными информационными системами, электронными архива­ми, каталогами и справочниками, статистическими сборниками и т.д. Все внешние источники реализованы на основе различных программных и аппаратных средств. На основе этих разнородных средств и решений необходимо построить единую информацион­ную, функционально согласованную систему.

Если единая информационная система должна иметь распреде­ленное решение, то следует физически разделить узлы компью­терной сети, где происходит операционная обработка информа­ции, и узлы, в которых выполняется анализ данных.

Создание единых хранилищ данных предполагает использова­ние технологий статистической обработки информации для ее пред­варительного анализа, определения состава и структуры темати­ческих рубрик. Начальный этап предварительного анализа — выде­ление групп с однородными данными и расчленение информации на однокачественные интервалы, т.е. группировка по типу инфор­мации.

Если существующие в настоящее время технологии анализа данных хранилищах распределить по увеличению аналитических возможностей, то список будет выглядеть так: Online Transaction Processing (OLTP), Online Analytical Processing (OLAP), Data Mining.

Технология оперативного анализа распределенных данных (ОLАР-
технология), занимающая среднее положение в этом списке, наиболее распространена. Эта технология обеспечивает:

*построение многомерных моделей баз данных;

*иерархическое представление информации по семантическим связям;

*выполнение сложных аналитических расчетов;
*динамическое изменение структуры отчета;

*обновление БД.

Аналитические приложения для поддержки принятия решений в бизнесе основываются на модели данных, разработанной для конечного пользователя. Такая модель может обрабатывать информацию из реляционных баз данных и других плоских таблиц многомерным образом.

Программные продукты, использующие ОLАР-технологию, сочетают модель представления данных, оптимизированную для анализа, с простыми средствами доступа к этим данным.

К основным преимуществам ОLАР-технологии относятся:

*возможность пользователя работать с данными самому, а не через посредника-программиста;

*время ответа на сложный запрос, предполагающий анализ большого объема данных, в этих технологиях намного меньше, чем в ОLАР-технологии;

*ОLАР-приложения предназначены и наиболее эффективны для анализа большого объема данных.

При выборе СУБД следует учитывать, что скорость работы в сети зависит не только от аппаратных возможностей оборудования, но и в значительной степени от ПО. В классической сетевой технологии БД хранится на сервере. Программы исполняются на рабочих станциях, данные поступают по сети. При локальной работе с базами особенных проблем не возникает. Но когда к таблицам пытаются обратиться по сети одновременно несколько пользователей, возникают трудности. В рамках этой технологии два и более пользователя не могут одновременно изменить одни и те же данные.

Допустим, при работе прикладного ПО, когда автоматизирован отпуск товара со склада с последующей загрузкой автомобиля, дна пользователя, в данном случае кладовщики, осуществляющие загрузку разных автомобилей, пытаются списать со склада один и тот же товар. Первый пользователь заблокировал поле «ос таток товара», и пока он не закончит запись, остальные пользователи должны ждать. При возникновении ошибки в работе одного из пользователей (сбой питания компьютера, аварийное завершение программы и т.д.) всем остальным приходится завершать работу и ждать, пока администратор не восстановит испорченные индексные файлы (в худшем случае — саму базу данных).

Так как и сама база, и индексы являются последовательными файлами, при больших объемах данных операции с ними выпол­няются крайне медленно.

С приходом технологии «клиент - сервер» ситуация несколько улучшилась. Стали создаваться распределенные системы. Современ­ные серверы баз данных (Огас1е, Sybase, Informix, Interbase и т.д.) способны перенести часть нагрузки на сервер. Так, возможно вы­полнение хранимых на сервере процедур, запускаемых как с кли­ентской части программы, так и с серверной, как реакция на со­бытия (с помощью триггеров). Однако, несмотря на улучшение эксплуатационных параметров, уменьшение сетевого трафика не очень значительно. Так, если необходимо обработать значитель­ные объемы информации, на клиентскую часть приходится пере­давать достаточно много данных. К тому же программы все равно должны исполняться на мощных рабочих станциях. Сегодня реше­ние этой проблемы — перенос всей математической обработки на центральные компьютеры, когда у клиентов остаются только ввод и отображение данных.



Дата добавления: 2021-01-26; просмотров: 3049;


Поиск по сайту:

Воспользовавшись поиском можно найти нужную информацию на сайте.

Поделитесь с друзьями:

Считаете данную информацию полезной, тогда расскажите друзьям в соц. сетях.
Poznayka.org - Познайка.Орг - 2016-2024 год. Материал предоставляется для ознакомительных и учебных целей.
Генерация страницы за: 0.01 сек.