Модулированные сети могут одновременно передавать телепрограммы, речь, двоичные данные и т. п. 2 глава

2. Дейтефонная связь использует для передачи информации телефонные каналы связи, а в качестве приемопередающей аппаратуры может использоваться как обычная телетайпная аппаратура совместно с модемами, так и специальная. Примерный состав и назначение аппаратуры абонента дейтефонной связи:

1) телефонный аппарат – первоначальный вызов абонента;

2) фотосчитывающее устройство – автоматическое считывание информации с перфоленты при передаче;

3) перфоратор ленты – регистрация принятой информации на перфоленту;

4) модулятор-демодулятор (модем) – согласование приемопередающей аппаратуры с телефонным каналом связи;

5) устройство защиты от ошибок – для обеспечения достоверности передачи информации;

6) устройство алфавитно-цифровой печати (принтер, телетайп).

Факсимильный способ передачи информации заключается в дистанционном копировании документов. Назначение факсимильной связи – передача на расстояние информации в виде текстов, чертежей, рисунков, схем, фотоснимков и т. п.

1.6.4 Обработка информации

На различных этапах информационного цикла данные преобразовываются из одного вида в другой с помощью различных методов. Общая схема процесса обработки информации выглядит следующим образом (рис. 1.15).

Рис.1.15. Схема процесса обработки информации

В процессе обработки информации решается некоторая информационная задача, для которой должны быть определены исходная (некоторый набор исходных данных) и итоговая (требуемые результаты) информация. Переход от исходных данных к результату и есть процесс обработки. Тот объект или субъект, который осуществляет обработку, называется исполнителем обработки. Это может быть человек или техническое устройство, в том числе компьютер.

Для успешного выполнения обработки информации исполнителю должен быть известен способ обработки, т. е. последовательность действий, которую нужно выполнить, чтобы достичь нужного результата. Описание такой последовательности действий в информатике принято называть алгоритмом обработки.

Можно выделить два типа обработки информации:

1. Обработка, связанная с получением новой информации, нового содержания знаний. К ней относится решение различных задач путем применения логических рассуждений.

2. Обработка, связанная с изменением формы, но не изменяющая содержания, например, перевод текста с одного языка на другой.

Обработка данных включает в себя множество разных операций, представляющих собой комплекс совершаемых технологических действий, в результате которых информация преобразуется. Основными операциями являются:

- формализация (приведение данных, поступающих из разных источников, к единой форме);

- фильтрация (устранение лишних данных, которые не нужны для принятия решений);

- сортировка (приведение в порядок данных по заданным признакам с целью удобства использования);

- архивация (сохранение данных в удобной и доступной форме);

- защита (комплекс мер, направленных на предотвращение потерь при воспроизведении и модификации данных);

- преобразование (преобразование данных из одной формы в другую или из одной структуры в другую или изменение типа носителя).

Обработка информации – это получение одних информационных объектов из других информационных объектов путем выполнения некоторых алгоритмов.

Обработка является одним из основных процессов, выполняемых над информацией, и главным средством увеличения объема и разнообразия информации.

Средства обработки информации – всевозможные устройства и системы, созданные человечеством, и в первую очередь компьютер.

При обработке информации производится структурирование данных. Это определенный порядок, определенная организация в хранилище информации: расположение данных в алфавитном порядке, группировка по некоторым признакам классификации, использование табличного или графового представления – все это примеры структурирования. От способа организации информации зависит алгоритм поиска. Если информация структурирована, то поиск осуществляется быстрее.

Живые организмы и растения обрабатывают информацию с помощью своих органов и систем, компьютеры - путем выполнения некоторых алгоритмов.

Вычислительные алгоритмы должны объединяться в вычислительный граф системы обработки информации в соответствии с требуемой технологической последовательностью решения задач.

По мере развития вычислительной техники совершенствуются и формы ее использования. Существуют разнообразные способы доступа и общения с ЭВМ. Индивидуальный и коллективный доступ к вычислительным ресурсам зависит от степени их концентрации и организационных форм функционирования. Централизованные формы применения вычислительных средств, которые существовали до массового использования ПЭВМ, предполагали их сосредоточение в одном месте и организацию информационно-вычислительных центров индивидуального (ИВЦ) и коллективного пользования (ИВЦКП).

Деятельность ИВЦ и ИВЦКП характеризовалась обработкой больших объемов информации, использованием нескольких средних и больших ЭВМ, квалифицированным персоналом для обслуживания техники и разработки программного обеспечения. Централизованное применение вычислительных и других технических средств позволяло организовать их надежную работу, планомерную загрузку и квалифицированное обслуживание.

Централизованная обработка информации наряду с положительными сторонами имеет и некоторые отрицательные черты, порожденные прежде всего отрывом конечного пользователя от технологического процесса обработки информации.

Децентрализованные формы использования вычислительных ресурсов начали формироваться со второй половины 80-х г ХХ в. Децентрализация предусматривает размещение ПЭВМ в местах возникновения и потребления информации, где создаются автономные пункты ее обработки. К ним относят абонентские пункты и автоматизированные рабочие места.

Автоматизированное рабочее место (АРМ) специалиста включает персональную ЭВМ, работающую автономно или в вычислительной сети, набор программных средств и информационных массивов для решения функциональных задач.

Технология электронной обработки информации – человеко-машинный процесс исполнения взаимосвязанных операций, протекающих в установленной последовательности с целью преобразования исходной (первичной) информации в результатную. Технологические операции разнообразны по сложности, назначению, технике реализации, выполняются на различном оборудовании, многими исполнителями.

Различают два основных типа организации технологических процессов: предметный и пооперационный.

Предметный тип организации технологии предполагает создание параллельно действующих технологических линий, специализирующихся на обработке информации и решении конкретных комплексов задач (учет нагрузки, качества прохождения сигнала и т. п.) и организующих пооперационную обработку данных внутри линии.

Пооперационный (поточный) тип построения технологического процесса предусматривает последовательное преобразование обрабатываемой информации согласно технологии, представленной в виде непрерывной последовательности сменяющих друг друга операций, выполняемых в автоматическом режиме.

Различают следующие режимы взаимодействия пользователя с ЭВМ: пакетный и интерактивный (запросный, диалоговый). Сами ЭВМ могут функционировать в следующих режимах: одно- и многопрограммном, разделения времени, реального времени, телеобработки.

Организация вычислительного процесса при пакетном режиме строилась без доступа пользователя к ЭВМ. Его функции ограничивались подготовкой исходных данных по комплексу информационно-взаимосвязанных задач и передачей их в центр обработки, где формировался пакет, включающий задание для ЭВМ на обработку, программы, исходные и справочные данные. Он вводился в ЭВМ и реализовывался в автоматическом режиме, при этом работа ЭВМ могла проходить в одно- или многопрограммном режиме.

Интерактивный режим предусматривает непосредственное взаимодействие пользователя с информационно-вычислительной системой, может носить характер запроса (как правило регламентированного) или диалога с ЭВМ.

Запросный режим необходим пользователям для взаимодействия с системой через значительное число абонентских терминальных устройств, в том числе удаленных на значительное расстояние от центра обработки. Такая необходимость обусловлена решением оперативных задач справочно-информационного характера.

Диалоговый режим открывает пользователю возможность непосредственно взаимодействовать с вычислительной системой в допустимом для него темпе работы, реализуя повторяющийся цикл выдачи задания, получения и анализа ответа. При этом ЭВМ сама может инициировать диалог, сообщая пользователю последовательность шагов (представление меню) для получения искомого результата.

Обе разновидности интерактивного режима (запросный, диалоговый) основываются на работе ЭВМ в режимах реального времени и телеобработки, которые являются дальнейшим развитием режима разделения времени, поэтому обязательными условиями функционирования системы в этих режимах являются, во-первых, постоянное хранение в запоминающих устройствах ЭВМ необходимой информации и программ и лишь в минимальном объеме поступление исход ной информации от абонентов и, во-вторых, наличие у абонентов соответствующих средств связи с ЭВМ для обращения к ней в любой момент времени.

Рассмотренные технологические процессы и режимы работы пользователей в системе "человек–машина" особенно четко проявляются при интегрированной обработке информации, которая характерна для современного автоматизированного решения задач в многоуровневых информационных системах.

1.6.5 Хранение информации

Хранение и накопление информации вызвано ее многократным использованием, применением постоянной информации, необходимостью комплектации первичных данных до их обработки; осуществляется на машинных носителях в виде информационных массивов, где данные располагаются по установленному в процессе проектирования группировочному признаку.

Хранение информации – это ее запись во вспомогательные запоминающие устройства на различных носителях для последующего использования.

Хранение является одной из основных операций, осуществляемых над информацией, и главным способом обеспечения ее доступности в течение определенного промежутка времени.

Основное содержание процесса хранения и накопления информации состоит в создании, записи, пополнении и поддержании информационных массивов и баз данных в активном состоянии (рис. 1.16).

В результате реализации такого алгоритма документ, независимо от формы представления поступивший в информационную систему, подвергается обработке и после этого отправляется в хранилище (базу данных), где помещается на соответствующую "полку" в зависимости от принятой системы хранения. Результаты обработки передаются в каталог.

Этап хранения информации может быть представлен на следующих уровнях: внешнем, концептуальном (логическом), внутреннем, физическом.

Рис. 1.16. Алгоритм процесса подготовки информации к хранению

Внешний уровень отражает содержательность информации и представляет способы (виды) представления данных пользователю в ходе их хранения.

Концептуальный уровень определяет порядок организации информационных массивов и способы хранения информации (файлы, массивы, распределенное хранение, сосредоточенное и др.).

Внутренний уровень представляет организацию хранения информационных массивов в системе ее обработки и определяется разработчиком.

Физический уровень хранения означает реализацию хранения информации на конкретных физических носителях.

Способы организации хранения информации связаны с ее поиском – операцией, предполагающей извлечение хранимой информации.

Хранение и поиск информации являются не только операциями над ней, но и предполагают использование методов осуществления этих операций. Информация запоминается так, чтобы ее можно было отыскать для дальнейшего использования. Возможность поиска закладывается во время организации процесса запоминания. Для этого используют методы маркирования запоминаемой информации, обеспечивающие поиск и последующий доступ к ней и применяемые для работы с файлами, графическими базами данных и т. д.

Маркер (mark, marker) – метка на носителе информации, обозначающая начало или конец данных либо их части (блока).

В современных носителях информации используются маркеры:

- адреса (адресный маркер) – код или физическая метка на дорожке диска, указывающие на начало адреса сектора;

- группы – маркер, указывающий начало или конец группы данных;

- дорожки (начала оборота) – отверстия на нижнем диске пакета магнитных дисков, указывающие физическое начало каждой дорожки пакета.

- конца файла – метка, используемая для указания окончания считывания последней записи файла;

- ленты (ленточный маркер) – управляющая запись или физическая метка на магнитной ленте, обозначающая признак начала или конца блока данных или файла;

- сегмента – специальная метка, записываемая на магнитной ленте для отделения одного сегмента набора данных от другого.

Хранение информации в ЭВМ связано с процессом ее арифметической обработки и с принципами организации информационных массивов, поиска, обновления, представления информации и др.

Важным этапом автоматизированного этапа хранения является организация информационных массивов.

Массив (от англ. array) – упорядоченное множество данных.

Информационный массив – система хранения информации, включающая представление данных и связей между ними, т. е. принципы их организации.

С учетом этого рассматриваются следующие структуры организации информационных массивов: линейная, многомерная.

В свою очередь, линейная структура данных делится на строки, одномерные массивы, стеки, очереди, деки и др.

Строка – это представление данных в виде элементов, располагающихся по признаку непосредственного следования, т. е. по мере поступления данных в ЭВМ.

Одномерный массив – это представление данных, отдельные элементы которых имеют индексы, т. е. поставленные им в соответствие целые числа, рассматриваемые как номер элемента массива.

Индекс обеспечивает поиск и идентификацию элементов, а следовательно, и доступ к заданному элементу, что облегчает его поиск по сравнению с поиском в строке.

Идентификация – процесс отождествления объекта с одним из известных объектов.

Стек – структура данных, учитывающая динамику процесса ввода-вывода информации, использующая линейный принцип организации хранения, реализующий процедуру обслуживания "последним пришел – первым ушел" (первым удаляется последний поступивший элемент).

Очередь – структура организации данных, при которой для обработки информации выбирается элемент, поступивший ранее всех других.

Дека – структура организации данных, одновременно сочетающая рассмотренные виды.

Нелинейные структуры хранения данных используют многомерные структуры (массивы) следующих видов: деревья, графы, сети.

Элемент многомерного массива определяется индексом, состоящим из набора чисел. Формой представления прямоугольного массива является матрица, каждое значение которой определяется индексом требуемого элемента массива. Так, в двухмерном массиве элементы обозначаются двумя индексами, а в трехмерном – тремя.

Массивы по своей структуре близки к файлам и отличаются от последних двумя основными признаками:

- каждый элемент массива может быть явно обозначен, и к нему имеется прямой доступ;

- число элементов массива определяется при его описании.

Организация хранения данных в многомерном массиве может быть представлена в виде логических структур информационных массивов. В этих массивах структуры данных компонуются в виде записей, располагающихся различным образом. С учетом этого выделяют следующие основные структуры информационных массивов: последовательную, цепную, ветвящуюся, списковую.

В последовательной структуре информационного массива записи располагаются последовательно, нахождение требуемой записи осуществляется путем просмотра всех предшествующих. Включение новой записи в информационный массив требует смещения всех записей, начиная с той, которая добавляется. Обновление информационных массивов при последовательной структуре требует перезаписи всего массива.

В цепной структуре информационные массивы располагаются произвольно. Для логической связи отдельных записей необходима их адресация, т. е. каждая предыдущая запись логически связанного информационного массива должна содержать адрес расположения последующей записи. Если с определенного уровня, значения в записях повторяются в различных сочетаниях, то в целях экономии памяти возможен переход от цепной структуры к ветвящейся.

В ветвящейся структуре информационного массива сначала размещается запись, отображающая признак объекта с небольшим числом значений, далее они повторяются в записях в различных сочетаниях. Это дает возможность перейти от некоторой основной записи к другим в зависимости от запроса, не повторяя основную запись.

Чтобы устранить повторяющиеся записи и соответствующие им поля из памяти, их удаляют из основного массива и объединяют в дополнительный небольшой информационный массив. В нем записи упорядочиваются по какому-либо признаку без повторений, тогда в основном массиве вместо удаленного информационного поля указываются адреса записей, размещенных в дополнительном массиве. Данная структура является удобной при реорганизации информационной базы, поскольку повторяющиеся записи легко могут быть заменены, так как хранятся в дополнительном массиве, основной массив подвергается при этом незначительным изменениям. Однако эта структура требует дополнительного объема памяти.

Списковая структура информационных массивов характеризуется наличием списка, который содержит набор данных, определяющих логический порядок организации информационного массива.

Список включает имя и адрес поля данных. В памяти ЭВМ элементы списка физически разнесены, но связаны друг с другом логически за счет адресных ссылок.

Поле данных в зависимости от характера хранимой информации может быть выражено двоичным разрядом, словом фиксированной либо переменной длины, а также набором отдельных слов.

Формализовано список может быть реализован в виде таблицы, где имена списка и поля данных сопоставлены с адресами, выбранными произвольно по мере наличия свободных мест в запоминающем устройстве. В случае необходимости повторений какой-либо информации рекомендуется многократно обращаться по адресу, который может входить в несколько списков, т. е. применить механизм многократных адресных ссылок.

Списковая структура с механизмом адресных ссылок может быть представлена в виде графа древовидной структуры. В нем каждый элемент списка включает в себя маркерное поле, поле данных и адресное поле. Маркерное поле предупреждает, имеется ли ссылка на другой список или она отсутствует. В зависимости от этого в маркерном поле ставится знак минус или плюс.

Списки так же могут быть показаны ориентированными графами с полями, в которых возможна ссылка вперед и назад. Возникает так называемый симметричный список, и появляется возможность движения в структуре данных в разных направлениях.

Рассмотренные списковые структуры информационных массивов имеют следующие особенности:

- высокую логическую простоту;

- относительно большое количество времени доступа, обусловленное адресным обращением к данным, при котором к каждому элементу списка необходимо иметь ссылку;

- значительное возрастание объема памяти запоминающего устройства по сравнению с последовательной структурой организации информационных массивов, обусловленное адресным обращением к данным.

С учетом рассмотренных структур формирования информационных массивов можно представить ряд способов организации массивов (рис. 1.17) в запоминающих устройствах ЭВТ.

Рис. 1.17. Способы организации массивов информации в запоминающем устройстве ЭВТ

На физическом уровне любые записи информационного поля представляют в виде двоичных символов. Обращение к памяти большого объема требует большой длины адреса. Если память имеет емкость 2n слов, то для поиска таких слов потребуются n-разрядные адреса. В микропроцессорах восьмиразрядные слова дают возможность обращаться к 256 ячейкам памяти, что оказывается недостаточно для хранения информации в автоматизированных системах. Если непосредственно обращение к любой ячейке невозможно, переходят к страничной организации памяти.

В этом случае выбирают область памяти емкостью 2n слов и называют страницей, обращение к которой осуществляется командой, содержащей n-разрядное адресное поле. В микропроцессорах обычно используют страницы размером 256 слов.

Принципы адресации, объемы памяти, количественные характеристики зависят от функционального назначения запоминающих устройств, разделяющимся по уровням функциональной иерархии на сверхоперативные, оперативные, постоянные, полупостоянные, внешние, буферные.

С хранением информации связаны следующие понятия: носитель информации (память), внутренняя память, внешняя память, хранилище информации.

Носитель информации – это физическая среда, непосредственно хранящая информацию. Основным носителем информации для человека является его собственная биологическая память (мозг), которую можно назвать оперативной (быстрой) памятью или внутренней памятью, поскольку ее носитель находится внутри нас.

Другие носители информации можно назвать внешними (по отношению к человеку), например бумага, которая, непригодна в обычных (не специальных) условиях для длительного хранения информации: на нее оказывают вредное воздействие температурные условия.

Для ЭВТ по материалу изготовления различают бумажные, металлические, пластмассовые, комбинированные и другие носители; по принципу воздействия и возможности изменения структуры выделяют магнитные, полупроводниковые, диэлектрические, перфорационные, оптические и др.; по методу считывания различают контактные, магнитные, электрические, оптические. Хранение информации осуществляется на специальных носителях.

Особое значение при построении информационного обеспечения имеют характеристики доступа к информации, записанной на носителе, которые бывают прямого и последовательного доступа. Пригодность носителя для хранения информации оценивается такими параметрами, как время доступа, емкость памяти и плотность записи. Хранение больших объемов информации оправдано только при условии, если поиск нужной информации можно осуществить достаточно быстро, а сведения получить в доступной форме.

Хранилище информации – это определенным образом организованная информация на внешних носителях, предназначенная для длительного хранения и постоянного использования, например архивы документов, библиотеки, справочники, картотеки. Основной информационной единицей хранилища является определенный физический документ: анкета, книга, дело, досье, отчет и пр. Под организацией хранилища понимается наличие определенной структуры, т. е. упорядоченность, классификация хранимых документов. Она необходима для удобства ведения хранилища: пополнения новыми документами, удаления ненужных, поиска информации и т. д.

Основные свойства хранилища информации: объем хранимой информации, надежность хранения, время доступа (т. е. время поиска нужных сведений), наличие защиты информации.

Информацию, хранимую на устройствах компьютерной памяти, принято называть данными. Для описания хранения данных используют те же понятия: носитель, хранилище данных, организация данных, время доступа, защита данных. Организованные хранилища данных на устройствах внешней памяти компьютера принято называть базами данных и банками данных.

Таким образом, хранение информации представляет собой процесс передачи информации во времени, связанный с обеспечением неизменности состояния материального носителя.

1.6.6 Системы хранения данных

В последнее время применение компьютерной техники претерпевает значительные изменения, связанные с переходом к созданию интегрированных (объединенных) информационных систем, предназначенных осуществлять согласованное управление данными в пределах предприятия (организации), координировать работу отдельных подразделений, автоматизировать операции по обмену информацией как в пределах отдельных групп пользователей, так и между несколькими организациями, отстоящими друг от друга на десятки и сотни километров. Основой для построения подобных систем служат локальные вычислительные сети (ЛВС). Их характерной чертой является предоставление пользователям возможности работать в универсальной информационной среде с функциями коллективного доступа к данным.

Рост объемов данных, возросшие требования к надежности хранения и быстродействию доступа к данным делают необходимым выделение средств хранения в отдельную подсистему вычислительного комплекса – систему хранения данных. Роль и важность ее определяются постоянно возрастающей ценностью информации в современном обществе, возможность доступа к данным и управления ими является необходимым условием для успешного выполнения информационных процессов.

Система хранения данных предназначена для организации их надежного хранения, а также отказоустойчивого, высокопроизводительного доступа серверов к устройствам хранения. В настоящее время объем и стоимость обрабатываемой информации с каждым годом увеличиваются и, как следствие, повышаются требования по надежности, доступности и совокупной стоимости владения используемых систем хранения данных. Помимо высоких показателей производительности, доступности и низкой стоимости необходимо обеспечить требуемую функциональность – объем хранения и число подключаемых серверов.

Дисковые массивы сегодня являются основными устройствами хранения данных, однако обработка информации, формирование логической структуры ее хранения (дисковых томов и файловых систем) осуществляется на серверах. В процесс доступа к данным, помимо процессоров и памяти сервера, вовлечены установленные в нем адаптеры (Host Bus Adapter – HBA), работающие по определенному протоколу, драйверы, обеспечивающие взаимодействие HBA с операционной системой, менеджер дисковых томов, файловая система и менеджер памяти операционной системы.

Если дисковый массив выполнен в виде отдельного устройства, то для его подключения к серверам используется определенная инфраструктура. В зависимости от протокола доступа (транспорта), реализованного в HBA и дисковом массиве, она может быть как простой шиной (протокол SCSI), так и сетью (протокол Fibre Channel (FC)). Если это сеть, то в ней используется активное оборудование – концентраторы и коммутаторы, работающие по протоколу FC, маршрутизаторы протокола FC в другие протоколы (обычно в SCSI). Таким образом, помимо устройств хранения данных в состав СХД необходимо еще добавить инфраструктуру доступа, связывающую серверы с устройствами хранения.

Сетевой инфраструктурой, объединяющей большое количество серверов и устройств хранения, необходимо управлять и отслеживать ее состояние. Это реализуется "подручными" средствами – встроенными утилитами серверов, массива и операционной системы, бесплатными утилитами или "самописными" скриптами. Каждое из устройств в СХД имеет несколько объектов, требующих управления и контроля состояния, например дисковые группы и тома у массивов, порты у массивов и коммутаторов, адаптеры в серверах. Как только число объектов управления в СХД начинает исчисляться десятками, управление такой конфигурацией отнимает у администраторов слишком много времени и сил и неизбежно приводит к ошибкам. Справиться с такой задачей можно, только используя полномасштабную систему управления.

Система хранения данных должна включать следующие подсистемы и компоненты:

1. Устройства хранения данных: дисковые массивы и ленточные библиотеки. Современные высокопроизводительные дисковые массивы используют технологию Fibre Channel для подключения к ним серверов и доступа к дискам внутри массива. Они могут масштабироваться до десятков терабайт дискового пространства и обладают встроенным интеллектом для выполнения специальных функций: виртуализации дискового пространства, разграничения доступа к дисковому пространству, создания Point-In-Time (PIT) копий данных и репликации данных между массивами. К устройствам хранения данных также относятся ленточные, магнитооптические и CD/DVD библиотеки.

2. Инфраструктуру доступа серверов к устройствам хранения данных, которая создается в настоящее время на основе технологии "сеть хранения данных" (Storage Area Network – SAN). SAN является высокопроизводительной информационной сетью, ориентированной на быструю передачу больших объемов данных.

В основе концепции SAN лежит возможность соединения любого из серверов с любым устройством хранения данных, работающим по протоколу Fibre Channel. Сеть хранения данных образуют волоконно-оптические соединения, Fibre Channel Host Bus Adapters (FC-HBA) и FC-коммутаторы, обеспечивающие в настоящее время скорость передачи 200 Мбайт/с и удаленность между соединяемыми объектами до нескольких десятков километров.

3. Систему резервного копирования и архивирования данных, предназначенную для создания резервных копий и восстановления данных. Она позволяет защитить данные от разрушения не только в случае сбоев или выхода из строя аппаратуры, но и в результате ошибок программных средств и пользователей.