ЭТАПЫ СОЗДАНИЯ БАЗЫ И БАНКА ДАННЫХ
Быстрое развитие информационных потребностей прикладных систем требует разнообразных подходов к созданию сложных и простых баз данных различной сложности. Сложность базы определяется объемами и структурой информатизации, разнообразием ее видов, множественностью связей между файлами, требованиями к производительности и надежности. Среди возможных вариантов создания рассмотрим наиболее распространенные подходы к созданию базы данных средней сложности.
Организация данных в базе требует предварительного моделирования, т. е. построения логической модели данных. Главное назначение логической модели данных — систематизация разнообразной информации и отражение ее свойств по содержанию, структуре, объему, связям, динамике с учетом удовлетворения информационных потребностей всех категорий пользователей. Построение логической модели ведется по этапам с постепенным приближением к оптимальному варианту в рамках конкретных условий.
Полезность и эффективность логической модели зависят от степени отображения ею моделируемой предметной области. Предметная область включает объекты (например, клиентов, их счета, документы, операции и т.д.), их свойства и характеристики, взаимодействие и процессы над ними.
При построении базы данных на этапе создания ее логической модели сначала выявляются объекты, процессы или сущности предметной области, которые могут представлять интерес для пользователя. Например, объектами могут быть предприятия, вкладчики, банки и т.д. Для каждого объекта выделяется набор характеризующих его свойств (полей, реквизитов). Так, для вкладчика — физического лица это могут быть: фамилия, имя, отчество, адрес, паспортные данные, место работы, вид вклада, сумма вклада и т.д. Для организации — ее наименование, адрес, расчетный счет, название банка и прочие.
Принятие решения о том, какая информация должна содержаться в БД, связано не только с определением предметной области или круга обслуживаемых задач, но и с интенсивностью работы с различными видами информации, их динамическими характеристиками, частотой корректировки, степенью взаимосвязи и взаимодействия между ними.
Практически большинство пользователей заинтересовано не в целой модели данных, а только в ее части. Например, бухгалтера не будут интересовать данные о вкладчиках банка — физических лицах. Поэтому в ряде случаев должна быть обеспечена возможность выделения части данных (подмодели, локальной модели). Подмодель можно рассматривать как ограничение общей модели до уровня интересов (применений) конкретного пользователя или группы пользователей.
Автоматизацию работы базы данных обеспечивает СУБД, которая манипулирует с конкретной моделью организации данных на носителе. При построении логической модели данных выбирается один из трех подходов моделирования: иерархический, сетевой, реляционный.
Иерархическая модель имеет структуру в виде дерева и выражает вертикальные связи подчинения нижнего уровня высшему. Это облегчает доступ к необходимой информации, но только при условии, что все запросы имеют древовидную структуру.
Сетевая модель является более сложной и отличается от иерархической модели наличием горизонтальных связей. Направления этих связей не являются однозначными, что усложняет модель и СУБД.
Реляционная модель представляется в виде совокупности таблиц, над которыми выполняются операции, формулируемые в терминах реляционной алгебры. Достоинством модели является сравнительная простота инструментальных средств ее поддержки, недостатком — жесткость структуры данных и зависимость скорости работы от размера базы данных. К настоящему времени наибольшее распространение получили реляционные модели. В них все компоненты связаны между собой определенными отношениями. Каждый тип модели имеет свои достоинства и недостатки. Одним из основных достоинств реляционной модели является простота понимания ее структуры.
Моделирование базы данных ведется поэтапно, при этом выделяется несколько уровней абстракции, каждому из которых соответствует свой вариант модели. Необходимость выделения нескольких уровней абстракции определяется сложностью процесса отображения предметной области в базе данных. Привязку логической модели к программным и техническим средствам называют физической моделью базы данных. Она и дает конечное материализованное воплощение процессов создания базы данных.
После выбора окончательного варианта логической модели определяется вся совокупность показателей и реквизитов, необходимых и достаточных для решения обозначенного круга задач, формируются файлы, в которых выделяется ключевое поле (реквизит) для взаимодействия с другими файлами. Далее устанавливается тип данных и разрядность каждого поля, количество записей в файлах и другие характеристики.
Рассмотрим пример: в банке готовится задача компьютерного учета вклада «Срочный депозит». Для этой задачи создается подмодель базы данных. Эти данные должны включать сведения о вкладчике, данные по учету поступления и выбытию средств по вкладам, сведения для начисления процентов по вкладам. Все эти данные удобно поделить на реляционные таблицы или файлы. В одной таблице будут содержаться данные о вкладчиках: фамилия, имя, отчество, год рождения, серия и номер паспорта, дата выдачи и кем выдан паспорт, адрес постоянного места жительства, наименование вида вклада, номер счета, дата открытия счета, остаток денежной суммы. Вторая таблица будет содержать сведения о движении денежных средств по вкладам. Например, номер счета, фамилия вкладчика, дата проведения операции по вкладу, взнос денежной суммы или снятие ее.
Первая и вторая таблицы связаны через общий реквизит — номер счета. Он позволяет в данных о движении денежных сумм не указывать подробные сведения о вкладчике, которые хранятся в первой таблице.
Затем для каждого реквизита определяется тип данного и его длина. При вводе или корректировке сведений в созданной базе СУБД должна автоматически контролировать тип вводимых данных (не позволяя, например, вводить буквы в поле, определенное как числовое). Кроме того, данные контролируются на соответствие по длине и количеству знаков после точки. То есть если вводится символьное значение длиннее, чем описано в структуре, то это данное будет обрезано до указанной длины справа. При вводе даты проверяется ее соответствие формату даты. В числовом данном автоматически добавляются знаки после точки.
В приведенном примере длину (разрядность) данных определить несложно. Берется максимальная значность для каждого числового реквизита, для текстовых реквизитов можно предусматривать небольшие сокращения, не искажающие смысла данных.
Как правило, приходится при построении БД определять размер текстового поля, когда его длина заранее не известна. Например, планируется машинный учет договоров с клиентами банка. Длина текста договора может быть различной в зависимости от предоставляемых услуг и специфики данного клиента. В этой ситуации заранее жестко определить длину договора невозможно, лишнее место на диске отводить также нерентабельно. В этом случае и используется поле памяти. В частности, создается файл базы данных по учету договоров с клиентами, содержащий следующие реквизиты или поля: номер договора, дата заключения, наименование клиента, предмет договора, текст договора. Для всех реквизитов, кроме текста договора, определить тип и длину записей не представляет трудности. Для поля с текстом договора указывается дополнительно поле памяти, длина которого 10 символов. Предположим, что файл БД с данными договоров назвали DOGOVOR.DBF. После указания типа поля на диске создается второй файл с тем же именем, но с расширением DOGOVOR.DBT. В нем и будут содержаться тексты договоров любой необходимой длины, а в 10 символах в поле памяти основного файла будет храниться адрес расположения соответствующего текста в файле DBT. Таким образом, первый основной файл БД для этой задачи содержит только каталог или оглавление к текстовому файлу, что облегчает работу с ним. Аналогичный принцип реализуется при создании различных справочно-поисковых систем.
Средства современных СУБД позволяют выполнять поиск в базе данных как через файл-оглавление, так и прямо, обращаясь к тексту файла DBT. Запрос может содержать, например, название организации или какое-то ключевое слово из текста, по которому СУБД будет просматривать все тексты подряд до нахождения соответствующего запросу текста.
Документирование результатов проектирования базы и банка данных выполняется по завершении каждого этапа проектирования, а его выводы и рекомендации по эксплуатации обработки находятся в соответствующих разделах технорабочего проекта. Рассмотрим эти этапы применительно к созданию внутримашинного информационного обеспечения для компьютерных систем среднего и крупного класса.
Проектированию ИО предшествует предпроектная стадия, которая включает сбор материалов в процессе обследования, оформление их в виде технического задания. В них обосновывается целесообразность создания банка и базы данных. В качестве основных факторов раскрываются и приводятся следующие:
• многоцелевое использование данных;
• обеспечение многопользовательского доступа к данным в диалоговом режиме;
• наличие сложных связей между данными;
• необходимость поддержания системы в актуальном состоянии.
Материалы, содержащие выводы и предложения по созданию банка и базы данных, исходя из конкретных условий и возможностей, включаются в технико-экономическое обоснование проекта и служат основанием для формирования технического задания на разработку системы банка данных, оно является частью общего технического задания на проектирование компьютерной системы. В нем ставятся цели и круг решаемых проблем, оговариваются масштабы и сферы деятельности системы, глобальные ограничения.
На стадии технического проектирования результаты разработок и проектных решений оформляются в виде технического проекта. Он включает общие вопросы: такие, как определение конфигурации вычислительных средств, создание логической модели базы данных, ее уточнение и доводка в виде моделей других уровней, выбор операционной системы и СУБД, физическое проектирование. Затем разрабатываются конкретные пользовательские применения БД, определяются подмодели, доступные каждому из пользователей.
Технический проект является основным проектным документом, в котором приводятся разработки и их описания по всем компонентам создаваемого банка данных. При моделировании базы данных используются различные методы и средства, ориентированные на выбор конкретной СУБД. Сюда же относятся и предбазовые процессы подготовки информации и работы с ней, определение технологических особенностей по всем процессам, возникающим в результате создания и внедрения банка данных. В техническом проекте отражаются организационные изменения, связанные с работой технических и программных средств, с новой организацией информации.
На этапе рабочего проектирования доводятся и детализируются решения технического проекта. Рабочий проект имеет ту же структуру, что и технический, но с более глубокой проработкой и проверкой. На этом этапе выполняется сбор и предварительная подготовка нормативно-справочных материалов, разработка должностных, технологических инструкций для работы в условиях новой информационной технологии.
На этапе внедрения проекта выполняется проверка проектных решений и их доводка, при необходимости дорабатывается технология работы с банком данных, пользователями, выполняется перераспределение обязанностей, устанавливаются категории и иерархия доступа пользователей к данным.
Использование технологии базы и банка данных ставит вопросы дальнейшего развития компьютерных информационных систем: их реорганизацию, подключение новых пользователей, предоставление новых информационных услуг.
Более простые варианты построения базы данных ориентированы на решение менее сложных задач, на персональные компьютеры и персональные СУБД, на меньшие объемы данных и их несложную структуру. Современные СУБД предоставляют возможность пользователям быстро и удобно создавать несложные базы данных.
Технология создания баз данных с помощью типовых инструментальных средств, рассчитанных на массового пользователя-непрограммиста, предоставляется СУБД Microsoft Access. Несмотря на ориентированность на конечного пользователя, в Access присутствует язык программирования, имеется возможность интеграции с другими программными средствами Microsoft Office. Access — это популярная настольная система управления базой данных, рассчитанная на одного пользователя. В то же время на небольшом предприятии (при объеме данных до 1 Гбайта) с количеством компьютеров не более 10 ресурсов Access вполне может хватить для обслуживания всего делопроизводства вместе со средствами Microsoft Office. Все пользователи могут обращаться к одной базе данных, установленной на одном компьютере, который может не быть сервером.
Проблемы сохранности и доступа к данным решаются с помощью использования средств защиты, которые предоставляет Access. Главными особенностями Access среди других технологий создания баз данных является направленность на конечного пользователя (непрограммиста), сохранение общего подхода, принятого в построении всех продуктов Microsoft для Windows, массовость использования.
В Access для работы с данными используются процессор баз данных, средства быстрого построения интерфейса (Конструктор форм и отчетов), объекты доступа и манипулирования данными (таблицы, формы, запросы, отчеты, макрокоманды, макросы, модули). Автоматизация типовых рутинных операций выполняется с помощью готовых визуальных средств или макрокоманд, объединяемых в макросы. Таким образом, пользователи Access могут обратиться к созданию процедур и функций для работы с данными. При этом, если недостает возможностей визуальных готовых средств, обращаются к макрокомандам, а если и их возможностей недостаточно, можно использовать язык программирования. Он позволяет создавать свои массивы, типы данных, функции, приложения. Имеется возможность целиком создать базу данных с помощью программирования, когда в этом появляется необходимость.
Создание новой базы данных начинается с запуска Access и появления диалогового окна. Выбор опции Запуск мастера приводит в окно Создание. Далее для создания базы можно использовать шаблоны. Чтобы обратиться к списку шаблонов, необходимо перейти на вкладку Базы данных. Создаются базы данных выбором из определенного списка. При этом возможен выбор таблиц, а в таблицах — нужных полей. После этого пользователь получает базу данных с таблицами, формами ввода и вывода. В табл. 3.4 приведен список мастеров (программных модулей), имеющихся в Access. Дополнительно к перечисленным возможностям все созданные формы можно редактировать с помощью вспомогательных диалоговых окон. При первом знакомстве с Access такой способ создания баз данных весьма эффективен.
Технология ввода данных в базу допускает использование таблицы и формы, через которые обеспечивается работа только с одной строкой таблицы. Ввод с помощью формы позволяет располагать поля в нужном порядке, удобном для пользователя. Создание форм может выполнять пользователь сам или с помощью Мастера. Этапы создания формы включают выбор полей, внешнего вида, стиля и названия формы.
Работа с базой данных начинается с создания таблиц. Обращение к режиму Создать предоставляет возможность выбора одного из пяти вариантов технологии создания таблицы (табл. 3.5).
Таблица 3.4. Мастера СУБДAccess 7.0
Наименование | Назначение |
Мастер баз данных | Создает базы данных из определенного списка; возможен выбор необходимых таблиц и полей; создает формы и отчеты |
Мастер таблиц | Создает таблицы из списка уже готовых, которые можно изменить. Интересен только на начальном этапе использования таблиц, хотя определенный круг задач можно решить, применяя только таблицы, предоставляемые мастером |
Мастер простых форм | Создает простую форму, в которую выводятся выбранные пользователем поля из таблицы или запросы |
Мастер форм с диаграммой | Создает форму с диаграммой, отражающей данные для полей из таблиц и запросов, которые служат источником данных для форм |
Мастер форм со сводной таблицей Microsoft Excel | Создает форму, в которую включен объект «страница Excel со сводной таблицей |
Мастер построения кнопок | Создает кнопки в форме или отчете с выбранными вами свойствами и функциональностью |
Мастер построения групп | Создает группу переключателей, которая может содержать множество кнопок, флажков, выключателей |
Мастер построения списков | Создает списки на основе полей из таблиц и запросов, SQL выражений или предопределенного набора значений |
Мастер построения комбинированных списков | Создает комбинированные списки на основе полей из таблиц и запросов, SQL-выражений или заранее предопределенного набора значений |
Мастер построения подчиненных форм | Создает подчиненную форму, которая может служить аналогом объектов Grid или Browse в других системах управления данными |
Мастер создания отчета | Создает отчет, в который выводятся выбранные пользователем поля из таблицы или запрос, с возможностями установки группировки и сортировки |
Мастер создания наклеек | Позволяет создавать наклейки как стандартные, так и иных размеров |
Мастер создания отчетов с диаграммой | Позволяет выводить на печать диаграммы, внешний вид которых зависит от данных в таблице или запросе, являющихся источником данных для отчета |
Технология запросов к данным базы в большинстве строится программно, а в Access она выполняется визуально (за исключением сквозных запросов. Пользователь благодаря Access реализует разнообразные запросы выборки, при этом они могут модифицировать исходные данные. В этом заложены резервы ускорения работы с данными. Недостатком технологии Access является замедление скорости работы с данными при увеличении размеров таблиц.
Таблица 3.5. Способы создания таблиц в СУБДAccess 7.0
Способ создания | Описание |
Режим создания | Пользователю предоставляется таблица с тридцатью полями, куда необходимо ввести данные. После ее сохранения Access решает, какой тип данных присвоить каждому полю. Как недостаток этого способа следует отметить невозможность создать таблицу с полями примечаний |
Конструктор таблиц | После выбора этой операции открывается Конструктор таблиц, в котором пользователю необходимо самостоятельно создать поля, выбрать типы данных для полей, размеры полей и, если это необходимо, устанавливать свойства полей |
Мастер таблиц | Из определенного набора таблиц пользователь может создать таблицу по своему вкусу. Возможно, что некоторые таблицы целиком подойдут для данного приложения, следует их использовать, так как все средства хороши для того, чтобы побыстрее завершить проект |
Импорт таблиц | Позволяет импортировать данные из таблиц других приложений в базу данных. Новые таблицы теряют непосредственную связь с другими приложениями. В появившемся диалоговом окне необходимо выбрать тип файла и имя импортируемого файла. Тип файла ODBC позволяет импортировать данные практически любого формата |
Связь с таблицами | Очень похоже на предыдущий пункт, но при этом таблица остается в своем формате, т.е. может использоваться несколькими приложениями |
Пользователь непосредственно участвует в формировании запросов, не прибегая к услугам программиста.
Пользователь может направлять запросы в базу для добавления, удаления, обновления, создания таблиц. Запросы можно составить и программным путем. Одна из сильных сторон технологии Access-фильтры, которые позволяют выбирать информацию с помощью запросов или установкой критериев. Создание параметрических запросов дает возможность пользователю вводить значения для отбора данных.
Наряду с формами для каждой таблицы могут быть созданы отчеты с помощью меню клавиатуры или программным путем, что более трудоемко.
Для каждой таблицы можно создать Автоотчет с выводом данных в столбец. При создании отчета с выбором полей, но без вывода всех имеющихся в таблице или запросе данных, Асееве позволяет обратиться к Мастеру отчетов. Мастер отчетов помимо выбора полей группирует данные по какому-либо полю, устанавливает интервал группировки, порядок сортировки, диаграммы, макет отчета и его стиль. Для построения еще более сложных отчетов используется Конструктор отчетов.
Программное создание отчетов используется для построения собственных мастеров.
Технология выполнения разнообразных действий и функций с данными базы в среде Асееве осуществляется макрокомандами, которые объединяются в макросы. Задаваемые параметры придают этим действиям гибкость, которой иначе можно добиться только путем кропотливого программирования. Хотя сами макросы упрощают работу, их создание требует от пользователя затрат труда и времени. В Access имеется около пятидесяти макрокоманд.
Технологии создания баз данных для персональных компьютеров ориентированы на решение несложных задач с ограниченным объемом информации.
БАЗЫ ЗНАНИЙ
В развитии информационного обеспечения автоматизированных информационных технологий управления экономической деятельностью наибольший интерес представляют применения в области искусственного интеллекта. Одной из форм реализации достижений в этой области является создание экспертных систем — специальных компьютерных систем, базирующихся на системном аккумулировании, обобщении, анализе и оценке знаний высококвалифицированных специалистов — экспертов. В экспертной системе используется база знаний, в которой представляются знания о конкретной предметной области.
База знаний - это совокупность моделей, правил и факторов (данных), порождающих анализ и выводы для нахождения решений сложных задач в некоторой предметной области.
Выделенные и организованные в виде отдельных, целостных структур информационного обеспечения знания о предметной области становятся явными и отделяются от других типов знаний, например общих знаний. Базы знаний позволяют выполнять рассуждения не только и не столько на основе формальной (математической) логики, но и на основе опыта, фактов, эвристик, т.е. они приближены к человеческой логике.
Разработки в области искусственного интеллекта имеют целью использование больших объемов высококачественных специальных знаний о некоторой узкой предметной области для решения сложных, неординарных задач.
База знаний является основой экспертной системы, она накапливается в процессе ее построения. Знания выражаются в явном виде, позволяющем сделать явным способ мышления и решения задач, и организованы так, чтобы упростить принятие решений. База знаний, обусловливающая компетентность экспертной системы, воплощает в себе знания специалистов учреждения, отдела, опыт группы специалистов и представляет собой институциональные знания (свод квалифицированных, обновляющихся стратегий, методов, решений) (рис. 3.13).
Знания и правила работы можно рассматривать в различных аспектах:
• глубинные и поверхностные;
• качественные и количественные;
• приближенные (неопределенные) и точные (определенные);
• конкретные и общие;
• описательные и предписывающие.
Содержание базы знаний может быть применено пользователем для получения эффективных управленческих решений. На рис. 3.14 показана структура базы знаний и ее функционирование.
Рис. 3.13. Основные свойства базы знаний
Рис. 3.14. Технология использования базы знаний
Эксперт — это специалист, умеющий находить эффективные решения в конкретной предметной области.
Блок приобретения знаний отражает накопление базы знаний, этап модификаций знаний и данных. База знаний отражает возможность использования высококачественного опыта на уровне мышления квалифицированных специалистов, что делает экспертную систему рентабельной в соответствии с нуждами бизнеса и заказчика.
Блок логических выводов, осуществляя сопоставление правил с фактами, порождает цепочки выводов. При работе с ненадежными данными формируются нечеткая логика, слабые коэффициенты уверенности, низкая степень меры доверия и т.д.
Блок объяснений отражает в технологии использования базы знаний пользователем последовательность шагов, которые привели к тому или иному выводу с возможностью ответа на вопрос «почему».
К настоящему времени распространение баз знаний в значительной степени определяется темпом накопления профессиональных знаний.
Та область профессиональной человеческой деятельности, которая пока поддается формализации, а значит, и автоматизации на базе ЭВМ, — это небольшая часть накопленных человеком знаний.
В составе накопленных знаний огромный слой составляют индивидуально накапливаемые неотчуждаемые знания. Меньший объем составляют знания, которые доступны для традиционной передачи. И, наконец, едва различимые в общем объеме всех остальных знаний — это формализованные знания.
Структуризация или формализация знаний основана на различных способах представления знаний. В современных системах самый популярный способ использует факты и правила. Они обеспечивают естественный способ описания процессов в некоторой предметной области.
Правила обеспечивают формальный способ представления рекомендаций, указаний, стратегий. Они подходят в тех случаях, когда предметные знания возникают из опытных (эмпирических) ассоциаций, накопленных за годы работы по решению задач в данной области. Правила чаще всего выражаются в виде утверждений типа: Если... то... .
Описание предметной области в базе знаний предполагает разработку способов представления и организации знаний, методов формулирования, переформирования и решения задач. Понятия (объекты) предметной области представляются с помощью символов. Например, для банковской системы это могут быть: клиент, фондовый инструмент, операция, задача и т.д. Между символьными понятиями определяются отношения, применяются различные стратегии (логические или полученные в результате опыта) для манипулирования понятиями. Представление знаний, их структуризация предполагает выбор понятий, сложных, неординарных задач. Поэтому и правила в базе знаний бывают либо сложными, либо множественными и объемными.
Развитие концепции баз знаний связано с исследованиями и достижениями в области систем искусственного интеллекта. Области применения баз знаний и систем на их основе расширяются. Создается целый спектр баз знаний — от небольших по объему для портативных систем до мощных, предназначенных для профессионалов, эксплуатирующих сложные и дорогие АРМ. Очень большие базы знаний хранятся в централизованных хранилищах, доступ к которым осуществляется через сети пользователями различных систем, уровней, масштабов и т.д. Успехи в разработке баз знаний сделают их доступными для массового пользователя, что будет способствовать их появлению как актуального коммерческого продукта.
Дата добавления: 2020-12-11; просмотров: 436;