Организация сбора данных о надёжности ПО и аппаратуры
Разрабатываемые проекты систем ПО являются потенциальным источником огромного объёма полезной информации [20, с. 274], сбор и анализ которой может служить основой для повышения надёжности. В хорошо организованных проектах систем всегда существуют те или иные механизмы сбора данных о свойствах ПС. Примерами таких механизмов могут служить документы, оформляемые в процессе осуществления управления конфигурацией ПО в период испытаний, а также «Уведомления о проблемах», журналы испытаний и др. [20, с. 308].
Рисунок 2.1 – Примерная форма «Уведомления о проблеме» по состоянию на 1978 год
Типичная схема процесса разработки ПО (по состоянию зарубежной стандартизации на 1978 год) показана на рис. 2.2, где отмечены стадии, на которых могут стать доступными данные различного типа.
Рисунок 2.2 – Типичная схема процесса разработки ПО (по состоянию зарубежной стандартизации на 1978 год)
Из рис. 2.2 видно, что «Уведомления о проблемах» могут появляться в любой фазе цикла разработки, за исключением фазы кодирования и отладки [20, с. 277]. Однако все эти фазы имеют незначительную длительность по сравнению с длительностью эксплуатации, поэтому самый большой объём информации о надёжности КС, включая их аппаратную и программную части, может быть собран на этапе эксплуатации.
Простои КС за счёт их отказов и по другим причинам наносят большой экономический ущерб: во время простоя продукция не выпускается, информация не обрабатывается и т. д. Самый несложный и малозатратный способ борьбы с простоями – это проведение наблюдений за фактической надёжностью СВТ и ПО во время эксплуатации, т. е. сбор данных о простоях, например, регистрация их в специальных журналах (ручных или частично или полностью автоматизированных), после чего данные журналов обрабатываются и на основе их анализа составляется план мероприятий по снижению числа простоев. В случае простоев за счёт отказов такой план именуют программой повышения надёжности, фрагмент которой показан на рис. 2.3.
Рисунок 2.3 – Примерная форма фрагмента программы повышения надёжности
Примером высококачественной работы по наблюдениям за отказами СВТ и ошибками ПО служит статья начальника управления программно-технической инфраструктуры платежной системы Нацбанка РБ (сложнейшей КС со сложнейшими аппаратной и программной частями) А. А. Ильина [22]. А. А. Ильин пишет:
«…Нацбанк РБ большое внимание уделяет совершенствованию функционирования программно-технических комплексов платежной системы с целью своевременного выявления и устранения сбоев и отказов в обслуживании межбанковских расчетов (МБР). Проводимые мероприятия позволили в 5 раз снизить число отказов системы за 07-12.2001 года по сравнению 01-06.2001. В то же время за 2001 год зафиксированы 19 отказов системы по техническим причинам, что заставило для выполнения всего объема работы продлить общее время функционирования системы на 19 часов. Советом директоров Нацбанка утвержден РД «АС МБР. Общие требования к обеспечению непрерывной работы и восстановлению работоспособности участников в АС МБР». РД обязывает банки иметь технические средства для обеспечения работоспособности системы в случае возникновения сбоев…».
Сбор данных о простоях ведётся практически в каждой организации республики. В зависимости от сложности и важности задач, которые обеспечивает техника, сбор данных может быть ПРОСТЕЙШИМ (заполнение вручную оперативного журнала и карточек учёта повреждений в узлах связи служб телекоммуникаций и связи предприятий «Белэнерго» [23] или полностью автоматизированным (системы контроля работоспособности оборудования Нацбанка РБ) [22].
Хорошо известны и описаны промежуточные между вышеотмеченными ПОЛУАВТОМАТИЗИРОВАННЫЕ технологии сбора данных (ведение аппаратного журнала для компьютера в среде Microsoft Office Eхcel в БГУИР (об этом в [24]), ведение базы данных по учёту ремонтов технических средств в среде Microsoft Office Access в ОАО «Белтрансгаз» (об этом в [25]).
Для ОСОБО ОТВЕТСТВЕННЫХ объектов (например, военная авиация) может использоваться особо сложная автоматизированная система управления процессом технической эксплуатации авиатехники, способная резко повысить боеготовность военно-воздушных сил (об этом – в [26, 27]).
Результаты проведения наблюдений и внедрения составленных по этим результатам программ повышения надёжности ведут к ощутимому снижению числа и длительности простоев КС. Таким образом, целью проведения наблюдений за работой КС во время эксплуатации является повышение надёжности техники за счёт использования данных наблюдений.
Самое большое внимание проведению наблюдений за работой КС во время эксплуатации должны уделять специализированные предприятия по ремонту техники, а также специализированные подразделения по ремонту оборудования отдельных предприятий, в которых число ремонтников достаточно велико (50 и выше). Пример – фирмы по ремонту кассовых суммирующих аппаратов (КСА), которые из-за наличия фискальной памяти представляют собой довольно сложные компьютерные системы. Рассмотрим, как ведутся названные наблюдения в республиканском унитарном предприятии «Торгтехника». Здесь разработаны специальные формы первичного учёта отказов. Примером такой формы может быть «Технический паспорт кассового аппарата» (далее – техпаспорт), ведущийся в Центре технического обслуживания КСА (далее сокращённо – ЦТО) «Торгтехника»,, г. Минск.
В табл. 2.1 показана форма «Сведения о ремонтно-профилактических работах» техпаспорта КСА, заполняемая ЦТО УП «Торгтехника».
Таблица 2.1 – Форма «Сведения о ремонтно-профилактических работах» техпаспорта КСА, заполняемая ЦТО УП «Торгтехника»
Дата и время | Описание | Номер послед- него чека | Дата и время | ФИО эл.мех. | |||
вызова эл.мех. | начала ремонта | осмо-тра | выполне-нной работы | отправ-ления в ремонт | возврата из ремонта | ||
Недостатки формы табл. 2.1:
1) При устранении отказа собственными силами э/м должен сделать отметку в разделе 4 «Сведения о ремонтно-профилактических работах» техпаспорта. Как показал анализ этого раздела, отметок об устранении отказа собственными силами электромеханики не делают. Это говорит не о том, что таких работ не было, а о спешке э/м, который попросту экономит своё время.
2) Нигде не записаны времена начала переходов, кроме первого. Описание осмотра и ремонта сделано кратко и неинформативно, суммарную длительность ремонта, включая его ожидание и простой после проведения первого осмотра, рассчитать нельзя.
3) Главное: при отправлении в ремонт в ЦТО при невозможности устранении отказа собственными силами э/м никаких сведений о ремонте (время ожидания ремонта в ЦТО, сущность ремонта – установленная причина отказа, сведения о выполненных работах и заменённых деталях) в разделе 4 «Сведения о ремонтно-профилактических работах» техпаспорта не делает, потому что столбцы в табл. 2.1 для этого не предусмотрены.
Для устранения вышеуказанных недостатков в лабораторной (для вечерников) и в контрольной (для заочников) работах используется аппаратный журнал, предложенный в [24] и представляющий собой книгу Excel, которая состоит из 5 листов:
– лист 1 (титульный лист аппаратного журнала, куда заносятся сведения о наблюдаемой КС),
– лист 2 (журнал-1, журнал учёта наработок и простоев),
– лист 3 (журнал-2, журнал учёта отказов, ошибок, сбоев и восстановлений),
– лист 4 (дополнение к журналу–2, первичный анализ отказов),
– лист 5 (журнал-3, журнал учёта техобслуживания).
Формы аппаратного журнала приведены в лабораторной и контрольной работах. Такие журналы должны вестись на каждую КС. В начале журнала указывается инвентарный и заводской номер оборудования, место эксплуатации, условия и режимы эксплуатации, сведения о том, кто заполняет журнал и кто контролирует заполнение и др. сведения. Возможно, на некотором конкретном предприятии понадобится приказ по предприятию на проведение наблюдений.
Оценка фактической безотказности и ремонтопригодности КС ведётся с помощью «Экселя», листы журналов для этого приспособлены (в них вставлены формулы, например:
=($D13-$B13)*60+$E13-$C13),
только в конце каждого листа надо сделать строку «Итого». Данные строки «Итого» будут представлять собой аргументы формулы (подробнее – в лабораторной и контрольной работах).
Заполненные журналы передаются для анализа. Этот анализ включает:
– работы по оценке показателей фактической безотказности и ремонтопригодности КС (заметьте, что при аналитическом расчёте надёжности рассчитывалась только безотказность, о ремонтопригодности даже не упоминалось),
– анализ отказов, ошибок и других неполадок, выявленных в период наблюдений. Такой анализ выполняется разработчиками с целью устранения причин возникновения конструкционных отказов, изготовителями с целью устранения производственных отказов, эксплуатационниками с целью устранения эксплуатационных отказов.
Результаты анализа оформляются в виде утверждаемого документа «Анализ фактической надёжности». Главным в АФН является не расчёт фактической безотказности и ремонтопригодности СВТ и ПО, а анализ отказов и ошибок. По результатам анализа может составляться и утверждаться ПОН – программа обеспечения надёжности на различных этапах ЖЦИ, а также предложения в заявку в отдел снабжения на приобретение расходных материалов на техобслуживание оборудования. Составление ПОН и заявки выполняется студентами в лабораторной и контрольной работах.
Дата добавления: 2016-07-05; просмотров: 2029;