Теоретико-методологические основы качества информационных систем

Разработка концептуальной модели совершенствования качества информационных систем. Анализ модели определения состава показателей качества информационных систем. Экспериментальное исследование моделей совершенствования качества информационных систем.

Рубрика Программирование, компьютеры и кибернетика
Вид монография
Язык русский
Дата добавления 28.03.2020
Размер файла 844,8 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

9. Совершенствование качества функционирования ИС может быть реализовано в форме Комплексной системы управления качеством информационных систем. Обобщенная модель этой системы является принципиальной основой для построения ряда моделей СКИС.

10. Одним из способов минимизации дефектов обработки и улучшения качества ИС является метод автоматического (программного) обнаружения ошибок в значениях цифровых показателей документов табличной структуры, программного вычисления достоверных значений показателей и замены недостоверного значения на достоверное (вычисленное программно). Распознавание ошибок может быть построено на основе взаимосвязи значений элементарных показателей значений агрегатных показателей типа «всего», «итого» и др.

11. В дескриптивном моделировании СКИС могут применяться средства: теория управления, теория надежности, квалиметрия, системный анализ, семиотика, лингвистика, а также методы исследования - определение, сравнение, анализ, синтез, индукция, дедукция, абдукция, классификация, редукция, идеализация и др. Каждая из указанных категорий выбирается в соответствии с характером и этапом решаемой задачи.

12. В решении задач СКИС вообще и управления качеством ИС, в частности, большое значение имеет разработка и применение концепции креативного управления качеством ИС. Определение характеристик системы креативного управления можно выполнить посредством изучения структуры креативного управления ИС.

13. В составе структуры креативного управления следует предусмотреть, прежде всего, мыслительную, деятельностную и ресурсную составляющие. Каждая из этих составляющих имеет свои структурные компоненты, потенциал которых обеспечивает реализацию системы креативного управления качеством ИС.

14. Успешность решения задач креативного управления качеством ИС в значительной мере будет определяться наличием эффективной системы подготовки соответствующих специалистов и задействованием их в создании, эксплуатации и развитии КС УКИС.

Глава 3. Разработка математических моделей совершенствования качества информационных систем

3.1 Обобщённая модель совершенствования качества информационных систем

Продуктивным направлением в методологии СКИС является математическое моделирование, являющееся в нашем случае следующей ступенью после дескриптивного моделирования. Следует отметить, что в настоящее время трудно создать адекватную математическую модель сложных объектов, как, например, ИС, тем более модель взаимодействия ИС и системы управления её качеством. Обычно для решения подобных задач прибегают к декомпозиции объектов и моделирование начинается с построения обобщённой (принципиальной) модели [12,172,197]. На основе этой модели может быть построен комплекс частных (маргинальных) моделей, объединенных логикой обобщённой модели. К математическим средствам разработки формализованных моделей СКИС можно отнести широкий спектр математических теорий, в частности, теорию управления, теорию вероятностей и математическую статистику, теорию планирования эксперимента, теорию множеств и др. [12,13,17,18,50,101,151,153,155,158,165].

В контуре СКИС имеются два основных взаимодействующих блока: субъект управления - КС УКИС и объект управления - ИС. (рис. 3.1). В этом контуре результаты функционирования ИС отображаются зависимостью следующего вида

= (, , ) , (3.1)

где - k-мерный вектор, определяющий совокупность начальных (входных) условий и внешних воздействий, определяемых режимом функционирования ИС; - q-мерный вектор, определяющий возможные внутренние состояния ИС; - l-мерный вектор, определяющий управление качеством ИС - h-мерный вектор выходных координат ИС.

Внешние

воздействия

- Управляющие

воздействия

- Начальные - Выходные

условия координаты

- Изменение внутреннего

состояния ИС

Рис. 3.1. Схема взаимодействия КС УКИС и управляемой ИС

Управляющие воздействия , вырабатываемые и реализуемые КС УКИС в процессе улучшения качества, определяются следующим соотношением

= (,) (3.2)

Обозначим через j(y) пространство выходных координат на j-м этапе управления, характеризующих поведение ИС с позиций критерия качества. После задания j(y) следует выбрать критерий качества ИС в зависимости от состояния ИС. В общем случае критерий качества Ij можно рассматривать как оценку математического ожидания от некоторого функционала Gj, определяемого на траекториях процесса Yhj(t)

Ij(t) = M[Gj (Yhj(t))] (3.3)

Поскольку ИС характеризуется, как сложная система, многомерностью и иерархичностью свойств, то адекватную оценку качества в соответствии с дескриптивной моделью необходимо проводить не одним показателем, а набором показателей. Здесь следует определить несколько типов функционалов, наблюдаемых на траекториях Yhj(t). Отсюда задача системы управления качеством в измерении и оценке качества ИС состоит в выработке таких значений и , чтобы от этапа к этапу критерий качества Ij улучшался до требуемого или максимально возможного значения. Таким образом, на каждом этапе ИС имеем n значений функционалов

G1j, ... , Gij, ... , Gnj, (3.4)

представляющих собой выборку n значений случайных событий, например, искажений значений показателей, которые можно подвергнуть обычной статистической обработке с применением ЭВМ для получения оценок качества.

В пространстве [Y(t)] можно выделить подмножество состояний, когда ИС не соответствует требованиям по качеству - н[Y(t)] и соответствует - c[Y(t)]. Функционал оценки качества может быть как качественным, так и количественным. Применение качественных показателей возможно, если, например, какой-либо из функционалов (3.4) принимает значение

Gij =

0, если до момента tyij (t) н,

1, если до момента tyij (t) с

(3.5)

В этом случае показатель качества характеризует соответствие ИС установленным требованиям за время t на j-м этапе ИС (Rj(t))

Ij(t) = M [Gij] = Rj(t) ( 3.6)

Если за значение функционала Gij принять время работы ИС до первого попадания Yij(t) в н , то показатель качества (3.3) равен среднему времени успешной работы на j-м этапе ИС

Ij = M [Gij ] = Tj (3.7)

В подобных случаях оценку качества ИС можно и целесообразно проводить посредством количественных показателей. При применении качественных показателей в результате управления ИС фиксируется только факт: событие E1 успешно, если отсутствует дефект, и неуспешно (E0), при наличии дефекта. Для случайной величины ij состояния обработки i-го документа на j-м этапе обработки получим

ij =

0 - обработка i-го документа на j-м этапе была неудовлетворительной (есть дефект)

1 - обработка i-го документа на j-м этапе была удовлетворительной (нет дефекта)

(3.8)

Эти величины применимы для оценки качества функционирования ИС через обозначения удовлетворительно/неудовлетворительно, выраженных через такую, например, величину как частота дефектов. Однако для определения состава показателей качества методом, например, кластер-анализа, расчета значений обобщенных показателей, требуется проводить квантификацию каждого наблюдаемого события. В этом аспекте результат или состояние i-го документа на j-м этапе обработки характеризуется случайной величиной ij, которая может принимать множество положительных значений. Результаты наблюдения серии из n документов на m этапах функционирования ИС можно отобразить матрицей размерности mn, каждый элемент которой представляет собой случайные величины ij

(3.9)

При условии испытания i-го документа на j-м этапе данная матрица представляется вектор-строкой 1n

[ij] =(i1, ..., ij, ..., in ) (3.10)

Для оценки КИС по сумме всех обрабатываемых документов на всех этапах обработки этой партии предлагается применить комплексный показатель следующего вида

(3.11)

где Kj, Ki, K - сумма столбцов, строк и всех элементов матрицы (3.9), которые являются соответственно числом неуспешных испытаний n документов на j-м этапе, i-й последовательности документов на m этапах, общим числом неуспешных испытаний. Эти величины могут быть применимы для определения значений, например, фактических, единичных, групповых, интегральных, относительных и других видов показателей оценки качества функционирования ИС.

В случае, когда результаты испытания ИС представляются случайной величиной ij , которая может принимать только два значения (3.8), то

P(ij =1) = P(E1) = 1 - P(Eo) (3.12)

является вероятностью успешной работы ИС и соответственно

P(ij =0) = P(E0) = 1 - P (E1) (3.13)

является вероятностью отказов, неуспешной работы ИС.

Исходя из существа рассматриваемой задачи, наиболее целесообразным и приемлемым представляется регистрация и измерение случайных событий E0, характеризующих отклонение ИС от установленных требований вероятностью P(E0), идентифицируемых частотой дефектов Kij в выборке документов n, взятых по этапам технологии m. Поэтому для отображения качества ИС в нашем случае лучше принять вероятность ее успешной работы по формуле (3.12), чем вероятность отказов (дефектов) - неуспешной работы по формуле (3.13). Следует отметить, что принципиального значения подобный выбор в измерении качества не имеет, так как оценку качества можно выполнить как тем, так и другим способами.

Эффективной оценкой для Pj(E0) является величина

(3.14)

Оценивая результаты испытаний на каждом этапе, получаем последовательность оценок

P1*( E0), ..., Pj*( E0), ..., Pm*( E0). (3.15)

Если предположить, что от этапа к этапу ИС улучшается, то оценки (3.15) с увеличением количества испытаний по вероятности будут приближаться к неизвестному значению вероятности P(E0), величина которой зависит от способности ИС находиться в состоянии, соответствующем установленным требованиям по качеству.

Важной оценкой P(E0) является величина интегрального характера

(3.16)

где k определяется по формуле (3.11).

Тогда P1*(E0) , ... , Pj*(E0) , ... , Pm*(E0) и, следовательно, их оценки (3.15) должны иметь тенденцию к улучшению, так как КС УКИС после некоторого объема наблюдений (измерений) в реальном масштабе времени определит необходимые мероприятия, направленные на улучшение КИС. Поэтому можно предположить, что значения фактических показателей качества (3.16) будут хуже на первоначальных этапах и выше на завершающих. По этой формуле может вычисляться средневзвешенное значение по всем этапам ИС относительно единичных, групповых и других значений показателя качества.

3.2 Модель определения состава показателей качества информационных систем

В рамках обобщенной модели СКИС рассмотрим теперь более конкретное развитие модели оценки качества ИС с позиций принципов квалиметрии [1,73]. Это рассмотрение целесообразно проводить с учетом требований к оценке качества ИС, рассмотренных в разделе 2.2.

Дефекты ИС могут быть заданы случайными величинами, каждая из которых характеризуется временем и (или) стоимостью обнаружения и исправления дефекта и отображаемые статистической структурой в соответствии с формулами (3.9) и (3.10). Исходя из характера ИС, наиболее приемлемым представляется провести сбор данных выборочно комбинированным методом. По каждому этапу должны быть взяты репрезентативные выборки серий обрабатываемых документов. В целях обеспечения репрезентативности, в частности, относительно запаздывания документов, сбор сведений можно выполнить с использованием технологических журналов регистрации поступления документов (пачек документов) по этапам, если таковые имеются в наличии. При условии сбора и регистрации сведений статистические данные о состоянии ИС подвергаются обработке на ЭВМ. Выбор пакета прикладных программ определяется целями оценки, характером решаемых задач, имеющимся парком ЭВМ и набором имеющихся пакетов.

Классификация дефектов и получение на этой основе состава и содержания показателей качества ИС могут быть выполнены методом агломеративного кластер-анализа посредством реализации соответствующих программ с применением ЭВМ. Исходя из существа кластер-анализа, дефекты, оказавшиеся в одной группе, должны быть сходными между собой, а дефекты, принадлежащие разным классам, разнородными, относящимися к различным ветвям дерева классификации. Критерием разнородности выберем некоторую метрику, посредством которой дефекты могут быть объединены в некоторый класс по количественному критерию сходства (различия) классифицируемых дефектов. Можно использовать различные критерии, например, евклидово расстояние [118,141,188]. Определение состава первичных показателей качества ИС выполним посредством агломеративного кластер-анализа. По существу кластер-анализа, дефекты, сходные между собой, должны быть в одной группе, а дефекты, принадлежащие разным классам, разнородными, относящимися к разным ветвям дерева классификации.

Пусть множество D={} отображает выборку, состоящую из дефектов, регистрируемых по этапам ИС. Имеется некоторое множество характеристик G={}, присущих каждому из . Количественное измерение j-ой характеристики дефекта обозначим , тогда вектор =[] размерности mx1 будет соответствовать каждому ряду измерений для каждого . Отсюда множество дефектов D располагает множеством векторов измерений , которые характеризуют множество D. Отметим, что множество D может быть отображено как n точек в p-мерном пространстве . Задача кластеризации дефектов заключается в том, чтобы для анализа некоторого целого числа S (s < n) на основе Х разбить множество D на конечное число подмножеств

(3.17)

где , так, чтобы

, i,j (3.18)

. (3.19)

Отправной точкой для определения состава и содержания показателей качества ИС является получение укрупненных классов дефектов, сформированных в результате кластеризации. Априори можно предположить, что в результате будут получены классы дефектов соответствующих оценкам по достоверности, полноте, своевременности и др.

Для дальнейшего рассмотрения существа иерархической агломеративной классификации статистической структуры дефектов ИС с учетом подходов к кластер-анализу, изложенных в [20,51,67,76,98], конкретизируем обозначения дефектов и процесс их кластеризации: - элементы (дефекты) матрицы исходных данных Х (ведомость дефектов), где i=1,2,..,n - номер строки (шифр, код дефекта), j=1,2,…,m - номер столбца (шифр, код признака - время и/или стоимость обнаружения и исправления дефекта); - среднее значение признака для n дефектов (среднее по столбцу j), определяемое по формуле

= (3.20)

-среднее квадратическое отклонение признака xj, определяемое по формуле

(3.21)

затем определяется - нормированный элемент матрицы Х

=()/ (3.22)

после чего матрица дефектов Х заменяется матрицей Z. Затем вычисляются всевозможные расстояния - квадрат евклидова расстояния между дефектами i и k.

=. (3.23)

После подсчета расстояния для всех пар дефектов матрица Z заменяется симметричной матрицей Q (матрица расстояний). На основе этой матрицы проводится кластеризация. Вначале кластеризации каждый дефект обозначается как отдельный кластер. На первом шаге кластеризации определяется пара дефектов, расстояние dij между которыми минимально. Эти дефекты объединяются в один кластер, в матрице расстояний «вычёркиваются» строка и столбец, соответствующие первому из этих дефектов. Затем матрица расстояний рассчитывается вновь, так как расстояние пары дефектов нового будущего кластера может измениться относительно оставшихся в матрице расстояний дефектов.

На втором шаге процедуры в матрице расстояний, уменьшенной на одну строку и один столбец, снова определяется минимальное расстояние и формируется новый кластер. Этот кластер может быть сформирован в результате объединения либо двух дефектов, либо одного дефекта с кластером, сформированном на первом (предыдущем) шаге. Снова в матрице расстояний вычёркивается одна строка и один столбец, снова пересчитывается матрица расстояний и т.д. После выполнения каждого шага число кластеров уменьшается на единицу, а матрица расстояний уменьшается на одну строку и один столбец.

Алгоритм заканчивает работу тогда, когда все дефекты будут объединены в один общий кластер, т.е. при условии сформирования ствола дерева классификации. При получении на ЭВМ распечатки дендрограммы можно будет путем анализа выявить состав и свойства классов дефектов. С учетом состава и свойств сформированных классов дефектов будут определяться показатели качества ИС. Более расширенное рассмотрение кластер-анализа статистической структуры дефектов ИС представлено в [98, 140].

Полученные в результате кластеризации однородные статистические структуры должны быть подвергнуты дальнейшей обработке на ЭВМ с целью получения статистических параметров, в частности, средних выборочных, среднеквадратических отклонений, оценок параметров в виде доверительных интервалов, выполняемых по векторам времени и стоимости. Кроме того, могут быть определены также типы эмпирических распределений случайных величин по времени и стоимости, наиболее согласующиеся с теоретическими [188].

В результате дальнейшей обработки должны быть получены оценки математического ожидания по времени и по стоимости относительно классов дефектов. Для этого потребуется определить также количество дефектов по их видам и этапам, на которых они зарегистрированы. Кроме того, на ЭВМ должны быть обработаны данные по причинам-факторам, обусловившим возникновение дефектов.

В результате измерения и обработки данных на ЭВМ получится определенный объем информации о качестве ИС. Затем, с целью рационализации дальнейшей работы, информацию о качестве необходимо представить в удобной для восприятия форме, т.е. в виде набора унифицированной технологической документации.

3.3 Модель расчета значений показателей оценки качества информационных систем

Исходной точкой для определения состава и содержания показателей качества ИС является получение укрупненных классов дефектов, задаваемых в результате кластер-анализа. Априори можно предположить, что в результате получены классы дефектов соответственно по достоверности, полноте, своевременности. Определение конкретных формул для расчета значений показателей оценки качества ИС можно выполнить с учетом методологических положений, концептуальной модели, а также формул (3.9-3.16) принципиальной модели СКИС.

Определим понятие «значение показателя достоверности информации - это величина противоположная вероятности ошибки в определенном объеме информации». В соответствии с вышерассмотренной математической моделью вероятность ошибки представляется как отношение числа дефектов к определенному объему информации. Отсюда значение достоверности можно рассчитать по формуле

(3.24)

где - значение единичного фактического показателя достоверности информации i-го вида на j-м этапе обработки (); - количество обнаруженных ошибочных символов (дефектов) в информации i-го вида на j-м этапе обработки; - объем информации в символах, содержащейся в информации i-го вида

на j-м этапе.

Теперь определим понятие «значение показателя полноты информации - это величина противоположная вероятности пропуска единицы информации в определенном объеме информации» и это значение рассчитаем по формуле

(3.25)

где - значение единичного фактического показателя полноты информации в документации i-го вида на j-м этапе обработки (); -количество отсутствующих показателей, регламентированных форматом документа i-го вида на j-м этапе; - количество показателей в документах i-го вида, обрабатываемых на j-м этапе.

Определим также и понятие «значение показателя своевременности информации - это величина противоположная вероятности запаздывания информации относительно регламентного объема информации, предназначенного к выдаче пользователю на заданное время». Значение этого показателя можно рассчитать по формуле

(3.26)

где - значение единичного фактического показателя своевременности обработки информации (документации) i-го вида на j-м этапе обработки (); -фактическое количество документов (пачек документов) i-го вида, выданных с опозданием, j-м этапе обработки; -общее количество документов (пачек документов) i-го вида, необходимое к выдаче по регламенту на заданное время на j-м этапе .

Тогда значения групповых показателей достоверности, или полноты, или своевременности по все этапам и/или по всем видам информации (документации) можно определить по формуле

(3.27)

где - значение группового фактического показателя 1-го вида (); -значение единичного фактического показателя 1-го вида (достоверность, полнота, своевременность и др.); l, i, j, - индексы соответственно видов показателей, документации и этапов обработки.

В роли базовых значений принимается вероятность одного дефекта соответственно по достоверности, полноте, своевременности относительно соответствующих объемов обрабатываемой документации. При данном условии значение базового показателя определяется по формуле

(3.28)

где - значение базового показателя 1-го вида (); -объем обрабатываемой документной информации i-го вида; 1- индекс показателя.

В зависимости от вида показателя - достоверности, полноты, своевременности, объем информации измеряется соответственно в символах, показателях, документах.

Оценку относительного уровня качества можно выполнить по значению относительных показателей, отображаемых как отношение фактических показателей к базовым, и определяемых по формуле

(3.29)

где - значение относительно уровня показателя 1-го вида (); -значение фактического показателя 1-го вида; -значение базового показателя 1-го вида.

С учетом обратно функциональной зависимости значение относительного показателя качества по себестоимости и принятого нами принципа унификации измерения (раздел 2.2) указанное значение определяется по формуле

(3.30)

где с- индекс показателя себестоимости, остальные значение эквивалентны соответствующим значениям формулы (3.29).

Исходя из иерархичности свойств объектов и содержания оценки КИС, интегральные показатели определяются как средневзвешенные величины по набору значений показателей в целом - единичных, групповых, базовых и относительных.

Интегральный показатель по набору единичных показателей определяется по формуле

(3.31)

где - интегральный показатель по набору единичных показателей достоверности, полноты, своевременности (); - единичный фактический показатель 1-го вида. И далее определяем

(3.32)

где - интегральный показатель по набору групповых показателей (); - групповой показатель 1-го вида,

(3.33)

где - интегральный показатель по набору базовых показателей (); - базовый показатель 1-го вида,

(3.34)

где - интегральный показатель по набору относительных показателей (); - относительный показатель 1-го вида.

3.4 Модель определения обобщенных показателей и коэффициентов их весомости

При расчете обобщенных показателей целесообразно использовать функциональную зависимость между дефектами обработки и значениями обобщенных показателей. С учетом использования расчетно-аналитических методов оценки качества ИС указанную зависимость можно определить на основе регрессионной зависимости. При этом выбор вида функции обобщенного показателя от единичных (групповых) показателей должен быть выполнен так, чтобы получаемая при этом линейная зависимость была бы лучшей аппроксимацией функциональной зависимости. Кроме того, при расчете значений обобщенных показателей необходимо определить значения коэффициентов весомости показателей, в роли которых выступают коэффициенты регрессии [96,211].

С учетом существа рассматриваемой задачи в нашем случае целесообразно в качестве модели зависимости использовать регрессионные уравнения линейного вида. При этом обобщенными показателями будут производительность ИС и себестоимость обработки одного документа. Используемыми переменными выступают здесь время и стоимость обнаружения и исправления дефектов соответственно по достоверности, полноте, своевременности, а возможно и по другим категориям.

Для определения значений обобщённых показателей качества и коэффициентов весомости независимых переменных может быть принята модель множественной линейной регрессии

(3.35)

где - зависимая (прогнозируемая) переменная - производительность и (или) себестоимость; - независимые (прогнозирующие) переменные (значения времени или стоимости обнаружения и исправления дефектов соответственно по достоверности, полноте, своевременности); - свободный член регрессии; -вектор оценок коэффициентов линейной регрессии; - случайные величины (совокупность латентных случайных факторов).

Оценка параметров ,, производится методом наименьших квадратов, то есть из условия минимума суммы квадратов отклонений значений

(3.36)

Это приводит к системе нормальных уравнений

= (3.37)

,

где =(,…, - вектор оценок коэффициентов линейной регрессии, а величина - свободным членом уравнения регрессии; - обратная матрица ковариаций между переменными ; - вектор оценок ковариаций между переменными у и переменными ; - оценка среднего значения у; - вектор средних значений переменных .

Для оценки переменных регрессии с применением ЭВМ необходимо получить исходные данные. В нашем случае они могут быть представлены в виде матрицы фиксированных данных. С учетом сущности модели, описывающей состояние ИС, матрица фиксированных данных имеет размерность nm (m=q+1,xm=Y) и представляет собой выборку m-мерных объектов Х=(x1, …, xq,…, xm). По условиям задачи необходимо иметь две матрицы - по производительности и себестоимости. Расчет значений целесообразно выполнить исходя из зависимости (влияния) повышения производительности ИС от снижения времени на обнаружение и исправление дефектов с размерностью шага на 1% и, наоборот, - снижения себестоимости от уменьшения стоимости обнаружения и исправление дефектов на 1%. По условиям решения регрессионных уравнений в матрице исходных данных количество строк должно быть не меньше числа переменных, то есть в нашем случае не менее трех. Исходя из условий надежности и практических соображений использования результатов работы, целесообразно представить такую матрицу, состоящую из 20 строк каждая, т.е. просчитать зависимость до 20%.

Матрицу производительности ИС будем определять в следующем порядке. Сначала оцениваем математическое ожидание дефекта обработки по формуле

(3.38)

Это приводит к системе нормальных линейных уравнений, где Хt - оценка математического ожидания времени обнаружения и исправления дефекта по j-ой переменной матрицы относительно документа, или показателя, или символа в зависимости от вида переменной - своевременности, полноты, достоверности; -среднее выборочное значение j-й переменной, полученной ранее в результате обработки статистической структуры дефектов с применением ЭВМ; Р- относительная частота j-й переменной, приходящаяся на один документ, показатель или символ.

Оцениваем общую трудоемкость дефектов по формуле

= , (3.39)

где - общая трудоемкость дефектов по j-й переменной;

V- объем обрабатываемой документации (измеряемый в количестве документов, показателей, символов).

Тогда трудоемкость дефектов при условии снижения ее значения на р процентов будет составлять

= - [( /100)p] , (3.40)

где - трудоемкость дефектов j-го вида при условии снижения ее значения на р процентов.

Отсюда совокупную трудоемкость дефектов обработки при условии снижения ее на р процентов можно определить по формуле

(3.41)

где -трудоемкость дефектов обработки при условии снижения трудоемкости на р процентов.

Теперь определим общую нормированную трудоемкость обработки документации по формуле

= tn V, (3.42)

где - общая нормированная трудоемкость обработки документации при условии отсутствия дефектов; t- нормированная трудоемкость обработки одного документа.

Определим календарный период обработки с учетом снижения совокупной трудоемкости на р процентов по формуле

(3.43)

где календарный период обработки при условии снижения трудоемкости на р процентов; - календарный период обработки, в рамках которого осваивается трудоемкость; -совокупная трудоемкость дефектов обработки, определяемая по формуле

(3.44)

Тогда значение производительности при условии снижения совокупной трудоемкости дефектов на р процентов определяется по формуле

, (3.45)

где - значение производительности ИС при условии снижения совокупной трудоемкости дефектов на р процентов.

Проведя необходимые расчеты, записываем в матрицу значения и значения . Таким образом, по вышеуказанным формулам определяются и записываются значения последующих строк матрицы. В зависимости от особенностей ИС значения параметров, привлекаемых для расчета переменных матрицы, могут быть выражены в минутах, днях, показателях, документах и др.

Матрица фиксированных данных для расчета регрессионной зависимости дефектов обработки и себестоимости обработки документации определяется в следующем порядке. Оцениваем математическое ожидание дефекта обработки по формуле

, (3.46)

где - оценка математического ожидания стоимости обнаружения и исправления одного дефекта по j-ой переменной матрицы; - среднее выборочное значение стоимости обнаружения и исправления одного дефекта по j-ой переменной, полученной ранее в результате обработки статистической структуры дефектов с применением ЭВМ.

Затем оцениваем общую стоимость дефектов по формуле

, (3.47)

где - общая стоимость дефектов по j-й переменной.

Тогда совокупная стоимость обнаружения и исправления дефектов может быть определена по формуле

(3.48)

где - совокупная стоимость обнаружения и исправления дефектов.

Определим общую стоимость дефектов при условии снижения ее на р процентов по формуле

(3.49)

где - общая стоимость дефектов по j-й переменной при условии снижения стоимости на р процентов .

Значение записываем в соответствующие графы матрицы фиксированных данных. Для определения зависимой переменной - себестоимости обработки одного документа необходимо получить совокупную стоимость обнаружения и исправления дефектов при условии снижения стоимости дефектов на р процентов по формуле

(3.50)

где - совокупная стоимость обнаружения и исправления дефектов при условии снижения стоимости на p процентов.

Определим нормированную стоимость обработки документации, т.е. стоимость при условии отсутствия дефектов по формуле

(3.51)

где - общая нормированная стоимость обработки документации ИС; - нормированная стоимость обработки одного документа.

Теперь определим общую фактическую стоимость обработки документации

(3.52)

где - общая фактическая стоимость обработки при условии снижения стоимости дефектов на р процентов.

Тогда значение зависимой переменной определяем по формуле

, (3.53)

где - значение себестоимости обработки одного документа при условии снижения стоимости дефектов обработки на р процентов.

Значения трудоемкости и стоимости обработки одного документа определяются с учетом нормативов, действующих на предприятии на основе известных способов. Записав в соответствующую позицию значение матрицы, проводим вычисления переменных следующей строки. Значения параметров, привлекаемых для расчета значений переменных матрицы себестоимости, могут измеряться в копейках, рублях, показателях, документах и др. В нашем случае себестоимость целесообразно измерить в рублях на один документ.

3.5 Модель автоматического обнаружения и исправления ошибок в документах табличного вида

Моделирование процесса автоматического обнаружения ошибок и восстановления достоверности значений показателей в табличных документах вызывает необходимость анализа структуры и свойств указанных документов [60,79,120]. Модель табличного документа можно представить в виде матрицы. В теории помехоустойчивого кодирования решены вопросы автоматической коррекции ошибок в кодовых ансамблях информации, передаваемой по каналам связи [11,193]. Рассмотрение метода автоматического обнаружения ошибок и восстановления достоверности значений показателей табличных документов проведем с учетом концепции теории помехоустойчивого кодирования.

Передаваемая в двоичном виде информация имеет вероятность искажения отдельных двоичных символов, что приводит к снижению достоверности сообщений. Одним из способов защиты сигналов от искажений является ввод в передаваемую кодовую комбинацию информационной избыточности. Обычно корректирующие коды состоят из информационных и контрольных разрядов. Последние по существу в информационном отношении избыточны и выполняют функции корректировки ошибок в соответствующем разряде двоичного слова. Имеются двоичные модификации корректирующих кодов - код Хэмминга, Боуза-Чоудхури-Хоквингема (БЧХ), векторный, треугольный и др. [11,193]. При кодировании информации, например, кодами Хэмминга разряды информационной части кода делятся на группы. Значение каждого контрольного разряда вычисляется путем суммирования по модулю разрядов соответствующей группы. При декодировании информации по модулю суммируются информационный и контрольный разряды кода соответствующей группы.

По результатам суммирования формируется синдром - корректирующее двоичное число, у которого каждый разряд есть результат суммирования. Синдром в общем случае выступает как опознаватель ошибки. Если синдром состоит из нулей, то это означает отсутствие ошибки в передаваемом коде, а ненулевое значение синдрома указывает адрес ошибки, то есть номер разряда кода, в котором произошло искажение символа. Если в информационном разряде находится символ 0, то при коррекции он заменяется на достоверный, то-есть I, и наоборот. Эта схема работы кода Хэмминга не исчерпывает состав средств помехоустойчивого кодирования, но она достаточна для применения в нашей задаче в значении исходного положения. Рассмотрим структуру и свойства условного табличного документа в виде матрицы (рис. 3.2).

D = d1, d2, …, ds,…, dk

В

А

b1

b2

bj

bn

bn+1

a1

q11

q12

q1j

q1n

q1,n+1

a2

q21

q22

q2j

q2n

q2,n+1

ai

qi1

qi2

qij

qin

qi,n+1

am

qm1

qm2

qmj

qmn

qm,n+1

am+1

qm+1,1

qm+1,2

qm+1,j

qm+1,n

qm+1,n+1

Рис. 3.2. Матрица документа табличного вида

Модель табличного документа можно отобразить четверкой

Q = Qk, A, B, D (3.54)

где Qk - матрица документа Qk = ||qij||, i = 1,m, j = 1,n;

qij - реквизиты-основания (числа), отражающие количественное состояние объектов;

А- кортеж реквизитов-признаков (наименование строк таблицы), отражающий качественные стороны состояния объектов;

В - кортеж реквизитов-признаков, (наименования столбцов таблицы), отражающий качественные стороны состояния объектов;

D - кортеж реквизитов-признаков, отражающий качественные стороны состояния объектов общего уровня и относящиеся как к А, так и к В;

qi,n+1, qm+1,j - реквизиты-основания типа «итого», «всего» или контрольные суммы соответственно по строкам и столбцам, отражающие количественное состояние объектов.

Рассматриваемая модель табличного документа в определенном допущении может быть представлена в синтаксическом отношении как кодовый ансамбль. В этом ансамбле информационные группы отображаются совокупностью значений показателей по документо-строкам и (или) документо-графам, а также контрольными суммами и (или) значениями показателей типа «всего» и «итого». В данном случае контрольные суммы обладают своеобразными свойствами синдромов, то есть опознавателей ошибок. Вместе с тем, семантические свойства документа, в частности, арифметическая связь контрольных сумм с соответствующими значениями показателей, представленными не в двоичной, а в десятичной системе, устраняют необходимость модульного или другого способа формирования синдромов. Указанные связи между значениями элементов матрицы документа обеспечивают потенциальную возможность автоматического обнаружения ошибок и их исправление без непосредственного участия оператора ЭВМ. С учетом выявленных выше свойств аналогии построим модель алгоритма автоматического восстановления достоверности показателей документов табличного вида.

Исходя из анализа свойств реквизитов-оснований, наблюдается взаимосвязь элементов типа арифметического баланса

qi,n+1 = (3.55)

qm+1,j = (3.56)

При условии внесения ошибки в какой-либо элемент qij на этапах обработки нарушаются условия соотношений типа (3.55.), (3.56). С целью автоматического обнаружения ошибок и их исправления при вводе в ЭВМ указанные соотношения проверяются программно. Сначала проверяется равенство

(3.57)

Если равенство не соблюдается, то на принтер или дисплей, в рамках протокола ввода документов в ЭВМ, выдается сообщение об отсутствии равенства указанного типа и идентификатор документа. Если же равенство (3.57) соблюдается, то проверяется далее условие

(3.58)

если в i-й cтроке равенство не выполняется,

(3.59)

то производится замена ошибочной строки на строку с элементами

, (3.60)

после чего оператору выдается сообщение на принтер об ошибке и ее исправлении с указанием индекса документа, а также значение замененного ошибочного реквизита-основания и заменяющего достоверного реквизита-основания.

Если же нарушение условия (3.58) более чем в одной строке, то для столбцов матрицы проверяется условие

(3.61)

Если же нарушение условия имеет место в одном столбце

(3.62)

то заменяется столбец на столбец с элементами

(3.63)

и выдается сообщение на принтер об ошибке и её исправлении.

Если же нарушение более чем в одном столбце, то на дисплей или принтер выдается сообщение об ошибках с обозначением модификации ошибок и их адресов. Заметим, что при условии какой-либо ошибки, например, транспозиции (перестановки) нарушается условие (3.55). Это и идентифицируется как ошибка относительно и . Обнаружение выполняется не только в случаях транспозиции, но и других различных искажений лексического, синтаксического, логического и арифметического свойства по набору каждой отдельной строки и (или) столбца матрицы документа. Таким образом, алгоритм позволяет программное исправление однократных и обнаружение многократных ошибок относительно строки и (или) столбца матрицы контролируемого документа.

При практическом применении данного метода следует учитывать два случая. В первом случае в формате первичного документа отсутствуют реквизиты типа «всего», «итого» как по строкам, так и по столбцам. Во втором случае указанные реквизиты взаимосвязаны с неполным набором реквизитов-оснований строки и (или) столбца. В первом случае на этапе подготовки документа целесообразно подсчитать контрольные суммы, а во втором случае можно применить данный метод по субматрице документа в пределах соответствующих контрольных сумм (реквизиты типа «всего»), если реализация дополнительных трудозатрат в конкретной ИС является проблематичной. Следует иметь в виду, что в любом случае применением контрольных сумм является целесообразным.

С учетом рассмотренных выше моделей примем определение - «формализованная модель совершенствования качества ИС - это отображение существенных свойств информационной системы математическими и (или) графическими средствами». В нашем случае к графическим средствам можно отнести рисунки, эскизы, графики, диаграммы, гистограммы, экспликации, чертежи и др. Каждый из указанных видов графического материала применяется в зависимости от характера отображения системы СКИС.

Выводы

1. Дальнейшим логическим развитием дескриптивных моделей СКИС и решения задач УКИС являются математические модели. Основой для создания математических моделей являются методологические положения и соответствующие концептуальные модели. Одним из условий логики организации набора моделей является построение принципиальной (обобщённой) математической модели СКИС и соотношение в ее составе маргинальных математических моделей, конкретизирующих и развивающих принципиальную модель СКИС.

2. В силу разнообразия и сложности задач СКИС при создании математических моделей СКИС и решения задач УКИС применяются методы теории управления, теории вероятностей и математической статистики, теории множеств, теории квалиметрии и др.

3. Значимыми моделями СКИС являются модели измерения и оценки КИС. Построение математической модели оценки КИС выполнено в соответствии с концепцией расчетно-аналитического метода оценки, как наиболее адекватного для СКИС.

4. Одним из адекватных методов определения обоснованного набора показателей является метод анализа неоднородности статистической структуры дефектов обработки данных технологического процесса ИС. На основе кластер-анализа можно выполнить кластеризацию дефектов, выделить свойства полученных кластеров и определить тем самым первичные показатели качества функционирования ИС. В нашем случае это могут быть показатели достоверности, полноты своевременности обработки данных и др.

5. На основе этих показателей могут быть определены обобщенные показатели качества ИС, в нашем случае, это показатели производительности ИС и себестоимости обработки документов ИС. Значения обобщенных показателей могут быть определены в рамках модели множественной линейной регрессии отдельно как по производительности, так и по себестоимости. Регрессорами в уравнениях регрессии будут значения дефектов по достоверности, полноте и своевременности. Полученные посредством решения уравнений коэффициенты весомости будут обозначать значимость регрессоров уравнения, а нулевой коэффициент - значение зависимой переменной, в нашем случае это производительность и/или себестоимость, то есть их значения при условии абсолютного отсутствия дефектов - идеального функционирования ИС.

6. Одним из способов минимизации дефектов обработки и улучшения качества ИС является метод автоматического (программного) обнаружения дефектов в значениях цифровых показателей документов табличной структуры, программного вычисления достоверных (правильных) значений показателей и замены недостоверного значения на достоверное (вычисляемое программно). Метод основан на теории помехоустойчивого кодирования, в частности, на применении синдрома-опознавателя ошибок, в роли которого в табличном документе могут выступать итоговые и групповые значения показателей типа «всего», «итого» и др.

Глава 4. Экспериментальное исследование моделей совершенствования качества информационных систем

4.1 Постановка задачи экспериментального исследования моделей совершенствования качества ИС

Физическое моделирование качества ИС. Этап физического моделирования должен обеспечить на экспериментальном уровне проверку реальной работоспособности созданных моделей СКИС и их адекватность. Для реализации этого этапа разрабатывается физическая модель СКИС в соответствии с условиями, рассмотренными в разделе 1.2. «Физическая модель системы СКИС - это совокупность методов и средств редуцированного натурного воплощения системы СКИС, предназначенная для проверки в реальных условиях работоспособности будущей системы и адекватности ее моделей». В определенном отношении физическая модель системы СКИС обладает свойствами реальной системы. Для ее построения привлекаются материальные средства - ЭВМ, периферийные устройства, документы, файлы, базы данных, программы обработки данных и другие компоненты, планируемые для создания системы СКИС. Физическая модель системы СКИС является редуцированным, то есть ее уменьшенным отображением [101]. Уменьшение здесь не механическое, не произвольное, а гармонизированное. В ней представлены только те свойства, которые необходимо отнести к разряду существенных. В данном условии комплекс технических средств, база данных, набор программ физической модели является если не минимальными, то, во всяком случае, неполными. Так, например, для эксперимента в ЭВМ вводится не вся база данных, а только 50, или 100, или 200 документов, но представляющих собой полный спектр семантических, синтаксических и прагматических свойств будущей базы данных в ее полном физическом объеме. Метод редукции позволяет обеспечить проверку максимально возможного состава функций и параметров будущей системы при минимальных затратах на изготовление ее физического воплощения, то есть натурной модели. Если на этапе исследования модели будут выявлены принципиальные ошибки, то это позволит избежать напрасных ресурсных затрат при создании реальной системы СКИС. Подготовка и экспериментальное исследование проводится в соответствии с общими положениями теории планирования эксперимента [12,165].

Подготовка эксперимента для проверки адекватности моделей. Планирование, разработка и экспериментальное исследование моделей СКИС выполняется обычно в контексте решения задач по созданию конкретных систем СКИС. При разработке программы вычислительного эксперимента учитываются требования к проведению эксперимента, содержание моделей СКИС, особенности автоматизированной обработки экспериментальных данных, программного обеспечения и др.

На этапе экспериментального исследования выполняются следующие работы:

· устанавливается порядок сбора и регистрации данных, характеризующих КИС;

· сбор и обработка данных на ЭВМ и получение статистических оценок по КИС;

· расчет показателей качества обработки ИС и заполнение «Карты оценки и анализа качества ИС» (далее «Карта»);

· анализ «Карты» и определения уровня качества ИС, ее компонентов, процесса обработки информации, информационной продукции и др.;

· выявление и анализ факторов, влияющих на качество ИС и др.

С целью обеспечения сбора необходимых экспериментальных данных разрабатывается «Методика выявления и регистрации дефектов информационных систем» (Приложение 1). При этом данные регистрируются в разработанную специальную форму «Ведомость выявленных дефектов ИС» (Приложение 2). Сбор статистических данных проводится обычно выборочно комбинированным методом по этапам технологии. Регистрация сведений в «Ведомости выявленных дефектов» проводится путем их кодирования в соответствии со специально разработанными классификаторами (приложение 3).

Одним из эффективных направлений для устранения вышеуказанных недостатков в технологии обработки является создание методов и средств программного обнаружения и устранения дефектов в обработке данных. Одним из принципиальных вопросов является разработка алгоритмов и соответствующих программ обработки и контроля данных, в частности, автоматического распознавания и коррекции ошибок в значениях показателей документов табличной структуры, рассмотренных в разделах 1.2 и 2.5. Описание алгоритма и программы «Автоматическое обнаружение ошибок и восстановление достоверности значений показателей» приведено в разделе 5.4.

В процессе экспериментального исследования особое внимание уделяется необходимости улучшения информативности документов по диагностике и коррекции ошибок. Удобная для восприятия и однозначная для понимания диагностика уже сама по себе повышает эффективность технологических процедур по исправлению ошибок. Учитывается также вероятность работы операторов ввода и контроля документов в ЭВМ с недостаточным профессиональным опытом. С целью наиболее эффективной адаптации программы разрабатываются рабочие технологические инструкции, в частности:

1. Рабочая инструкция № 1 по сбору, контролю и представлению документов в информационно-вычислительный центр (ИВЦ) фирмы.

2. Рабочая инструкция № 2 по первичной (предмашинной) обработке, вводу и контролю достоверности и полноты сведений первичных документов, контролю достоверности и полноты выходных (производных) документов.

3. Рабочая инструкция № 3 оператору подготовки данных по вводу документов в ЭВМ (перенос документов на электронные носители, прием данных по каналам связи, ввод документов через сканирующие устройства и др.).

4. Рабочая инструкция по работе с программой «Автоматическое обнаружение ошибок и восстановление достоверности значений показателей».

5. Описание программы «Автоматическое обнаружение ошибок и восстановление достоверности значений показателей ».

В соответствии с технологическими рабочими инструкциями выполняются работы по подготовке, вводу, контролю и анализу документов, ошибок в документах и их исправлению. В контролируемых документах контрольные суммы подсчитываются только по тем строкам, в которых они отсутствуют в соответствии с регламентом их представления в ИВЦ.

Ниже приводятся условия получения исходных данных для экспериментальной оценки качества обработки информации реальной ИС корпоративного уровня. На первом этапе (учет и прием первичных документов - заполненных учетных бланков (УБ), поступающих от подчиненных предприятий в главный информационно-вычислительный центр) взята выборка объемом 101 пачка УБ. Дефектной обозначалась та пачка, которая поступала с опозданием, то есть после срока установленного корпорацией. Каждая из пачек регистрировалась как случайная величина в «Ведомости дефектов» отдельной строкой. На данном этапе также обнаружены дефекты по полноте - отсутствие значений показателей в УБ. Объем выборки в данном случае составил 250 УБ. Дефекты по достоверности на данном этапе не проявились.

На втором этапе (прием УБ после их индексирования (кодирования) в ИВЦ) путем анализа УБ и журнала регистрации приема УБ от предприятий методом случайных чисел была взята выборка в объеме 164 пачек УБ за определенный период. Поскольку техническими условиями по плану-графику установлено время кодирования 200 УБ за рабочую смену, то дефектными идентифицировались те пачки УБ, которые превысили установленное время. Дефектов по полноте на данном этапе обнаружено не было, а дефекты по достоверности не выявлялись.

На третьем этапе (ввод УБ в ЭВМ и обработка документации) была взята выборка объемом 200 УБ. Дефекты по своевременности и полноте на данном этапе не обнаружены. Дефекты по достоверности регистрировались отдельной строкой в «Ведомости». На четвертом этапе обработки (выдача выходных результатных документов абонентам ИС) взята выборка объемом 4806 УБ. В этой выборке были выявлены только дефекты по достоверности в количестве 10 ошибочных символов.

4.2 Обработка экспериментальных данных по исследованию моделей

Ввод в ЭВМ и обработка полного объема данных из «Ведомости дефектов» показала на гистограмме трехмодальное распределение, что подтвердило предположение о неоднородности статистической структуры дефектов. С целью устранения неоднородности в соответствии с моделью проведен кластер-анализ статистической структуры дефектов. Классификация дефектов выполнялось посредством программы кластер-анализа данных. В результате получены обширные распечатки пятистолбцовой таблицы, описывающей пошаговый процесс объединения кластеров, и дендрограммы классификации дефектов [84,140], редуцированный вариант которой представлен ниже (рис. 4.1).


Подобные документы

  • Методология структурного анализа и проектирования информационных систем. Базовый стандарт процессов жизненного цикла программного обеспечения. Цели и принципы формирования профилей информационных систем. Разработка идеальной модели бизнес-процессов.

    презентация [152,1 K], добавлен 07.12.2013

  • Жизненный цикл информационных систем, методологии и технологии их проектирования. Уровень целеполагания и задач организации, классификация информационных систем. Стандарты кодирования, ошибки программирования. Уровни тестирования информационных систем.

    презентация [490,2 K], добавлен 29.01.2023

  • Методологические основы оценки качества информационных ресурсов. Анализ принципов методологии, используемых при решении задач ОКФИС. Логика организации, ее теоретический базис, нормы и правила. Методы и средства моделирования информационных систем.

    контрольная работа [66,7 K], добавлен 23.01.2011

  • Факторы угроз сохранности информации в информационных системах. Требования к защите информационных систем. Классификация схем защиты информационных систем. Анализ сохранности информационных систем. Комплексная защита информации в ЭВМ.

    курсовая работа [30,8 K], добавлен 04.12.2003

  • Применение систем визуализации показателей качества воды. Принципы создания информационных систем, их назначение, цели и требования к ним. Разработка сайта и возможности CMS Joomla. Построение модели информационной системы с помощью CASE-технологий.

    дипломная работа [2,5 M], добавлен 12.08.2017

  • Анализ показателей оценки эффективности информационных систем и технологий. Расчет трудовых и стоимостных показателей и показателей достоверности информации, разработка программы для ускорения методов обработки данных. Интерфейс и листинг приложения.

    дипломная работа [1,2 M], добавлен 14.01.2012

  • Области применения и реализации информационных систем. Анализ использования Web-технологий. Создание физической и логической модели данных. Проектирование информационных систем с Web-доступом. Функции Института Искусств и Информационных Технологий.

    дипломная работа [3,8 M], добавлен 23.09.2013

  • Особенности построения и функционирования информационных систем. Понятие, цель и задачи информационной логистики, информационные потоки и системы. Виды и принципы построения логистических информационных систем. Повышение качества логистического процесса.

    контрольная работа [25,4 K], добавлен 11.11.2010

  • Развитие информационных систем. Современный рынок финансово-экономического прикладного программного обеспечения. Преимущества и недостатки внедрения автоматизированных информационных систем. Методы проектирования автоматизированных информационных систем.

    дипломная работа [1,5 M], добавлен 22.11.2015

  • Изучение деятельности фирмы СООО "Гейм Стрим", занимающейся разработкой программного обеспечения интеллектуальных систем. Проведение работы по тестированию информационных систем на степень защищенности и безопасности от разного рода информационных атак.

    отчет по практике [933,1 K], добавлен 05.12.2012

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.