МАТЕМАТИЧЕСКИЕ ОСНОВЫ МОДЕЛИРОВАНИЯ И АЛГОРИТМИЗАЦИИ (часть2)

главная об авторе содержание часть1 часть3 часть4 литература

II МАТЕМАТИЧЕСКИЕ ОСНОВЫ МОДЕЛИРОВАНИЯ И АЛГОРИТМИЗАЦИИ СЛОЖНЫХ СИСТЕМ

Теория множеств является формальной системой, позволяющей простым универсальным языком описывать сложные системы. Теория и практика математического моделирования сложных систем не может обойтись без этого эффективного математического аппарата. Поэтому прежде чем приступить к изложению основ теории моделирования напомним важные понятия теории множеств, которые будут использованы в дальнейшем.

Множество - исходное понятие теории, обозначающее определенную совокупность некоторых объектов. Основными свойствами множества являются: дискретность, различимость элементов, целостность и идемпотентность

({а, а,...,а} = {a}). Множества обозначаются буквами А, B, .. , Z и выражениями

{a₁, ..., a_n}, где а_i - символ элемента множества, i = 1,...,n. Основными отношениями абстрактных множеств являются:

Image_1.gif (1516 bytes)

Основными операциями над абстрактными множествами и подмножествами являются: проверка истинности заданного отношения,

Image_2.gif (1674 bytes)

Важное значение в построении формальной теории множеств имеют так называемые особые множества и подмножества. К ним относятся:

Image_3.gif (2331 bytes)

В алгебре множеств ( точнее подмножеств универсума) понятия пустое множество и универсум играют роль аналогичную той, которую играют понятия нуль и единица в арифметике. Свойства перечисленных отношений и операций над множествами определяются системой аксиом, образующих абстрактную алгебру множеств. Аксиомы абстрактной алгебры множеств приведены в таблице 2.1.

Таблица 2.1. Основные свойства операций над множествами

Image_4.gif (8635 bytes)

Отметим, что данная алгебра абстрактных множеств не связана с какими-либо методами выполнения вышеупомянутых операций и проверки истинности отношений между множествами. Поэтому при работе с конкретными множествами указанные операции в общем случае выполняются посредством полного перебора элементов заданных множеств, а сами множества задаются в виде списков имен принадлежащих им элементов. Проблема компактного представления множеств и перебор их элементов является одной из основных проблем математического моделирования сложных систем. Для ее решения применительно к конечным перечислимым множествам предложена теория исчисления обобщенных кодов подмножеств [14].

2.2. Представление множеств и подмножеств обобщенными кодами.

Пусть U - множество универсум, содержащее в себе все элементы с определенными свойствами, например множество всех людей, множество всех космических аппаратов, множество всех вещей, находящихся в вашей комнате и так далее. Для описания свойств всех элементов универсума вводится база переменных X₁, X₂, ..., X_n, характеризующих показатели соответствующих свойств S_i элементов из U и принимающих значения из множеств A_i = {a_0,a₁, ..., a_s}_i, i = 1,...,n. При этих обозначениях элемент из U представляется кортежем (кодом)

k_j = (а_е1, а_g2, ..., а_sn)О(A₁ґA₂ґ ... ґ A_n). Пусть символ a _i обозначает любое, в том числе и пустое, подмножество из А_i, тогда кортеж К_j= (a ₁, a ₂, ..., a _n) будем называть обобщенным кодом подмножества

M_j = (a ₁ґa ₂ґ...ґa _n)Н(A₁ґA₂ґ ... ґ A_n) = U. Другими словами, K_j есть код подмножества M_j из универсума U. Обобщенный код K_j, в котором все компоненты a ₁,...,a _n представляют собой конкретные значения а_е1,..., а_snпеременных X₁,...,X_n, называется элементарным кодом, то есть - кодом отдельного элемента из U.

Пример. Пусть U есть множество людей, обладающих следующими свойствами: X₁ - имя из множества {петр, ольга, иван, фома}=A₁,

X₂ - пол из {мужчина, женщина}=A₂,

X₃- год рождения из {1950, ..., 1996}=A₃,

X₄ - образование из {начальное, среднее, высшее}=A₄. Тогда конкретные люди из множества U обозначаются элементарными кодами, например К₁=(иван, мужчина, 1960, высшее), а подмножество M₂ из U всех мужчин, не имеющих высшего образования, обозначается обобщенным кодом

К₂=(- ₁, мужчина,щ высшее, - ), где знак - ₁означает, что переменная Х₁ может принимать любое значение из множества А_1.Весьма важную роль в теории множеств и в других формальных системах играют так называемые особые подмножества, к которым относятся: одноэлементное множество {a}, пустое множество , собственно множество А в целом, дополнение элемента {a} к множеству А, перечисление элементов ({a_e}, ..., {a_g}) из А, перечисление дополнений и дополнение перечисления. Для построения обобщенных кодов в теории исчисления обобщенных кодов [14] используются специальные символы особых подмножеств базовых множеств A_i. Вот эти символы: a_ei » {a_e}_iОA_i,

` a_{ei »}(A_i\ {a_e}_i) или щ a_{ei »}(A_i\ {a_e}_i), - _{i »}A_i, q _{i »},

(а_е, ..., а_s)_i
»{{a_e}, ..., {a_s}}_iНA_i, щ (а_е, ..., а_s) » A_i\ {{a_e}, ..., {a_s}}_i

и (щ а_е, ..., щ а_s). Здесь символ “» ” используется в качестве символа метаязыка, обозначающего эквивалентность выражений. В формальных выражениях исчисления обобщенных кодов символ a _iобозначает переменную с множеством значений

{a_ei,` a_ei, - _i, q _i, (а_е,...,а_s),щ (а_е, ..., а_s), (` а_е, ...,` а_s) }. Поэтому формула К_j=(a ₁,...a _i,...,a _n) означает, что в конкретных обобщенных кодах символы a _i замещаются соответствующими символами особых подмножеств из множеств А_i. Позиции переменных a _iв обобщенном коде К_j называются разрядами обобщенного кода. Разряды различных обобщенных кодов, относящиеся к одной и той же переменной Х_i, называются одноименными. Представление подмножеств универсума U обобщенными кодами позволяет выполнять над ними все теоретико-множественные операции по формальным правилам, посредством определенных действий над обобщенными кодами, подобно тому, как выполняются операции над числами, представленными цифровыми кодами. Термин “обобщенный код” заимствован из работ профессора Л. Т. Мавренкова (ВИА им.Ф.Э.Дзержинского), где он использовался для обозначения интервалов двоичных чисел.

2.3. Исчисление обобщенных кодов подмножеств универсума

Исчислением обобщенных кодов подмножеств M_jНU называется формальная система, в которой определены:

базовое множество переменных X_i (i=1,..., i=n) с множествами значений A_i= {a_0,a₁, ..., a_s}_i;

множество U=(A₁ґA₂ґ ... ґA_n), называемое пространством элементарных кодов;

способ представления (кодирования) подмножеств M_jНU обобщенными кодами К_j= (a ₁,..., a _i, ..., a _n);

множество бинарных отношений R={=, № , М , Л ,Н };

множество операций Q={И , З , \, ^ } над подмножествами M_jНU, представленными их обобщенными кодами К_j;

установлены формальные правила для определения истинности отношений и для нахождения кодов результатов операций.

В дальнейшем, для краткости, вместо слов: “отношение (операция) над подмножествами M_j и M_k,представленными обобщенными кодами K_j и K_k”, будем говорить: “отношение (операция) над кодами K_j и K_k”, имея в виду, что речь идет о действиях над соответствующими подмножествами элементарных кодов, представленными в обобщенных кодах K_j и K_k.

Пусть K_j= (a ₁,..., a _i, ..., a _n)_j и K_k= (a ₁,..., a _i, ..., a _n)_k,

где a _ij, a _ikО{- _i, a_ei, ` a_ei, q _i, (а_e,...,а_s), щ (а_e, ..., а_s), (` а_e, ...,` а_s) },

iО{1,...,n}, j,kО{1,...,m}, и пусть предполагается, что отношения между символами особых подмножеств указывают на те же отношения между соответствующими этим символам подмножествами элементов a_eiОA_i. Тогда для определения истинности отношений между подмножествами M_jНU можно применять следующие правила:

K_j=K_k, если, и только если, a _ij= a _ik для всех i=1,..., i=n;

K_jНK_k, если, и только если, a _ijНa _ik для всех i=1,..., i=n;
K_jМK_k, если хотя бы в одном одноименном разряде имеется отношение a _ij I a _ik при наличии отношений a _ijНa _ik во всех остальных одноименных разрядах.

Пример 1. Дана база переменных (X₁² X₂³ X₃³) с базовыми множествами А₁={0, 1}, A₂={0, 1, 2}, A₃={0, 1, 2} и даны обобщенные коды K₁=(1, 0, -) и K₂=(1, ` 2, -). Номера разрядов обобщенных кодов строго соответствуют номерам позиций базовых переменных X_i, поэтому индексы разрядов в обобщенных кода можно опускать. Согласно правилу 3 данные обобщенные коды находятся в отношении K₁МK₂, так как (0₂)₁М(` 2₂)₂, а также (1₁)₁=(1₁)₂ и (- ₃)₁=(- ₃)₂. Действительно по определению K₁={(1, 0,1), (1, 0, 0)}

и K₂={(1, 1, 0), (1, 1, 1), (1, 1, 2), (1, 0, 0), (1, 0, 1), (1, 0, 2)}.

Легко заметить, что подмножество элементарных кодов, представленное обобщенным кодом K₁, целиком содержится в подмножестве элементарных кодов, представленных обобщенным кодом K₂ (смотри коды, выделенные жирным шрифтом).

Определение. Обобщенные коды называются ортогональными, если они представляют непересекающиеся подмножества элементарных кодов. Отношение ортогональности обобщенных кодов будем обозначать символом ^ . Для проверки истинности отношения ортогональности обобщенных кодов установлено следующее правило: K_j ^ K_k (читается: K_j и K_k ортогональны), если хотя бы в одном одноименном разряде данных кодов имеется отношение a _ij З a _ik=q _i, т. е. подмножества значений, представленные переменными a _ij и a _ik не пересекаются.

Пример 2. Коды (- , ` 1, 2)₁ и (- , 1, 2)₂ ортогональны, так как подмножества {0, 2}₂₁ и {1}₂₂, представленные соответственно символами ` 1 и 1, не пересекаются.

Определение. Операция “@” над обобщенными кодами K_j и K_k, соответственно представляющими собой подмножества M_jи M_kиз U, есть последовательность действий, приводящих к получению кода K_r или объединения кодов K_r,...,K_t, представляющих подмножество M^*НU такое, что M^* = M_j@M_k. Формальная запись операции над обобщенными кодами имеет вид K_j@K_k = {K_r,...,K_t,}. Для выполнения операций над обобщенными кодами подмножеств MНU были установлены следующие формальные правила.

Операция пересечения: K_j З K_k = K_r. Для получения кода пересечения K_r необходимо во всех одноименных разрядах заданных кодов выполнить следующие действия: a _ij З a _ik=a _ir, i=1,..., i=n. K_r= , если хотя бы в одном разряде имеет место соотношение a _ijЗa_ik=q _ir.

Пример 3. Для кодов K₁=(1,0,-) и K₂=(1,`2,-) примера 1 в результате поразрядных операций находим: (1₁)₁З(1₁)₂=(1₁)₃,(0₂)₁З(`2₂)₂=(0₂)₃, (-₃)₁З(-₃)₂=(-₃)₃. Поэтому код пересечения будет следующим K₃=(1,0,-). В данном случае K₃=K₁, так как K₁МK₂.

Операция объединения: K₁ИK₂И...ИK_s=K_r. Коды K₁,K₂ ... K_s могут быть объединены в один обобщенный код K_r по разрядам i,...,e, если из комбинаций q_j=(a_i,..,a_e) значений данных разрядов можно составить декартово произведение a _iґ...ґa _e, а значения всех остальных одноименных разрядов заданных кодов одинаковы, то есть: a _k1= ... = a _ks ля всех k№i,...,k№e. Здесь a_i,..,a_e- соответственно любые значения из a _i,...,a _e, j=1,..., j=m, где m - количество элементов множества {a _iґ...ґa _e}.

Пример 4. Двоичные обобщенные коды (-,1,0,0)₁, (-,1,0,1)₂, (-,1,1,0)₃, (-,1,1,1)₄ можно объединить по третьему и четвертому разрядам, так как из значений этих разрядов можно составить декартово произведение А₃ґА₄={0,1}ґ{0,1}={(0,0),(0,1),(1,0),(1,1)}»(-₃,-₄), а остальные разряды имеют поразрядно одинаковые значения. Поэтому код данного объединения имеет вид (-,1,-,-).

Пример 5. Коды K₁=(0,1,1), K₂=(0,0,1), K₃=(1,1,1), K₄=(1,0,1) с базой A₁={0,1}, A₂={0,1,2}, A₃={0,1,2} можно объединить в один обобщенный код K_r= (-,`2,1). Это следует из того, что {(0,0),(0,1),(1,0),(1,1)}=({0,1}ґ{0,1})=((-₁)ґ(`2₂))=(-₁,2), и при этом третьи разряды всех заданных кодов содержат одинаковые значения - “1”.

Пример 6. Коды K₁=(0,`2,1), K₂=(1,`2,1), K₃=(0,2,1), K₄=(1,2,1) с базой, указанной в предыдущем примере, можно объединить по двум первым разрядам. Это объединение выполняется так: (0,`2)₁И(1,`2)₂И(0,2)₃И(1,2)₄={0,1}ґ{0,1,2}=(-₁)ґ(-₂) = (-₁, -₂). В результате получим: K₁ИK₂ИK₃ИK₄=(-₁, -₂,1).

Пример 7. Коды K₁=(1,2,1), K₂=(1,2,0) с неизвестной базой можно объединить так K₁ИK₂=K₃=(1,2,(1,0)). При этом, если затем окажется, что A₃={0,1}, то можно преобразовать результат объединения к виду K₃=(1,2,-), если A₃={0,1,2}, то результат можно представить как K₃=(1,2,`2).

Из приведенных примеров видно, что объединение элементарных кодов в обобщенные открывает широкие возможности для экономного представления множеств конкретных объектов и анализа свойств этих множеств без полного перебора всех содержащихся в них элементов. Однако следует заметить, что одно и то же множество элементарных кодов может быть представлено различными обобщенными кодами. Поэтому важной проблемой теории исчисления обобщенных кодов является проблема поиска методов представления множеств элементарных кодов (подмножеств универсума U) объединением обобщенных кодов с минимальным числом обобщенных кодов или с минимальным количеством символов (a _ei) значений переменных X_i в объединении обобщенных кодов. Ряд методов частичного решения данной проблемы известен в современной математической логике, где они используются для минимизации форм представления логических функций [4,14].

Определение. Разностью K_j \ K_k называется объединение всех элементарных кодов из K_j, не принадлежащих пересечению K_jЗK_k, то есть R = K_j \ (K_jЗK_k). R= K_j, если K_jЗK_k=и R= K₁ИK₂И ... ИK_s, если K_jЗK_k№и K_j№K_k.

Операция вычитания: K_j \ K_k= K₁ИK₂И...ИK_s = R. Результат вычитания кода K_kиз кода K_jполучается в виде объединения кодов K₁,K₂,..., K_s, которые образуются из заданных обобщенных кодов по правилам:

K_j \ K_k=, если K_j = K_k;

число s обобщенных кодов, представляющих разность R, равно числу разрядов заданных кодов, удовлетворяющих условиям: a _ijЗa _ik№q_i и a_ij№a _ik;

код K_r (r=1,...,s) из R подучается в результате выполнения следующих действий: разряд, номер которого равен i, кода K_r заполняется значением a _ir= a _ij \ a _ik, а все остальные разряды кода K_r заполняются значениями одноименных разрядов кода K_j.

Пример 8. Найти разность R = (0,-,`2,1)₁\ (0,0,0,-)₂ обобщенных кодов с базой (X²₁,X³₂,X³₃,X²₄). Здесь верхний индекс указывает на значность переменной X_i, то есть на мощность базового множества A_i. Решение:

1) (-₂)₁ \ (0₂)₂ = (` 0₂)_r, поэтому K₁^r=(0,`0,`2,1),

2) (`2₃)₁ \ (0₃)₂ = (1₃)_r, поэтому K₂^r=(0,-,1,1),

R = (0,`0,`2,1)И(0,-,1,1).

Читателю предлагается проверить, что R представляет собой все элементарные коды из кода (0,-,`2,1)₁,кроме кода (0,0,0,1), который является пересечением исходных обобщенных кодов K₁ и K₂. Операция вычитания обобщенных кодов является весьма полезной при решении многих практических задач с конкретными конечными множествами, представленными обобщенными кодами. Одной из таких задач является задача ортогонализации обобщенных кодов.

Операция ортогонализации двух пересекающихся обобщенных кодов. Эта операция может быть выполнена двумя способами:

K_jИK_k= K_jИ (K_k \ K_j) и 2) K_jИK_k= K_kИ (K_j \ K_k),

так как K_j ^ (K_k \ K_j) и K_k ^ (K_j \ K_k) по определению разности (K_j\K_k).

Пример 9. Представить объединение двух обобщенных кодов (0,`0,2,1)₁И(0,-,1,1)₂из предыдущего примера объединением ортогональных кодов. Решение:

1) (0,`0,`2,1)₁ \ (0,-,1,1)₂ = (0,`0,0,1)₃, поэтому

(0,`0,`2,1)₁И(0,-,1,1)₂= (0,-,1,1)₂И(0,`0,0,1)₃;

2) (0,-,1,1)₂ \ (0,`0,`2,1)₁= (0,0,1,1)₄, поэтому

(0,`0,`2,1)₁И(0,-,1,1)₂=(0,`0,`2,1)₁И(0,0,1,1)₄.

Легко проверить, что полученные результаты представляют собой одно и тоже подмножество элементарных кодов, а именно:

Е={(0,0,1,1), (0,1,1,1), (0,2,1,1), (0,1,0,1) (0,2,0,1)}.

Операция декартового умножения обобщенных кодов из двух различных универсумов U₁ и U₂. Пусть заданы два подмножества M₁ из U₁ и M₂ из U₂ с соответствующими базами переменных (X₁,...,X_n) и (X_n+1,...,X_m). K₁и K₂ - обобщенные коды подмножеств M₁ и M₂ соответственно. Тогда декартово произведение M_1?M₂ может быть представлено одним обобщенным кодом K_r, который получается в результате конкатенации (присоединения) кодов K₁и K₂, то есть: M_1?M_{2 »}K_{1 ?}K₂ = (K₁, K₂).

Пример 10. Пусть дано K₁=(-,`2,0,0)₁ с базой (X²₁, X³₂, X³₃, X²₄)₁ и K₂=(-,1,0)₂ с базой (X²₅, X³₆, X³₇)₂. Тогда K₁ґK₂= (-₁,`2₂,0₃,0₄,0₅,1₆,0₇). Свойства данной операции, в отличие от всех предыдущих, еще мало изучены и область ее применимости не исследована.

2.4. Элементы теории отношений. Общее понятие и свойства отношений

Подобно понятию “множество” понятие отношение является фундаментальным понятием математики. В математическом моделировании оно используется как исходное понятие для построения основных теоретических положений. Поэтому нам следует отдельно рассмотреть свойства отношений, методы их формализации и операции с отношениями.

Определяющими атрибутами любого отношения являются:

свойство, по которому определяется отношение рассматриваемых объектов;

размерность, или, другими словами, мера данного свойства, определяющая соответствующую единицу измерения;

область значений, представляющая собой базовое множество данного свойства;

имя отношения, которое является символическим ярлыком его сущности. (Сущность есть концентрированное выражение свойств некоторого объекта);

время, к которому относится отношение (настоящее, прошедшее или будущее);

формула, представляющая собой конструкцию из символов определенного языка, отражающую сущность отношения;

Всеобщими свойствами отношений являются:

истинность – характеристика реальности отношения в определенных условиях; отношение, как субъективное отражение объективной реальности, может быть истинным, ложным или неопределенным, мерой истинности, как правило, служит вероятность;

местность, по количеству аргументов отношение может быть одноместным, двухместным и так далее, вообще говоря, n-местным;

сущность, как концентрированное выражение совокупности основных логических свойств отношения: симметричности, транзитивности, рефлексивности, антисимметричности и антирефлексивности;

предметность, устанавливающая связь отношения с конкретными свойствами конкретных объектов.

Формальное определение понятия отношения обычно дается в терминах теории множеств. При этом, в общем случае, отношением называется подмножество R декартового произведения (A₁ґA₂ґ...ґA_n), где A_i - базовое множество значений некоторого свойства X_i.

Отметим четыре важных частных случая:

R представляет собой подмножество универсума U, если все свойства X_i, i=1,...,n, относятся к объектам одного определенного класса, например люди, деревья, космические аппараты и т. д.;

R представляет собой отношение, определенное в некоторой формальной системе, например, в алгебре величин, алгебре множеств, в исчислении высказываний и т. п., если A₁=A₂= ...=A_n;

R представляет собой значение показателя определенного свойства X_i, если R={a_e}ОA_i, или RН A_i;

(n+1)-местное отношение F называется функциональным, или просто - функцией, если для любых элементов а_е,...а_g,a_h,a_k из A₁,...,A_n, A_(n+1), A_(n+1) соответственно из (а_е1,...а_gn,a_h(n+1))ОF и (а_е1,...а_gn,a_k(n+1))ОF следует a_h(n+1)=a_k(n+1), другими словами, отношение F называется функциональным, если оно представляет собой однозначное отображение декартового произведения (A₁ґ...ґA_n) в множество A_(n+1);

всякое отношение характеризует определенное состояние, или взаимодействие объектов.

Общий вид формулы любого отношения может быть следующим:

(2.1)

где аргументы представляют собой значения свойств объектов некоторого универсума, например БОЛЬШЕ(x, y), ЛЮБИТЬ(Иван, Марья), СЛОЖИТЬ(10, 2, 4), И(дождь, ветер, звезд_ночной_полет). Заметим, что слова БОЛЬШЕ и И не являются глаголами, но при употреблении их в качестве имен отношений они соответственно имеют смысл (по умолчанию) “Быть больше” и “Одновременно иметь место”. В классической математике отношения R с однородной базой (AґA) называются бинарными [11]. Если (x,y)ОRН(AґA), то говорят, что элементы x и y находятся в бинарном отношении R. Формальная запись бинарных отношений имеет вид: (x,y)ОR, xRy, R(x,y) или x*y, где x и y любые элементы, взятые их множества А. Другими словами, x и y - переменные, принимающие значения из множества А, а R или * - имя отношения. В связи с тем, что по определению отношения R являются подмножествами некоторого универсума U, к ним применимы все известные нам теоретико-множественные операции. С другой стороны, все теоретико-множественные операции - суть отношения между объектами, определенными как множества. Кроме уже упоминавшихся теоретико-множественных операций для бинарных отношений дополнительно были установлены еще следующие операции: обращения R^-1={ (x,y)| (y,x)ОR}, умножения R_1°R₂ = {(x,y)| ($ zОA) (xR₁z и zR₂y)} (последнее выражение читается: (x,y) есть результат умножения R_1°R₂, если существует элемент z из A такой, что xR₁z и zR₂y); а также отношение равенства D ={(a, a)| aОА}, представляющее собой диагональ множества (AґA), и отношение следствия R₁ЮR₂, означающее, что из истинности R₁ всегда следует истинность R₂. В общем случае отношения описывают на некотором формализованном языке определенные связи между естественными или абстрактными объектами. В то же время сами отношения по определению являются формализованными символьными объектами (формулами), обладающими вполне определенными логическими свойствами. Суть этих свойств для бинарных отношений показана в таблице 2.2, где x, y, z - символы переменных, характеризующих свойства каких-нибудь объектов из универсума U, * и · - символы переменных, обозначающих имена отношений, а Щ, Ъ, Ю, щ, є - формальные символы, соответствующие словам: И, ИЛИ, СЛЕДУЕТ, НЕ, ТОЖДЕСТВЕННО в их обычном смысле.

Таблица 2.2. Основные свойства отношений

Image_8.gif (7495 bytes)

Изложенные определения и свойства отношений используются практически во всех разделах математики и математического моделирования, в частности, в ряде дедуктивных систем, моделирующих логику суждений. Одной из этих систем является исчисление высказываний, которое рассматривается в следующем параграфе.

2.5. Понятие об исчислении высказываний

При моделировании проектов сложных систем единственным способом доказательства адекватности математической модели и будущей реальной системы является логический вывод правдоподобных суждений о свойствах будущей системы и об отношениях между ними. Формализация методов логического вывода суждений дается в теориях исчисления высказываний, логических функций и предикатов. Мы будем рассматривать высказывание как определенное отношение PНU, представленное на некотором формализованном или естественном языке. При этом будем полагать, что всякое высказывание P_i обладает свойством истинности (X_i) с областью значений E_i= {истинно, ложно}. Другими словами, P_iесть функциональное отношение, определенное в универсуме V= UґE, как функция f_i(X₁, ...,X_n), принимающая значения из множества истинности E. Значения “истинно”, “ложно” часто для краткости обозначают цифрами “1”, “0”. В этом случае их не следует воспринимать как какие-то количественные оценки, кроме как вероятности соответствующих логических значений “истинно”, “ложно”. Под исчислением высказываний понимают формальную систему операций и отношений, определенных в универсуме V. Всякая формальная система Ф определяется как четверка множеств (A, F, G, R), где A - алфавит символов языка данной системы, F - множество всех формальных выражений (формул), G - подмножество формул из F, называемых аксиомами, R - множество правил, служащих для вывода любой формулы из F из заданного множества аксиом. Пишут Ф = (A, F, G, R). В зависимости от смыслового определения множеств A, F, G, R возможны различные варианты исчисления высказываний. Известными частными случаями исчисления высказываний являются: булева алгебра, алгебра логики, логические функции и исчисление предикатов. Далее рассмотрим один из возможных обобщенных вариантов исчисления высказываний.

Определение алфавита А.

A = {p₁,...,p_n, 0, 1, ..., a, ...,z, E, истинно, ложно, ( , ) , щ , ® , » , є , Щ, Ъ , Ы , Ю }, где “A”, “=”, “{“, “}”, “,” - символы метаязыка, с помощью которого определяется исчисление, p_i - элементарные высказывания о свойствах объектов из U, рассматриваемые как элементарные функции f(X_i) = a, aОE, 0,1,... - цифровые символы, которые используются как числа или как символы логических значений “ложно”, “истинно”, a, ..., z - буквы латинского алфавита, употребляемые в качестве значений свойств, о которых идет речь в высказываниях; E - множество {истинно, ложно}; щ , ® , » , є , Щ, Ъ , Ы , Ю - символы отношений между высказываниями и формулами, имеющие следующий смысл:

“p_i” – любое высказывание, принимающее значение “истинно” или “ложно” при определенных условиях;

“щ p_i“ - отрицание высказывания p_i,представляет собой высказывание истинное, когда p_i ложно, и ложное, когда p_iистинно, другими словами, щ p_i = (E \ { e }), если p_i= e, eОE; такой же смысл имеет и запрись ` p_i;

“p_i ® p_j” - импликация высказывания p_jвысказыванием p_i, представляющая собой высказывание p_k, ложное, когда p_i истинно, а p_j ложно, то есть p_i ® p_j= p_k - (ложно) только если (p_i, p_j) = (истинно, ложно), где истинноО E и ложно ОE;

“p_i » p_j” - эквивалентность высказываний, представляющая собой истинное высказывание p_k, тогда и только тогда, когда оба высказывания p_i и p_jимеют одинаковые значения истинности, то есть, когда (p_i, p_j) =(е, е), для всех (е,е)ОEґE;

“p_i є p_i” - тождество высказываний является всегда истинным высказыванием p_k, независимо от значений входящих в него переменных p_i, например щ щ p_i;

“p_iЩp_j” - конъюнкция высказываний p_i и p_j есть отношение, соединяющее данные высказывания союзом “И”, высказывание p_k = (p_iЩ p_j) истинно только тогда, когда оба высказывания p_i и p_j истины;

“p_iЪp_j” - дизъюнкция высказываний p_i и p_j есть отношение, соединяющее данные высказывания союзом “ИЛИ”, высказывание p_k= (p_iЪp_j) ложно только тогда, когда оба высказывания p_i и p_j ложны;

“f_iЫ f_j” – равносильность есть отношение, указывающее на эквивалентность формул f, состоящих из высказываний и отношений между ними, f_i равносильно f_j, если они имеют одинаковые значения истинности на одинаковых наборах значений истинности высказываний и отношений, из которых они составлены;

“f_iЮ f_j” – следствие это высказывание, обозначающее тождественно истинную импликацию, говорят, что формула f_j следует из формулы f_i, если f_j истинно на всех наборах значений переменных, на которых истинно f_i.

Определение формул.

1. Всякое высказывание, связанное со значением истинности из Е и обозначаемое символом p_i, есть формула f.

2. Если выражение f - формула, то выражение щ f - тоже формула.

3. Если выражения f_i и f_j- формулы, то выражения (f_i * f_j), где *О{® , » , є , Щ, Ъ , Ы , Ю } - тоже формулы.

4. Других формул нет.

Определение аксиом.

Аксиомы обычно определяются как бинарные функциональные отношения (элементарные функции f (p_i, p_j)=e, eОE), из которых затем с помощью правил вывода составляются все остальные формулы данной системы. Истинность высказывания p_k= f_k (p_i, p_j) определяется в зависимости от истинности входящих в него высказываний p_i, p_j. Один из вариантов множества аксиом, которые мы будем использовать в дальнейшем, приведены в таблице 2.3, где для изображения формул применяются символы вышеперечисленного алгоритма и используются следующие обозначения: f_k= f_k (p_i, p_j), k=1, 2, ... 10, “1” » “истинно”, “0” » “ложно”.

Таблица 2.3.

4. Определение правил вывода.

Главной задачей формальной теории вывода является образование тождественно истинных формул (тавтологий) из заданного подмножества исходных тождественно истинных формул (исходных тавтологий).

Формула называется тавтологией, если она остается истинной при любых значениях входящих в нее высказываний. Например, формула f₁®f₂єщf₁Ъf₂ является тавтологией, так как она истина при любых значениях ее компонентов f₁ и f₂, что легко проверить простой подстановкой этих значений в данную формулу.

Вообще существует бесконечное множество тавтологий. Однако на практике задача вывода решается с использованием определенного ограниченного подмножества простых очевидных тавтологий и нескольких формальных правил вывода.

Простейшие тавтологии рассматриваемой версии исчисления высказываний образуются из аксиом, приведенных в таблице 2.3, с учетом свойств отношений, которые используются для их образования. Часть наиболее известных часто применяемых тавтологий представлена в таблице 2.4.

Таблица 2.4. Система основных тавтологий (законов) исчисления высказываний

Image_10.gif (8512 bytes)

Для логического вывода обычно используют следующие два правила:

правило подстановки, утверждающее, что в результате замены всех входящих в тавтологию F_i символов переменной X на произвольную формулу f получается формула F_j, которая также является тавтологией;

правило заключения, определяющее, что в импликации F_1®F₂ формула F₂ является тавтологией тогда и только тогда, когда F₁ является тавтологией.

Формула F (тавтология) называется выводимой в исчислении, если она может быть получена из конечного подмножества исходных формул (тавтологий) путем конечного числа операций по применению правил вывода. Вообще говоря, не все тождественно истинные формулы (тавтологии) могут быть выведены из произвольно взятого набора тавтологий. Однако, строго доказано, что в исчислении высказываний существуют такие конечные подмножества тавтологий (функционально полные системы аксиом исчисления), из которых может быть выведена любая тождественно истинная формула. Это означает, что задача об определении функционально полной системы аксиом исчисления высказываний является разрешимой. На практике обычно ищут и используют наиболее простые и удобные для практического применения функционально полные системы аксиом. Одной из таких систем является, например, система тавтологий представленная в таблице 2.4. Следует заметить, что процесс вывода формул связан с перебором множества возможных подстановок и с выбором вариантов, удовлетворяющих условиям тождества. Поэтому на практике задачи логического вывода связаны с большим объемом логических операций и часто из-за этого оказываются практически неразрешимыми.

2.6. Метод дедуктивного логического вывода

В математической логике теория логического вывода предназначена в основном для формализации доказательства теорем [5]. Доказательство теорем, как правило, ведется методом дедукции (от общего к частному), согласно которому истинное заключение выводится в результате конечного числа тождественных преобразований исходных формул в искомую заключительную формулу. Формальная схема этого метода преобразования имеет следующий вид:

Ф₁Щ Ф₂Щ ... ЩФ_n®F₁ Ъ F₂ Ъ ...Ъ F_m. (2.2)

На практике этот метод логического вывода обычно используется для определения истинности конкретных отношений по заданным исходным отношениям (фактам), которые априори считаются истинными, и по определенным формулам (правилам вывода) следующего вида:

Ф₁Щ Ф₂Щ ... Щ Ф_n®F. (2.3)

Вывод осуществляется по правилам подстановки заданных фактов в левую часть выражения 2.2 вместо содержащихся там символов переменных. Данная методика называется конкретизацией высказываний. В наших обозначениях конкретизация высказываний или отношений означает подстановку в его формулу конкретных значений a_eОA вместо входящих в нее предметных переменных X. Формальная постановка задачи конкретизации высказываний состоит в следующем. Дано:

множество D фактов, представляющих собой конкретные, или частично конкретные высказывания или отношения;

множество R правил вывода, представляющих собой тождественно истинные формулы Ф₁ Щ Ф₂ Щ Ф_n®F_j, содержащие переменные X_i.

Требуется путем конкретизации заданных правил найти конкретные отношения F_j, истинность которых по определению следует из истинности заданных исходных фактов и правил вывода.

Пример. Пусть заданы следующие факты:

ЕСТЬ (Петр, мужчина),

РОДИТЕЛЬ (Петр, Иван), и определено следующее правило вывода:

ЕСТЬ(X, мужчина) Щ РОДИТЕЛЬ(X, Y) ® ОТЕЦ(X, Y).

Выполняя конкретизацию данного правила путем подстановки значений переменных X и Y, которые они имеют в заданных фактах, получим конкретное отношение ОТЕЦ (Петр, Иван). Формализация и автоматизация данной методики вывода широко известна под именем системы ПРОЛОГ, включающей в себя специализированный язык логического программирования (Пролог) и реализующее его программное обеспечение [1,12]. Обратим внимание, что в классическом исчислении высказываний фактор времени рассматриваемых отношений в явном виде не указывается. Время действия отношения обычно определяется по форме глагола, употребляемого в качестве имени, или из контекста. Проблема формализованного представления (моделирования) высказываний и отношений с учетом времени и пространства сегодня еще не решена, несмотря на наличие значительного количества работ в этой области. Не менее интересной является и обратная задача, состоящая в том, чтобы по заданным конкретным фактам найти обобщенные формулы, представляющие собой правила вывода. По сути, это задача индуктивного вывода (вывода от частного к общему). Формальная постановка данной задачи состоит в следующем. Дано множество D факторов, отражающих определенные отношения в некоторой предметной области. Найти обобщенное правило, связывающее некоторые факты в тождественно истинные формулы с предметными переменными, характеризующими данную предметную область.

Пример. Пусть заданы следующие факты:

ЕСТЬ (Петр, мужчина),

РОДИТЕЛЬ (Петр, Иван),

ОТЕЦ (Петр, Иван),

ЕСТЬ (Фома, мужчина),

ЕСТЬ (отец, мужчина). Из этих фактов необходимо вывести формулу

ЕСТЬ(X, мужчина) Щ РОДИТЕЛЬ(X, Y) ® ОТЕЦ(X,Y).

В настоящее время формальная методика решения таких задач пока не существует, но она была бы полезной для решения многих практических и теоретических задач, связанных с поиском обобщенных выводов.

2.7. Методика индуктивного логического вывода

Для построения методики индуктивного вывода мы разделим все возможные высказывания на три принципиально различных класса. К первому классу отнесем высказывания, определяющие свойства объектов. Формально эти высказывания представляют собой двухместные отношения вида S(x, y), где S - имя отношения (свойства), xОX, yОY, X - переменная, определенная на множестве объектов, а Y - переменная, определенная на множестве значений свойства S, x и y - конкретные значения переменных X и Y соответственно.

Пример. ЛЮБИТ (человек, пиво), ЕСТЬ (Петр, мужчина).

Ко второму классу высказываний отнесем высказывания, определяющие объекты. Формальные выражения для таких высказываний имеют следующий вид: Q(S₁ЩS₂Щ...ЩS_n), или Q(S₁,S₂,...,S_n), где Q - имя определяемого объекта, а S_i - имя свойства, или его значения. В последнем случае наименование свойства должно быть определено заранее. Пример.

ЧЕЛОВЕК (ИМЯ, РОСТ, ДАТА_РОЖДЕНИЯ, ОБРАЗОВАНИЕ),

ТРАНСПОРТНОЕ_СРЕДСТВО (автомобиль, СКОРОСТЬ_ ДВИЖЕНИЯ, ГРУЗОПОДЪЕМНОСТЬ).

Слово, состоящее из заглавных букв, означает переменную, вместо которой может быть подставлено значение из области ее определения. К третьему классу высказываний отнесем все высказывания, представляющие собой логические формулы, составленные из высказываний первого, второго и третьего класса.

Пример. ЕСТЬ(Петр, человек) Щ ЛЮБИТ(человек, пиво) ® ЛЮБИТ(Петр, пиво).

Заметим, что данная формула является истинной только тогда, когда отношение ЕСТЬ(Петр, человек) обладает свойствами коммутативности и рефлексивности.

Первым условием индуктивного вывода является наличие достаточного количества фактов, на базе которых можно было бы сделать какие-то обобщения. Вот пример простейшей базы данных (фактов), на основании которой можно сделать некоторые индуктивные выводы: Первым шагом индуктивного вывода может быть объединение объектов, обладающих одинаковыми значениями одноименных свойств. При этом существует два способа объединения объектов: дизъюнктивное объединение с помощью связки ИЛИ и конъюнктивное объединение с помощью связки И. Для получения этих объединений в пределах заданной базы достаточно выполнить, например, следующие формальные преобразования:

ЕСТЬ(Петр, мужчина) Ъ ЕСТЬ(Иван, мужчина) Ъ ЕСТЬ(Фома, мужчина) ® ЕСТЬ((ПетрЪ ИванЪ Фома), мужчина),

ЕСТЬ(Петр, мужчина) Щ ЕСТЬ(Иван, мужчина) Щ ЕСТЬ(Фома, мужчина) ® ЕСТЬ((ПетрЩ ИванЩ Фома), мужчина).

По существу эти преобразования представляют собой вынесение за скобки значения “мужчина”, как свойства, которым обладают некоторые из перечисленных объектов (выражение 1), или все перечисленные объекты (выражение 2). Пусть X₁ - переменная, определенная на множестве A₁={Петр, Иван, Фома}, тогда результат первого преобразования можно представить высказыванием СУЩЕСТВУЕТ(Х₁, мужчина), а второго - КАЖДЫЙ(Х₁, мужчина). Так мы приходим к известным классическим формам исчисления предикатов: $ xО A₁ ЕСТЬ(x, мужчина), читается: существует x из A₁ такой, что x есть мужчина, и " xО A₁ ЕСТЬ(x, мужчина), читается: для всех x из A₁ x есть мужчина. Так из конкретных фактов выводятся высказывания с предметными переменными, принимающими значения из определенных подмножеств. Отношение ЕСТЬ(X, Y) указывает, что аргумент X обладает свойством Y. По смыслу данного отношения объединять можно как объекты, обладающие одинаковыми свойствами, так и свойства, характеризующие одинаковые объекта. Следовательно, в заданной выше базе возможны и такие преобразования:

ЕСТЬ(отец, мужчина) Щ ЕСТЬ(отец, РОДИТЕЛЬ) ®

ЕСТЬ(отец, (мужчина Щ РОДИТЕЛЬ));

ЕСТЬ(родитель, мужчина) Ъ ЕСТЬ(родитель, женщина) ® ЕСТЬ(родитель, (мужчина Ъ женщина).

Заметим, что в первом случае речь идет о свойствах одного и того же объекта, а во втором о свойствах различных объектов, имеющих одинаковое наименование. Это различие отражается соответственно символами “Щ ” и “Ъ ”. Если предположить, что в любой формуле свойства S(x, y) первый аргумент всегда представляет собой имя (или имена) объектов, а второй аргумент представляет собой значение (или значения) свойства (или свойств) данного объекта, то будут справедливы следующие формальные соотношения:

S(x, y) ® xS(y), то есть из истинности S(x, y) следует истинность xS(y), например: ЕСТЬ(Петр, мужчина) ® Петр ЕСТЬ( мужчина),
S(x, y) Щ S(x, z) ® x S(yЩ z) ® x S(y, z),
S(x, y) Ъ S(x, z) ® x S(yЪ z) ® x S{y, z}.

В процессе индуктивного вывода можно использовать также следующие правила обобщения отношений, содержащих переменные X, Y и их значения x, y:

R(X, Y)Щ R (x, y) ® R (x, y),
R(X, Y)Ъ R (x, y)® R(X, Y), где R - имя любого отношения (высказывания).

Полезным является также условие эквивалентности отношений и высказываний. Оно состоит в том, что два высказывания (отношения), у которых все аргументы одинаковы, то есть имеют одинаковые наименования и значения, считаются эквивалентными. Другими словами, R₁(X₁,...,X_n)» R₂(X₁,...,X_n), если x_i1=x_i2 для всех i=1,...,n, x_iОX_i. X_i - формула, представляющая собой свойство, объект или любое тождественно истинное высказывание. Пример.

ЕСТЬ(отец, мужчина)Щ РОДИТЕЛЬ(отец, X) ® отец ЕСТЬ (мужчина) Щ отец РОДИТЕЛЬ(X) ® отец (ЕСТЬ (мужчина) Щ РОДИТЕЛЬ(X));

ЕСТЬ(Петр, мужчина) Щ РОДИТЕЛЬ(Петр, Иван) ® Петр ЕСТЬ(мужчина) Щ Петр РОДИТЕЛЬ(Иван)® Петр( ЕСТЬ(мужчина) Щ РОДИТЕЛЬ(Иван));

РОДИТЕЛЬ(X) Щ РОДИТЕЛЬ(Иван)® РОДИТЕЛЬ(Иван);

РОДИТЕЛЬ(Иван) ® РОДИТЕЛЬ(X);

отец (ЕСТЬ(мужчина) Щ РОДИТЕЛЬ(Иван)) Щ Петр(ЕСТЬ(мужчина) Щ РОДИТЕЛЬ(Иван)) ® отец » Петр.

Таким образом, путем формальных преобразований можно доказывать эквивалентность различных наименований объектов, а также можно выводить абстрактные наименования свойств объектов и наименования самих объектов путем обобщения конкретных высказываний. Система тавтологий, пригодных для построения таких выводов, представлена в таблице 2.5. Таблица 2.5.

Image_11.gif (14299 bytes)

Данная таблица содержит подмножество тавтологий, позволяющих осуществлять некоторые индуктивные обобщения и выводы. При этом вопрос о функциональной полноте данного подмножества пока остается открытым. Это предмет дальнейших исследований. Я надеюсь, что плодотворные исследования в этой области позволят создать системы искусственного интеллекта, обладающие как дедуктивными, так и индуктивными способностями.

2.8. Представление высказываний и отношений обобщенными кодами

В современной теории баз данных одна из возможных моделей базы данных представляется как отношение частичного порядка (Н) на множества типов объектов определенной предметной области [16]. Другими словами, база данных представляет собой описание системы подмножеств объектов, взаимосвязанных между собой отношением частичного порядка. Каждое подмножество включает в себя определенный тип объектов, который имеет собственное имя и характеризуется определенными свойствами, например подмножества ЧЕЛОВЕК, МАШИНА, ПОМЕЩЕНИЕ, КОСМИЧЕСКИЙ АППАРАТ являются типами. Определенная структура, заданная на множестве типов, называется схемой базы данных. В общем виде схема базы данных показана на рис. 2.1.

Рис 2.1. Общий вид схемы базы данных о предметной области

Image23.gif (2952 bytes)

На практике связи между типами объектов в базах данных могут быть на много сложнее, чем показано на данном рисунке. В этих случаях используется специальный механизм ссылок (переходов от одного типа к другому). Пример фрагмента схемы базы данных отражающий предметную область “помещения некоторого учебного заведения” показан на рис. 2.2.

Рис 2.2. Схема фрагмента базы данных, отражающего помещения высшего учебного заведения

Image24.gif (3759 bytes)

В данном примере в каждом прямоугольнике указан определенный тип объектов. Эти же типы объектов можно описать и в терминах теории отношений, изложенных в предыдущем разделе. Пример.

ЕСТЬ(помещение, (учебное Ъ служебное)), ЕСТЬ(помещение_учебное, (аудитория Ъ класс Ъ лаборатория )) или ЕСТЬ(ЕСТЬ(помещение, учебное), (аудитория Ъ класс Ъ лаборатория )).

Легко заметить, что все подчиненные типы объектов представляют собой значения определенных свойств вышестоящих типов. Поэтому для корневого (заглавного) типа можно составить базу свойств S₁, S₂, ..., S_n и определить для каждого свойства S_i соответствующий показатель X_i с областью значений A_i. При этом любой объект данного типа будет определяться отношение Q(x₁,x₂,...,x_n), где x_iОA_i. Так в данном примере можно определить:

S₁ - назначение помещения, X₁ - наименование специализации помещения, А₁={учебное, служебное, - };

S₂- специализация учебных помещений, X₂- наименование специализации, А₂={лекции, занятия, опыты, - };

S₃- специализация служебных помещений, X₃- наименование специализации, А₃={администрация, делопроизводство, преподавательская, - }. Знак “- ” здесь будет указывать на то, что свойство S_i не относится к данному объекту. Используя приведенные выше определения, получим таблицу 2.6, содержащую описание той же предметной области, которая была представлена на Рис. 2.2.

Таблица 2.6.

Image_12.gif (3507 bytes)

По существу каждая строка данной таблицы представляет собой элемент Q(x₁,x₂,...,x_n) универсума U= {A₁ґA₂ґA₃}, то есть представляет собой код (или обобщенный код) помещения определенного типа. Таким образом, мы рассмотрели способ представления баз данных в форме таблиц обобщенных кодов. Полезность такой формы представления видна из следующего маленького примера.

Пример. Из таблицы 2.6 следует, что свойства S₂и S₃отнесены к различным объектам. Но эти свойства не являются независимыми. Фактически множества А₂и А₃являются подмножествами значений одного и того же свойства. Поэтому свойства S₂и S₃ можно заменить одним свойством S’₂- “специализация помещения” с областью значений A’₂ = {лекции, занятия, опыты, администрация, делопроизводство, преподавательская}. В результате структура базы данных существенно упрощается. При необходимости в таблицу2.6 можно легко добавить любое количество новых свойств рассматриваемых объектов, например номер помещения, площадь помещения, освещенность и так далее. Важно то, что действия над элементами базы данных, такие как поиск, сравнение, сортировка по значениям заданных свойств и т.д., можно выполнять путем формальных операций над соответствующими обобщенными кодами. Особенно широкие перспективы при этом открываются для реализации механизмов логического вывода.

Пример. Рассмотрим еще раз базу данных (фактов), приведенную в предыдущем разделе. Судя по содержащимся там фактам, можно заметить, что все они определяют свойства объектов одного тип - человек. Эти свойства определяются как: S₁ - наличие имени, S₂ - наличие пола и S₃ - способность быть родителем. Для характеристики этих свойств используются соответствующие переменные: X₁ - имя с областью значений A₁ = {Петр, Иван, Фома, Ольга, Марья}, X₂ - пол с областью значений A₂ = {мужчина, женщина} и X₃ - отношение РОЛИТЕЛЬ(X₁) с областью значений A₃ = {да, нет} или A₃ = {РОДИТЕЛЬ(X₁), НЕ_РОДИТЕЛЬ(X₁)}. Частными случаями типа человек является типы: отец, мать и не_родитель. Эти типы является конкретизацией типа человек по имени (S₁), полу (S₂) и по наличию ребенка (S₃). Согласно имеющимся в базе данных фактам объекты типа отец и мать определяются следующими высказываниями:

отец( - , мужчина, РОДИТЕЛЬ(X₁)),

мать( - , женщина, РОДИТЕЛЬ(X₁)).

Эти высказывания являются обобщенными кодами по свойству S₁ – имя человека. Легко заметить, что обобщенный коды отец и мать представляют собой значения логической функции F(X₁, X₂,X₃), определенной на множестве объектов типа человек. С учетом данных определений вышеупомянутая база фактов представляется следующей таблицей:

Таблица 2.7.

Image_14.gif (4829 bytes)

Применяя операцию пересечения к обобщенному коду с именем отец с остальными кодами таблицы 2.7 получим единственное решение:

отец (Петр, мужчина, РОДИТЕЛЬ(Иван)).

Таким образом, посредством операции пересечения обобщенных кодов реализован дедуктивный вывод о том, что Петр приходится отцом Ивану. Таким же способом можно реализовать и любой индуктивный вывод. Следует заметить, что представление баз данных в форме таблиц обобщенных кодов во многом сходно с формами представления реляционных баз данных. Сходство это состоит в том, что, как и реляционная база данных, таблица обобщенных кодов содержит описание определенных отношений между свойствами объектов. Однако для построения таблицы обобщенных кодов предъявляются более строгие требования к определению свойств и их областей значений. Эти требования необходимы для формализации теоретико-множественных и логических операций над отношениями, представленными в кодовой форме.

2.9. Логические функции

2.9.1. Определения и формы представления логических функций

Отличительная особенность логических функций состоит в том, что области определения самих функций и их аргументов являются дискретными конечными множествами. Обычно это множества истинности определенных высказываний или отношений, представляющих собой предикаты p_e. Например, областью значений логической функции может быть множество {(x<a), (x>a), (x=a)}, где каждое выражение в круглых скобках представляет собой утверждение об истинности определенного отношения.

Определения:

1. Пусть X_i переменная, принимающая значения из множества A_i={a_1(i),...,a_k(i)}, тогда логическая функция F(X₁,...,X_n) есть однозначное отображение {A₁ґA₂ґA_n} ® A_F, где A_F - область значений функции F(X₁,...,X_n). Вместо F(X₁,...,X_n) будем писать также F(X).

2. Если логическая функция и ее аргументы (переменные X_i) принимают значения из одного и того же множества A, содержащего k различных значений, то эта функция называется однородной k-значной логической функцией, или логической функцией класса P_k.

3. Логические функции класса P₂, с множеством значений E={ИСТИННО,ЛОЖНО}, называются двоичными или булевыми логическими функциями, если они определены на множестве аксиом, содержащихся в таблицах 2.8 и 2.9, и только на них. В этих таблицах приняты следующие обозначения: ИСТИГННО=1, ЛОЖНО=0.

Таблица 2.8. Булевы функции одной переменной

Image_15.gif (3706 bytes)

Таблица 2.9. Булевы функции двух переменных

Image_16.gif (16332 bytes)

Наиболее общей универсальной формой представления логических функций являются таблицы. Кроме того, существует много различных алгебраических форм представления логических функций, основанных на использовании функционально полных систем аксиом (элементарных функций), специально определяемых для каждого класса логических функций. Доказано, что из перечисленных булевых функций одной и двух переменных можно составить несколько функционально полных систем, пригодных для формального представления любой n-местной булевой функции. Наиболее популярной функционально полной системой булевых функций является система, состоящая из константы 0, константа 1, отрицания ` X₁, конъюнкции X₁ЩX₂ и дизъюнкции X₁ЪX₂. Существуют две формы представления логических функций с использованием этой системы: дизъюнктивная, представляемая в виде

(2.4)

и конъюнктивная, формула которой имеет вид

(2.5)

где ^~X_i означает, что переменная X_i может входить в данную формулу, как со знаком отрицания, так и без него.

4. Если функция F(X₁, ..., X_n) принимает значения из множества A_F= {f_1,f₂,...,f_e,...,f_k,q }_F, где q - нулевое (пустое) значение, то функция F(X₁, ..., X_n)^fe, принимающая значение f_eтолько на одном из наборов значений переменных X₁, ..., X_n и принимающая значение q на всех остальных наборах этих переменных, называется конституентой функции F(X₁,...,X_n)

5. Функция F(X₁, ..., X_n)^fe, принимающая значение f_e на нескольких наборах значений переменных X₁, ..., X_n и принимающая значение q на всех остальных наборах этих переменных, называется импликантой функции F(X₁, ..., X_n). По данным определениям конституента есть частный случай импликанты.

6. Логические функции, допускающие неравенство A_i№A_e, i,eО{1, ..., n, F}, называются неоднородными логическими функциями или функциями общего класса P_o.

По данным определениям логические функции класса P_kявляются частным случаем функций класса P_o. Разработка теории логических функций класса P_o до настоящего времени еще не завершена. И все же, имеющиеся в этой области результаты уже сейчас могут быть эффективно использованы для моделирования сложных алгоритмических процессов и систем [14]. В дальнейшем мы будем рассматривать в основном формальные построения логических функций класса P_o, сравнивая их, при необходимости, с аналогичными формальными построениями в классе булевых функций.

2.9.2. Формальные представления логических функций класса P_o

Для логических функций общего класса также существует проблема их формального представления. Чтобы решить эту проблему начнем с описания табличной формы представления этих функций. Общий вид такой формы представляет собой таблица 2.10.

Таблица 2.10. Форма табличного представления логических функций общего класса

Image_19.gif (4411 bytes)

В этой таблице показано, что все множество определения функции F(X₁,...,X_n) в общем случае делится на r+1 подмножество M_j, j=0,1,...r, наборов значений переменных X₁,...,X_n. Каждый набор представляет собой кортеж q = (x₁,...,x_n), где x_iОA_i, M_j - подмножество кортежей, на которых функция F(X₁,...,X_n) принимает значение f_j. На подмножестве M₀ функция F(X₁,...,X_n) не определена, иначе говоря, F(X₁,...,X_n) принимает значение f₀= - . Логические функции, для которых M₀ = , называются полностью определенными. В противном случае они называются не полностью определенными, или не доопределенными. Предполагается, что каждое множество A_i представляет собой полную группу несовместных высказываний, то есть, предполагается, что вероятность того, что переменная X_i одновременно примет какие-либо два значения из множества A_i равна нулю. Такое же предположение принимается и для области значений функции F(Х). Предполагается также, что множества M_j не пересекаются. Эти предположения позволяют получить строго однозначное и корректное определение логических функций общего класса. При указанных условиях для любой логической функции справедливы соотношения:

Image26.gif (819 bytes) (2.6)

Эти соотношения задают дизъюнктивную форму представления логической функции общего класса.

Учитывая, что любое подмножество M_j может быть представлено соответствующим объединением обобщенных кодов , где t номер обобщенного кода, из числа кодов, представляющих подмножество M_j, из соотношений (2.6) непосредственно получим форму представления логических функций общего класса с помощью обобщенных кодов:

Image27.gif (704 bytes) (2.7)

В дальнейшем будем называть ее кодовой дизъюнктивной нормальной формой (КДНФ) представления логических функций.

Табличный вид кодовой формы логической функции общего класса показан в таблице2.11.

Таблица 2.11. Форма табличного представления логических функций общего класса

Image_20.gif (5006 bytes)

Доказательство того, что любая функция класса P_o может быть представлена в КДНФ, следует из только что изложенного вывода формулы 2.7 из табличной формы, которая, как известно, является универсальной формой представления любых функций. Кроме табличных форм представления логических функций существуют и алгебраические формы, основанные на использовании различных функционально полных систем. Наиболее распространенными алгебраическими формами являются так называемые дизъюнктивные и конъюнктивные нормальные формы (КНФ и ДНФ). Общие принципы построения ДНФ логических функций общего класса следующие:

Любая многозначная логическая переменная X_i может быть представлена дизъюнкцией ее конституент X^ae_iв следующем виде:

(2.8)

Image_22.gif (641 bytes) (2.9)

Любая логическая функция общего класса может быть представлена дизъюнкцией ее импликант F(X₁,...,X_n)^fj в следующем виде:

(2.10)

Любая импликанта F(X₁,...,X_n)^fj логической функции F(X₁,...,X_n) может быть представлена дизъюнкцией конъюнкций конституент X^ae_i ее аргументов (переменных) X_i в следующем виде:

(2.11)

^{С учетом данных построений любая логическая
функция общего класса может быть представлена в
следующем алгебраическом виде:

       (2.12)

Данное выражение
называется совершенной дизъюнктивной
нормальной формой (СДНФ)
логической функции общего
класса. Это одна из возможных алгебраических
форм представления логических функций.
Фактически она, как и совершенная кодовая
дизъюнктивная нормальная форма, совпадает с
табличной формой представления этой же функции,
так как каждая дизъюнкция соответствует
кортежу p_t. По определению таблица
2.10 и СДНФ должны содержать    кортежей q,
где k_i - значность переменной X_i. Ясно,
что такие формы представления функций с большим
числом переменных не экономичны и трудно
обозримы. Поэтому в теории и практике применения
логических функций изобретено много способов
более экономного представления этих функций. Эти
способы обычно основаны на минимизации
совершенных (полных) нормальных форм
представления логических функций.

2.9.3. Принципы минимизации
кодовых форм представления логических функций

Удобство восприятия и использования
форм представления логических функций, как мы
уже говорили, во многом зависит от их размеров и
структурной сложности. Исходная, так называемая
совершенная кодовая дизъюнктивная нормальная
форма (СКДНФ) фактически ничем не отличается от таблиц 2.10. Поэтому она так же
неэкономична, как и эта таблица. Однако
вышеизложенная теория обобщенных кодов
позволяет предложить достаточно простые
формализованные алгоритмы решения проблемы
минимизации КДФ логических функций любого
класса. Один из таких алгоритмов минимизации
КДНФ логических функций общего класса
рассматривается в данной книге.

Алгоритм основан на следующих
теоретических принципах.

Минимальная форма представления логической
функции F(X₁,...,X_n)
получается в результате минимизации форм,
представляющих ее импликантов F(X₁,...,X_n)^fj. Поэтому для
построения минимальной КНФ достаточно найти
минимальные КНФ для каждой ее импликанты и
объединить их в одной таблице обобщенных кодов.

По определению любая импликантаполностью определенной логической
функции общего класса представляет собой
следующее соотношение:

F(X₁,...,X_n)^fj = (M_j®f_j)Ъ(Mq ® q ),
             (2.13)
где j=1,...,r, Mq = M \ M_j,      M_jЗMq = . Поэтому
для задания импликанты F(X₁,...,X_n)^fj
такой функции достаточно в
какой-нибудь форме задать только одно из
указанных подмножеств. Другими слова, ее можно
представлять как
F(X₁,...,X_n)^fj
= M_j®f_j,

(2.14)
или как щF(X₁,...,X_n)^fj
= Mq ® q
.              (2.15)

Любое подмножество M_j может
быть представлено соответствующим объединением
обобщенных кодов . При этом
одно и то же подмножество M_j, в общем случае, может быть
представлено различными объединениями
различных обобщенных кодов, и проблема состоит в
том, чтобы представить подмножество M_j объединением обобщенных кодов,
содержащим наименьшее число непустых значений
переменных X_i. Формальная
математическая постановка этой проблемы состоит
в следующем. Дана табличная форма импликанты F(X₁,...,X_n)^fj = M_j®f_j,
j=1,...,r. Найти кодовую нормальную
форму этой импликанты:

                (2.16)

соответствующую
минимальному значению оценочной функции


(2.17)

где r(K_t,j) - число разрядов
обобщенного кода K_t, не содержащих знак “- ”, то есть заполненных какими-либо
значениями, кроме значения тире, s - число
обобщенных кодов, входящих в КДНФ импликанты F(X₁,...,X_n)^fj.

Минимизация СКДНФ осуществляется за счет
объединения элементарных кодов (кортежей q) из M_j в
обобщенные коды K_t,j.
Полученная при этом КДНФ, удовлетворяющая
минимальному значению оценочной функции 2.17,
называется минимальной КДНФ (МКДНФ).

Если функция F(X₁,...,X_n) не
доопределена, то ее СДНФ имеет следующий вид:


(2.18)

При ее минимизации подмножество M₀
может быть использовано для увеличения
количества свободных разрядов (разрядов со
знаками тире) в обобщенных кодах K_t,_j
за счет добавления к подмножествам M_j
некоторых кортежей из подмножества M₀. В
связи с тем, что функция F(X₁,...,X_n) не
определена на подмножестве M_0,
предполагается, что его элементы (кортежи) можно
добавлять к подмножествам M_j произвольно,
то есть в любом количестве и в любом порядке. При
этом для каждой импликанты F(X₁,...,X_n)^fj будет получена СКДНФ вида:

(M_j И M^*₀)
® f_j, M^*₀НM₀,

(2.19)

и может быть найдена
соответствующая ей минимальная КНФ (МКДНФ)


(2.20)        где K^*_t- обобщенный код, объединяющий некоторые
элементарные коды из подмножества (M_jИM^*₀).

Кодовая форма, являющаяся наименьшей по
показателю 2.17 из всех МКДНФ импликанты F(X₁,...,X_n)^fj, называется ее абсолютно
минимальной КДНФ
(АМКДНФ).

АМКДНФ функции F(X₁,...,X_n) состоит из АМКДНФ ее импликант,
взятых по всем ее значениям.

Строгое решение проблемы минимизации КДНФ
логических функций требует построения сложных
чрезвычайно трудоемких алгоритмов, основанных
на полном многократном переборе кортежей
заданной таблицы и промежуточных вариантов
решения. Поэтому для практических приложений
полезно иметь простые методы минимизации КДНФ,
позволяющие находить КДНФ достаточно
приближенные к абсолютно минимальным - приближенно
минимальные КДНФ
(ПМКДНФ).

Алгоритм приближенной минимизации КДФ
импликанты F(X₁,...,X_n)^fj логической функции общего класса
можно построить на следующих принципах.

Всякий произвольно взятый обобщенный код K_e
с базой (X₁,...,X_n) представляет (задает или описывает)
подмножество кортежей M_e,
которое в общем случае может включать в себя
кортежи из всех трех подмножеств: M_j,, M₀и M_q . Схема расположения подмножества M_eв области M определения функции F(X₁,...,X_n)^fj показана на рис. 2.3а.

Код K_t,jпринадлежит КДНФ, если и
только если он представляет подмножество M_t,j,
обязательно содержащее все кортежи из
подмножества M_j, не содержащее ни одного
кортежа из подмножества Mq и
возможно включающее некоторые кортежи из
подмножества M₀. Схема расположения
подмножества M_t,jв области М показана на рисунке 2.3б. Абсолютно минимальная
КДНФ импликанты F(X₁,...,X_n)^fj
состоит из кодов K*_t,j, задающих подмножества
M*_t,j такие, что

При этом g(r)_j= min.

Рис. 2.3.а

Рис. 2.3.б

Другими словами, объединение
является кодовым
покрытием множества M_j,
обладающим минимальным количеством заполненных
разрядов. Примерная схема такого покрытия
показана на
Рис.2.4.   Пример
покрытия множества M_j обобщенными кодами K*_t,j

Любой обобщенный код K^*_t,j,
принадлежащий КДНФ любой логической функции,
если только эта функция не является константой,
должен содержать не менее одного заполненного
разряда. Поэтому поиск кодов K^*_t,jследует
начинать с проверки всех возможных обобщенных
кодов с одним заполненным разрядом
Если среди обобщенных кодов с одним заполненным
разрядом не окажется ни одного кода,
удовлетворяющего условию 2, то
проверке подлежат все обобщенные коды с двумя
заполненными разрядами. Проверка с увеличением
числа заполненных разрядов продолжается до
обнаружения обобщенного кода, удовлетворяющего
условию 2. Если этому условию
удовлетворяют несколько обобщенных кодов с
одинаковым числом r(K_e) заполненных
разрядов, то первым в состав искомой КДНФ следует
включать тот из них, который покрывает большее
число кортежей из подмножества M_j. Таким
образом, будет получен первый обобщенный код K^*_1,j
для искомой КДНФ.
Учитывая изложенное, поиск
приближенно минимальной КДНФ предлагается
осуществлять в следующем порядке:

найти код K^*_1,j, покрывающий
наибольшее число кортежей из M_j,
затем таким же способом найти код K^*_2,j,
покрывающий наибольшее число кортежей из
подмножества M_j\ M^*_1,j,
и так далее, пока не выполним условие

M_j\(M^*_1,jИM^*_2,jИ...ИM^*_s,j) = .

При этом искомая приближенно
минимальная КДНФ будет иметь вид:

K^*_2,j И K^*_2,j
И ... И K^*_2,j.

Для оценки степени приближения
произвольно взятого обобщенного кода K_e к
коду K^*_t,j, пригодному для включения
его в искомую минимизированную КДНФ,
предлагается использовать следующие оценочные
функции (показатели):
       (2.21)
   и r(K_e),

(2.22)
где x ( K_e) -
показатель, характеризующий положение
подмножества M_e, представленного кодом K_e,
относительно подмножеств M_j и M_qв области М определения функции F(X₁,...,X_n)^fj а r(K_e) - показатель количества
заполненных разрядов в обобщенном коде K_e.
Величина x ( K_e) / r(K_e)
показывает какая доля оценки x ( K_e)
приходится на один заполненный разряд
обобщенного года K_e. Чем больше эта
величина, тем предпочтительнее включение кода K_eв искомую КДНФ.

2.9.4. Алгоритм приближенной
минимизации КДНФ не полностью определенных
логических функций общего класса

Предлагаемый алгоритм рассмотрим на
примере функции   F(X₁², X₂²,
X₃³, X₄²)³,   заданной таблицей обобщенных кодов (таблица 2.12). Верхние индексы у
символов переменных и у закрывающейся скобки
соответственно обозначают значность переменных X_i
и функции F(X). Общее
количество кортежей, составляющих область
определения данной функции равно величине
Однако в таблице 2.12
заданы только те кортежи, которым соответствуют
определенные значения функции F(X₁²,
X₂², X₃³, X₄²)³,
f_j О {1, 2, 3}.
Кортежи, на которых функция не определена и
может иметь любое значение, в таблице
отсутствуют. Они считаются заданными “по
умолчанию”. Таким образом, достигается
сокращение исходной таблицы.

Таблица 2.12

Таблица 2.13

Суть алгоритма состоит в следующем:

Разделить заданную функцию F(X)^k на импликанты F(X)^fj по ее значениям f_j. В результате для рассматриваемого
примера получим таблицу 2.13.
Положить j=1.

Провести минимизацию КДНФ импликанты F(X)^fj. Для этого
выполнить следующие действия:

2.1. Составить таблицу КДНФ импликанты
F(X)^fj. В нашем примере это таблица 2.14, представляющая
импликанту F(X)^f1. Будем называть
ее исходной таблицей.
2.2. Проверить ортогональность
обобщенных кодов исходной таблицы
(2.14). Если все обобщенные коды заданной таблицы
ортогональны, то перейти к следующему пункту,
иначе выполнить ортогонализацию заданных
обобщенных кодов. В таблице 2.14
не ортогональны между собой только два первых
обобщенных кода: (0 0`2 0) и (0 0 1 - ). Над ними необходимо выполнить
следующие действия:
(0 0`2 0) \ (0 0 1 -
) = (0 0 0 0),
(0 0`2 0) И (0 0 1 - ) = (0 0 0 0) И (0 0 1 -
).

Ортогонализация обобщенных кодов
необходима для корректного подсчета значений
оценочной функции x (K_e).
Количество n(M_h) кортежей, соответствующих
обобщенному коду в каждой строке
ортогонализованной таблицы (2.15)
показаны в первом столбце этой таблицы.
где n(a _i) - мощность подмножества
значений переменной X_i, представленного
символом a _i в коде K_h, h -
номер строки данной таблицы.
Таблица 2.14

Таблица 2.15

2.3. Для базы переменных (X₁², X₂²,
X₃³, X₄²) импликанты F(X)^f1 составить все возможные обобщенные
коды с одним заполненным разрядом - коды K⁽¹⁾_e.
При этом для получения более глубокой
минимизации целесообразно использовать не
только положительные значения переменных X_i,
но также и отрицания этих значений. Смотрите
пример,
Tаблица 2.16.

Таблица 2.17

2.4. Для всех
кодов K⁽¹⁾_e
вычислить значения показателя x (K_e). Для рассматриваемого примера
результаты вычислений приведены в таблице 2.16.
Покажем процедуру вычислений на примере для
случая, когда K⁽¹⁾_e= (0 -
- - ).
При этом

M⁽¹⁾_eЗM₁=
(0 - - -
)З [(0 0 0 0)И(0 0 1 - )И(0 1 0 0)И(0
1 2 - )]=M₁,    n(M₁)=6;
M⁽¹⁾_eЗM_q=[(0 0 2 - )И(0 - 0 1)],   n(M⁽¹⁾_eЗM_q)=4;
x (0 - - - )=6 / 1+4= 1,200.
2.5. Найти
максимальное значение показателя x
(K⁽¹⁾_e) и
соответствующий ему код K⁽¹⁾_e. В данном случае это код K⁽¹⁾_e
= (0 - - -
) со значением x(K⁽¹⁾_e)=1,200.
2.6. Проверить,
удовлетворяет ли код K⁽¹⁾_e условию n(M_eЗM_q) = . Если
данное условие выполняется, то код K⁽¹⁾_e включить в искомую КДНФ, как K^*_1,j,
и перейти к поиску следующего
кода искомой КДНФ - K^*_2,j. Для этого выполнить пункт 2.8
настоящего алгоритма. В нашем примере
упомянутое условие не выполняется, так как код (0 - - - )
пересекается с кодом (0 0 2 - ) и с
кодом (0 - 0 1) таблицы 2.15.
Поэтому на основании кода K⁽¹⁾_e с
максимальным значением показателя x
(K_e) следует составить все возможные
обобщенные коды K⁽²⁾_e с двумя
заполненными разрядами. В нашем примере эти коды
представлены таблицей 2.17.

2.7. Повторить все
действия указанные в пунктах 2.4, 2.5 и 2.6 с кодами K⁽²⁾_e, то есть вычислить для этих кодов
значения показателя x (K⁽²⁾_e), найти максимальное из этих
значений, определить соответствующий ему код K⁽²⁾_eи проверить условие n(M_eЗMq ) = . В результате этих действий в данном
примере получим коды (0 - 1 - ) и (0 - - 0) с одинаковыми
наибольшими значениями показателя x
( K⁽²⁾_e) = 2, но
условию n(M_eЗMq ) = удовлетворяет
только первый из них. Поэтому K^*_1,1=
(0 - 1 - ). Если условие n(M_eЗMq ) = не
выполняется ни для одного из кодов K⁽²⁾_e, то следует выполнять аналогичные
действия с кодами K⁽³⁾_e, ..., K⁽ⁿ⁾_e, пока, наконец, не получатся код K^*_1,j,
удовлетворяющий упомянутому
условию.
2.8. Из
таблицы, задающей импликанту F(X)^f1(таблица 2.15
рассматриваемого примера), вычесть код K^*_1,j
(K^*_1,1). В результате
получается исходная таблица для поиска
следующего обобщенного кода подходящего для
искомой КДНФ. В нашем примере это таблица
2.18.
2.9. С таблицей
2.18 повторить все действия, которые выполнялись
с таблицей 2.15 и найти следующий
обобщенный код K^*_2,j (K^*_2,1), подходящий для искомой КДНФ.
Читателю предлагается проделать эту работу
самостоятельно и убедиться, что следующим будет
получен код K^*_2,1= (- 1
2 - ).
Таблица
2.18

Таблица 2.19

2.10. Вычесть код K^*_2,j из таблицы 2.18 и
составить новую исходную таблицу для поиска
следующего обобщенного кода K^*_t,j. В данном примере это будет код K^*_3,j
= (- - 0 0).
2.11. Продолжать
перечисленные выше действия до тех пор, пока при
очередном вычитании кода K^*_t,j из таблицы, по которой он был
получен, подмножество M_jокажется
пустым, то есть в результате вычитания в таблице
не останется ни одного кода, представляющего
кортежи из этого подмножества. Другими словами,
пока не будет выполнено условие: M_j\(M^*_1,jИM^*_2,jИ... ИM^*_s,j)= . В
этом случае минимизация КДНФ импликанты F(X)^fj заканчивается.
Результат минимизации имеет вид:

F(X)^fj = (K^*_1,j И K^*_2,j И ... И K^*_s,j) ®
f_j.

В нашем примере F(X)^f1 = (0 - 1 -
)И(- 1 2 -
)И(- - 0
0) ® 1.

Минимизация КДНФ других импликант F(X)^f2, F(X)^f3 и так далее выполняется по тому же
алгоритму. В результате применения его к нашему
примеру получим:

F(X)^f2 = (1 0 -
1) ® 2 и

F(X)^f3= (1 1` 0 - )И(0 - 0 1)И(- 0 2
0) ® 3.

Общая приближенно минимальная кодовая
дизъюнктивная нормальная форма функции F^*(X₁²,
X₂², X₃³, X₄²)³
представлена таблицей
2.19. Заметим, что полученная нами
минимизированная КДНФ представляет собой
полностью определенную логическую функцию F^*(X₁²,
X₂², X₃³, X₄²)³,
которая является одним из возможных вариантов
доопределения заданной логической функции F(X₁²,
X₂², X₃³, X₄²)³.
Это доопределение произошло автоматически в
ходе минимизации заданной КДНФ не
доопределенной функции.

Приведенный алгоритм легко
формализуется и может быть полезен при решении
многих логических задач и при моделировании
сложных процессов.

2.10.
Вероятностные логические функции общего класса

2.10.1.
Формальное представление вероятностных
логических функций

В традиционной математической логике
логические переменные X_i
считаются детерминированными, то есть
предполагается, что переменные X_iпринимают, или не принимают
определенное значение a_eОA_i в определенных условиях с
вероятностью равной единице. В действительности
же, как правило, реальные события носят случайный
характер. Поэтому отражающие эти события
переменные X_iследует
рассматривать как вероятностные переменные,
принимающие значения a_eОA_iс соответствующими
вероятностями V(X_i = a_e). По определению логической
переменной X_i должно
выполняться условие:


(2.23)

вытекающее из свойства несовместности
значений a_eОA_i. Данная интерпретация логических
переменных требует разработки соответствующего
математического аппарата вероятностной логики.
В качестве теоретической основы для формального
представления вероятностных логических функций
целесообразно взять уже знакомый нам формализм
логических функций общего класса. Тогда
вероятностной логической функцией общего класса
будет называться логическая функция общего
класса F^*(X₁^k1, ..., X_n^kn)^kF, определенная на базе вероятностных
логических переменных X₁^k1, ..., X_n^kn
и принимающая значения f_jОA_F с
вероятностями V(F^*= f_j), которые определяются как
вероятности сложных событий:

     (2.24)

где j = 1,...,N, g_j - номер
конъюнкции в подмножестве конъюнкций, связанных
с j-тым значением функции F^*(X₁^k1, ..., X_n^kn)^kF. Из данного определения
следует, что для представления вероятностных
логических функций могут быть использованы все
рассмотренные выше формы представления
логических функций общего класса дополненные
таблицами распределения вероятностей V(X_i
= a_e) значений переменных X_i.

Пример. Вероятностная логическая
функция F^*(X₁³, X₂³,
X₃²)³ представлена
двумя таблицами: 2.20 и 2.21. В таблице
2.20 задана ее сокращенная КДНФ, а в таблице 2.21
задано распределение вероятностей значений ее
аргументов X_i.

Таблица
2.20

Таблица 2.21



При этом вероятности значений функции V(F^*= f_j) могут быть вычислены
по теореме сложения вероятностей. Эффективный
алгоритм решения этой задачи предложен автором [14].

2.10.2. Вычисление вероятностей
значений вероятностных логических функций

Если логическая
функция представлена совершенной дизъюнктивной
нормальной формой или совершенной кодовой
нормальной формой, то формулы для вычисления
вероятностей ее значений по заданным
вероятностям значений ее аргументов X_i имеют следующий вид:

      (2.25)

Они получаются из совершенных дизъюнктивных
нормальных форм импликант F^*(X)^f(j) после замены значений a_eОA_i логических
переменных X_i на
соответствующие значения вероятностей V(X_i=
^~a_e,i) и замены
логических символов “U ” и “U ” на соответствующие им
арифметические символы умножения и сложения.
Символ ^~a_e,i
означает, что ^~a_{e,i I}{
a_e,i, ` a_e,i}. Если же вероятностная логическая
функция задана сокращенной дизъюнктивной
нормальной формой или сокращенной КДНФ, то такое
непосредственное преобразование возможно,
только тогда, когда заданная ДНФ представлена
ортогональными дизъюнктивными членами
(конституентами) или ортогональными обобщенными
кодами K^*_e,j. Для
преобразования ортогонализованной КДНФ
логической функции в соответствующую ей формулу
для вычисления вероятностей ее значений
достаточно выполнить вышеизложенную замену
символов логических операций на символы
арифметических операций и замену логических
значений переменных на значения их вероятностей.
Эту операцию будем называть правилом замены
по аналогии. В общем виде
ее можно представить как отношение:

       (2.26)

Заметим, что в случае, когда переменная
X_i имеет отрицательное
значение X_i = ` a_e,i, то соответствующая вероятность V(X_i= ` a_e,i)
вычисляется по формуле:

V(X_i= `a_e,i)
= 1 - V(X_i= a_e,i),
(2.27)

и по определению

На основе изложенных положений предлагается
следующий алгоритм преобразования любой КДНФ
логической функции в соответствующую ей формулу
для вычисления вероятностей значений данной
логической функции по заданным вероятностям
значений ее аргументов.

Проверить заданную КДНФ на предмет
ортогональности представляющих ее обобщенных
кодов.
Если КДНФ не ортогонализована, то есть в ней
имеются пересекающиеся обобщенные коды, то их
следует ортогонализовать, применяя уже
известную нам операцию ортогонализации
обобщенных кодов.
Преобразовать ортогонализованную КДНФ
заданной логической функции в соответствующую
ей формулу для вычисления вероятностей ее
значений, точнее в формулы для вычисления
вероятностей значений ее импликант. Для этого
следует использовать операцию замены по
аналогии.

Пример. Вычислить вероятность
значений логической функции общего класса,
заданной таблицами 2.20 и 2.21. Таблица
2.20 представляет собой КДНФ логической функции F^*(X₁³,
X₂³, X₃²)³. В данной таблице имеются
неортогональные обобщенные коды:

(1, 2, - ) и (-, 2, 1), а также (`0,
`2, 0) и (2, -, 0).

После их ортогонализации получим таблицу 2.22 эквивалентную таблице
2.21 в том смысле, что обе эти таблицы задают одну
и ту же логическую функцию F^*(X₁³,X₂³,X₃²)³.
В результате применения к таблице 2.22 правила замены по аналогии
получим следующие формулы для вычисления
вероятностей значений заданной логической
функции:

V(F^*=0) = V(X₁³=0) + V(X₁³=1)
* V(X₂³=2) + V(X₁³=2)
* V(X₂³=2) *
V(X₃²=1);

V(F^*=1) = [1 - V(X₁³=0)]
* [1 - V(X₂³=2)]
* V(X₃²=1);

V(F^*=2) = V(X₁³=1) *
[1 - V(X₂³=2)] * V(X₃²=0)
+ V(X₁³=2) * V(X₃²=0).

После подстановки соответствующих
значений вероятностей из таблицы 2.21
в эти формулы получим:

Таблица 2.22



        V(F^*=0) = 0,238;
        V(F^*=1) = 0,504;
        V(F^*=2) = 0,258.


Заметим, что значения
логической функции, как и значения ее аргументов,
представляют собой несовместные события и их
вероятности связаны соотношением:

2.11.
Алгоритмы и алгоритмические процессы

2.11.1.
Основные понятия и определения

Согласно определению, данному в
математической энциклопедии [13]
алгоритм есть точное
предписание, которое задает вычислительный
процесс нахождения значений вычислимой функции
по заданным значениям ее аргументов.
Соответственно алгоритмический процесс есть
последовательность действий, выполняемых
некоторым исполнителем по заданному алгоритму.
Классическими примерами алгоритмических
процессов являются процессы образования слов из
заданного алфавита по определенным правилам.
Однако, если под алфавитом понимать символы
некоторых материальных или идеальных объектов,
то алгоритмический процесс можно рассматривать
как последовательность действий, выполняемых
над объектами любой природы по точно
определенной инструкции. Поэтому практическая
значимость алгоритмов и алгоритмических
процессов не ограничивается одними
вычислительными задачами. Математическая
строгость и точность алгоритмов обеспечивает
возможность автоматизации задаваемых ими
алгоритмических процессов в различных областях
деятельности человека, в том числе и в творческом
мышлении. В качестве теоретических моделей
машин, имитирующих алгоритмические процессы,
обычно рассматривают машины Тьюринга,
фон-Неймана и конечные автоматы. Между
алгоритмами и алгоритмическими процессами
существует связь, показанная на рисунке
2.5.

Рис. 2.5. Связь между
алгоритмом и алгоритмическим процессом

На этом рисунке показано, что любой
алгоритмический процесс, полученный при
реализации алгоритма, является моделью
некоторого реального процесса. Степень
соответствия алгоритмического процесса (модели)
реальному исходному процессу называется адекватностью.
Таким образом, по определению
алгоритм есть статический информационный объект
(инструкция), представленная на некотором языке, понятном для потенциального
исполнителя. Алгоритмический
процесс есть динамический физический объект,
представляющий собой упорядоченные действия
некоторого исполнителя,
выполняемые по заданному алгоритму. Любой алгоритмический процесс
характеризуется следующими свойствами:

результативностью;

массовостью;

дискретностью;

детерминированностью;

самоуправляемостью;

альтернативностью и эквивалентностью;

сложностью;

адекватностью;
ресурсоемкостью.

Результативность - означает, что
алгоритмический процесс реализует определенную
целевую функцию X® Y за конечное число шагов (действий)
или за конечный отрезок времени, где X - множество исходных данных, а Y - множество
результатов выполнения данного
задания.

Массовость - означает возможность
существования множества исходных данных {x₁…x_n}из которого
могут быть взяты исходные данные x_tдля инициализации алгоритмического
процесса. Каждому набору x_iисходных данных
соответствует один вполне определенный
результат y_j.Однако, один и тот же результат может
соответствовать нескольким наборам исходных
данных.

Дискретность - означает,
что алгоритмический процесс состоит из
отдельных действий, процедур
или операций, связанных между
собой определенными причинно следственными
связями.

Детерминированность следует из того, что
последовательность действий в алгоритмическом
процессе точно определена заданным алгоритмом.

Адекватностью называется степень
соответствия алгоритмического процесса (модели)
реальному исходному процессу, являющемуся
прообразом данного алгоритмического процесса.
   Характеристика всей совокупности
действий и причинно следственных связей между
ними в алгоритмическом процессе называется его структурой.
Пусть D -
множество всевозможных действий в
алгоритмическом процессе.
Тогда однозначно определенное отношение D® D есть структура S
алгоритмического процесса. Структура S
является основной характеристикой сущности
алгоритмического процесса. Каждый
алгоритмический процесс имеет свою структуру S.

Самоуправляемость алгоритмического процесса
характеризуется наличием в алгоритмическом
процессе специальных действий d^uОD, предназначенных
для управления последовательностью
функциональных действий d^fОD (вычислительных, механических,
информационных, и так далее), предназначенных для
непосредственной реализации целевой функции X® Y. Действия d^uделятся
на два типа: условные переходы (распознаватели
истинности определяющих условий P_е ) и
безусловные переходы от текущего действия к
следующему. Безусловные переходы обычно
обозначаются в схемах алгоритмов стрелкой (® ), или последовательной записью
описателей выполняемых действий друг за другом.
Запись D® D означает, что множество
действий D упорядочено определенным образом так,
что все действия dОD связаны между собой условными и
безусловными переходами. Вообще говоря,
безусловные переходы следует рассматривать как,
частный случай условных переходов, d^u: = d(P)® , d^u: = ® ,
если условие P заключается в завершении текущего
действия, или вообще отсутствует.

Альтернативность - означает, что
функция X® Y
может быть реализована несколькими различными
алгоритмическими процессами (АП). Два АП
реализующих одну и ту же функцию X®
Y называют эквивалентными. Из
эквивалентности АП следует эквивалентность
соответствующих им структур и алгоритмов. При
разработке алгоритмических процессов и
алгоритмов стараются получить наиболее простой
и экономичный алгоритмический процесс из всех
возможных эквивалентных АП, реализующих
заданную функцию X® Y.

Сложность алгоритмического
процесса есть характеристика многообразия
(разнообразия) действий, составляющих этот
процесс, и структурных связей между ними. Более
подробно это понятие будет рассмотрено в
следующем разделе.

Ресурсоемкость алгоритмического
процесса оценивается величиной времени,
необходимого на реализацию целевой функции X® Y и количеством
затрачиваемых на это ресурсов (памяти,
специальных устройств, математического
обеспечения и т.д.).

Алгоритм, как правило, представляет
собой описание множества D
действий алгоритмического процесса и его
структуры S на некотором
формализованном языке.

Всеобщими свойствами алгоритмов
являются:

однозначность отображения D®
D, означающая однозначную
определенность каждого действия d_j при заданных исходных данных X и определенной последовательности
действий, предшествующих d_j;

строгость (точность) описания каждого
действия d_iОD и каждого условия перехода от d_iк d_j,
описываемого соответствующим предикатом p_i(X,D) и стрелкой указателем “® ”, или другими средствами
используемого алгоритмического языка;

корректность,
показателем которой является количество ошибок,
присутствующих в тексте алгоритма;

сложность, определяемая как сложность
описания алгоритмического процесса, с учетом
используемого алгоритмического языка и
тезауруса;

величина текста, измеряемая в определенных
лингвистических и информационных единицах
(словах, символах, битах и т.п.);

уровень формализации,
оцениваемый уровнем языка и формальных систем,
используемых в алгоритме.

Все перечисленные свойства имеют
хорошо определенные показатели и могут
использоваться для оценки качества
разрабатываемых алгоритмов и алгоритмических
процессов.

2.11.2. Математические модели
алгоритмических процессов

В зависимости от целей моделирования
модели алгоритмических процессов могут
характеризовать любые вышеперечисленные
свойства. При разработке алгоритмов обычно
используют модели для оценки структурных,
точностных, временных и ресурсных показателей
свойств алгоритмов и алгоритмических процессов.
Особо следует отметить класс структурных
моделей АП. Обычно они представляют собой
формализованные описания отношения D ® D. В специальной
научной литературе они известны как логические
схемы алгоритмов (схемы Ляпунова), схемы программ
Янова, канонические схемы алгоритмов Блохе -
Неверова, схемы алгорифмов Маркова и схемы
типовых алгоритмических процессов [14]. Сюда же могут
быть отнесены и многочисленные математические
модели конечных автоматов. Любую такую схему
можно рассматривать как систему отображений
множества D^rдействий - распознавателей
истинности условий P_e в множество D^f
действий - преобразователей и отображения
множества D^fобратно в множество D^r.
Формальная запись этой системы имеет вид: D^r®D^f ® D^r.
Символом P_eбудем обозначать набор
(конъюнкцию) условий из множества P, определяющих
е-тый переход в алгоритмическом процессе. При
этом отношение P® D^f будем
называть характеристической функцией структуры
алгоритмического процесса (ХФ). Действия -
преобразователи D^f_jиз D^fобычно
записывают в виде определенных математических
выражений. Стрелка “® ”
обозначает здесь множество безусловных
переходов в алгоритмическом процессе. Пусть F(p₁,
p₂,...,p_n)^D(f) многозначная
логическая функция общего класса, имеющая
аргументы p₁, p₂,...,p_n, область
определения P и область значений D^f.
Аргументы p₁, p₂,...,p_n представляют
собой элементарные предикаты. Тогда
математическую модель алгоритмического
процесса можно изобразить в виде схемы,
показанной на рис. 2.6. На схеме
затемненным прямоугольником обозначено
множество всех действий распознавателей условий
P_i, а подмножества D^f_j действий
преобразователей из множества D^fпредставлены
светлыми прямоугольниками. Информационные
потоки на схеме изображены удвоенными стрелками,
а простыми стрелками обозначены безусловные
переходы между действиями.

Рис. 2.6. Схема (модель) типовой
логической структуры алгоритмического процесса

Подмножества D^f_j
состоят из действий непосредственно связанных
друг с другом безусловными переходами в одну
последовательность, или составляющих отдельный
алгоритмический процесс (подпроцесс),
рассматриваемый в данном случае, как одно целое.
Множества действий D^f_j бывают
промежуточные и заключительные. В результате
промежуточных действий выполняются
определенные преобразования данных из множества
X и преобразование значений предикатов P_i,
определяющих условия перехода к следующему
действию D^f_j. После выполнения
промежуточных действий осуществляется переход к
следующим действиям распознавателям, а в
результате выполнения заключительных действий
получают искомое решение Y, и алгоритмический
процесс останавливается. В приведенной
модели структура алгоритмического процесса
отличается тем, что все условные переходы
определяются в результате вычисления значений
одной обобщенной логической функции F(p₁,...,p_n)^D(f),
называемой характеристической функцией
алгоритмического процесса. Каждый такой переход
ведет к промежуточному, или к заключительному
подмножеству действий D^f_j. После
выполнения любого промежуточного подмножества
действий D^f_j осуществляется переход к
вычислению очередного следующего значения
характеристической функции. После выполнения
заключительных действий получается
определенный результат и алгоритмический
процесс заканчивается. Описанная структура
алгоритмического процесса называется типовой [14]. Соответственно
алгоритмический процесс с такой структурой
называется типовым алгоритмическим процессом (ТАП).
Важным достоинством типовых алгоритмических
процессов является возможность формализации
анализа и синтеза их структуры. Эта возможность
следует из того, что характеристическая функция
ТАП может быть легко представлена в кодовой ДНФ и
для ее анализа и эквивалентного преобразования
может быть эффективно применен аппарат теории
обобщенных кодов.

2.11.3.
Пример синтеза структуры типового алгоритмического процесса

Пусть нам поставлена задача
разработать алгоритмический процесс и алгоритм
для решения на ЭВМ задачи вычисления
действительных корней квадратного уравнения ay²+by+c=0 по заданным значениям
коэффициентов a, b, c.   Методика
решения этой задачи общеизвестна. Суть методики
состоит в следующем.

По заданным значениям a, b, c вычислить детерминант
d данного уравнения, d=b²-4ac.

Проверить условие P₁: (a ?
0) U (d > 0). Если оно истинно, то вычислить
корни заданного уравнения по формулам:

     (2.31)

В противном случае проверить условие P₂:
(a№0)Щ(d = 0). Если оно
истинно, то применить формулу:

y₁=y₂
= y = - b/2a.
(2.32)
4. В противном
случае проверить условие P₃: (a = 0)Щ(b№ 0). Если оно истинно, то применить
формулу:

y = - c/b

(2.33)

Иначе проверить условие P₄: (a№ 0)Щ(d <
0). Если оно истинно, то заданное
уравнение не имеет действительных корней.

Эта методика еще не является
алгоритмом, так как в ней не определена строгая
последовательность действий, не оговорены
условия начала и окончания процесса и другие
атрибуты алгоритма. Чтобы превратить эту
методику в алгоритм типового алгоритмического
процесса поступим так:

Определим множество X
исходных данных, необходимых для решения задачи.
В данном случае X={a, b, c}, x = (a,b,c)ОX.

Определим базу (p₁, . . ., p_n) характеристической функции
проектируемого алгоритмического процесса. Для
этого согласно вышеизложенной
методике установим множество элементарных
предикатов p₁, . . ., p_n и соответствующие им множества
значений A_i. В нашем
примере положим, что предикату p₁соответствует множество значений {(a
= 0), (a№0)}, p₂ - {(d = 0), (d > 0), (d < 0)}, p₃-
{(b = 0), (b№0)}.
Кроме того, положим, что началом
алгоритмического процесса является условие P₄
- “исходные данные x введены в ЭВМ”. Поэтому в базу
характеристической функции введем предикат p₄ с множеством значений {(данные x не
введены), (данные x введены)}. Когда p₄
= (данные x
не введены) необходимо выполнить первое действие
алгоритмического процесса D^f₁ - ввод исходных данных x.

Установим последовательность выполнения всех
остальных действий в данном алгоритмическом
процессе. Если данные x
введены, то выполняются действия D^f₂, в результате которых вычисляется
значение детерминанта d = b² - 4ac. Дальнейшая последовательность
действий определяется в результате анализа
значений a, b, d в
соответствии с вышеизложенной методикой. В
зависимости от результатов анализа могут
выполняться или действия D^f₃по формулам 2.31, или
действия D^f₄ по
формуле 2.32, или действия D^f₅по формуле 2.33, или
действия D^f₅, в
результате которых выдается сообщение “нет
действительных корней”. Каждые из перечисленных
действий являются заключительными, так как они
заканчиваются выдачей соответствующего
результата и остановкой алгоритмического
процесса.

Используя определенную выше базу переменных p₁,...,p₄,
и установленную
последовательность действий - преобразователей,
определим характеристическую функцию F(p₁,
p₂, p₃, p₄)^D(f) данного
алгоритмического процесса. Для наглядности в
качестве значений переменных, которыми в данном
случае являются многозначные предикаты p_i,
i=1,..,4, будем использовать простые
утверждения (истинные высказывания): (a = 0), (a№0); (d = 0), (d > 0), (d < 0); (b = 0), (b№0); (данные Х не введены), (данные Х введены). Значениями
функции F(p₁, p₂, p₃, p₄)^D(f) являются символы и описания
действий преобразователей D^f_j. Поэтому данная характеристическая
функция будет представлена таблицей
2.23. В этой таблице легко
узнать сокращенную КДНФ логической функции
общего класса F(p²₁, p³₂, p²₃,
p²₄)⁶.
Таблица
2.23

Полученную
характеристическую функцию проверим на
непротиворечивость (корректность) и на полноту ее определения. Для этого
введем следующие сокращенные обозначения для
значений переменных: p₁={0, 1}, p₂={0, 1,
2}, p₃={0, 1}, p₄={0, 1}, и для
значений функции D^f_j = {1, 2, 3, 4, 5, 6}, соответствующие значениям,
определенным ранее. Тогда таблица 2.23 превратится в более удобную
для формального анализа таблицу 2.24,
где P - переменная,
принимающая значения из множества М всех
возможных наборов значений переменных p₁,...,
p₄. Каждый такой набор P_eIM есть формальное
выражение условия, определяющего переход к
соответствующим действиям D^f_j. Если P_e
истинно, то выполнить переход
к D^f_j.

Таблица 2.24.

Анализ этой таблицы показывает,
что функция F(p²₁, p³₂, p²₃,
p²₄)⁶ определена
не корректно, так как обобщенный код (-
- - 1), задающий область определения
импликанты F(P)²
пересекается с обобщенными кодами, задающими
области определения импликант
F(P)³,..., F(P)⁶. Для
устранения этой некорректности необходимо
добавить еще одну переменную p₅, по
значениям которой можно было бы отличить условие
P₂, определяющее действия D^f₂ от
условий, определяющих действия D^f₃,..., D^f_6.Эти значения в данном случае должны иметь
следующий смысл: “значение d не вычислено”
или “значение d вычислено”. При этом
характеристическая функция проектируемого
алгоритмического процесса должна быть
переопределена так, как это показано в таблице
2.25, где значению “значение d не вычислено”
переменной p₅ соответствует краткое
значение “0”, а значению “значение d вычислено”
- значение “1”.Таблица 2.25.

Данная таблица
представляет собой корректно определенную
логическую функцию общего класса F(p²₁,
p³₂, p²₃, p²₄, p²₅)⁶ и является ее минимальной кодовой
ДНФ, так как каждая ее импликанта представлена
только одним обобщенным кодом. Однако данная
функция может быть определена не полностью. Для
проверки полноты ее определения вычислим полную
мощность ее области определения по формуле: где k_i - мощность области
значений переменной p_i (число элементов
множества A_i). В данном примере n(M) = 2* 3* 2*
2* 2= 48. Затем
следует вычислить мощность n(M’) той части M’
области определения характеристической функции,
где она определена. Эта часть представлена таблицей 2.25. Если в данной таблице все
обобщенные коды ортогональны, как в данном
случае, то где m(M*_e) - мощность
подмножества M*_e элементарных кодов
(наборов значений переменных p_i)
представленных обобщенным кодом К_е в
данной таблице. Напомним, что где n(a
_i) - число значений, которые переменная p_i
может принимать в обобщенном коде К_е.
Например, для кода К₂ = ( - - - 0 1) в нашем примере m(M*_e)
= 2* 3* 2* 1*
1 = 12. В целом для таблицы 2.25 n(M’) = 45.
Следовательно, в заданной таблице отсутствуют
три элементарных кода, на которых наша
характеристическая функция оказалась не
доопределенной. Найти эти коды можно путем
последовательного вычитания всех обобщенных
кодов, представляющих заданную таблицу (КДНФ), из
обобщенного кода (- -
- - - ),
представляющего собой множество М в целом. В
результате, в данном случае, получим обобщенный
код К*_е = (0 - 0 1 1),
представляющий собой три отсутствующих в таблице 2.25 элементарных кода: (0 0 0 1 1), (0
1 0 1 1) и (0 2 0 1 1).   Для определения логического
смысла найденного обобщенного кода достаточно
подставить в него ранее определенные смысловые
значения переменных p_i. При этом получим: К*_е
= (а = 0)Щ(b = 0)Щ(данные Х введены)Щ(d вычислено).
Другими словами, данный обобщенный код
характеризует ситуацию, когда квадратное
уравнение ay² + by + c = 0 превращается в
константу c. В этой ситуации, как и в случае,
когда d< 0, можно полагать, что
y = “нет действительных корней”. Поэтому
будем считать, что обобщенный код (0 -
0 1 1) задает условия перехода к действиям D^f₆,
и дополним  таблицу 2.5
соответствующей строкой. В результате получим
корректно и полностью определенную
характеристическую функцию проектируемого
алгоритмического процесса, представленную в
сокращенном виде таблицей 2.26.

Таблица 2.26.

Согласно определению функция F(p²₁,
p³₂, p²₃, p²₄, p²₅)⁶, она же F(P)⁶,
представляет собой отображение P® D^f множества условий P в множество
функциональных действий D^f.

Превратим отображение P® D^f в
отображение D^r ® D^f. Для этого: заменим множество
условий P на множество D^r
действий - распознавателей этих условий, и
построим схему отображения D^r ® D^f(рис.
2.7), наглядно отражающую порядок действий в
типовом алгоритмическом процессе, вычисляющих значения
характеристической функции F(p²₁, p³₂,
p²₃, p²₄, p²₅)^D(f)
и осуществляющих условные
переходы к соответствующим функциональным
действиям D^f_j. При
этом, пока остается открытым вопрос о том, как в
типовом АП осуществляется обратный переход от
промежуточных действий D^f_j к вычислению очередного значения
характеристической функции.

Рис. 2.7. Схема
отображения множества действий –
распознавателей (D^r),
реализующих характеристическую функцию F⁶, в множество действий -
преобразователей (D^f).

Определим обратное отображение D^f ® D^r , задающее
переходы от промежуточных действий D^f_j
к действиям D^r, вычисляющим значения
характеристической функции. Для этого
необходимо каждое подмножество промежуточных
действий, в нашем примере это - D^f₁ и D^f₂,
дополнить действиями преобразователями
значений соответствующих переменных p_i, определяющих переход от D^f_j к D^r_еНD^r , и включить в
множество D^f одно, общее
для всех подмножеств промежуточных действий D^f_j, действие - безусловный переход к
началу множества действий D^r.   Внесение перечисленных
дополнительных действий в АП обеспечивает его
самоуправляемость. В данном примере такими
действиями являются: действие (p₄:=1) - присвоение значения “1”
переменной p₄,
указывающего на факт завершения ввода исходных
данных х, осуществляемого подмножеством D^f₁, и действие (p₅:= 1) - присвоение значения “1”
переменной p₅,
указывающего на факт завершения вычисления
значения детерминанта d,
выполняемого подмножеством D^f_j, и безусловные переходы D^f₁®D^r, D^f₂®D^r. Напомним,
что подмножества заключительных действий D^f_j должны включать в себя действия,
выдающие искомые результаты. В данном случае это
- значения: y, y_1,y₂ и
сообщение “нет действительных корней”.
Схема проектируемого алгоритмического процесса
с перечисленными дополнениями показана на рис. 2.8. Строго говоря, эта схема
является схемой математической, точнее
логической, модели типовой структуры данного
процесса.

Рис. 2.8.
Схема отображения множеств D^r®D^f®D^r, образующих алгоритмический процесс
вычисления корней квадратного уравнения ay²+by+c=0

Дальнейшее проектирование типового АП
заключается в том, чтобы определить способы и
построить частные алгоритмические процессы для
реализации действий D^r, вычисляющих
значения характеристической функции F(p²₁,
p³₂, p²₃, p²₄, p²₅)^D(f),
и действий D^f_j, осуществляющих
непосредственные преобразования данных x в
результаты y. Для построения процесса
вычисления значений характеристической функции
F(p²₁, p³₂, p²₃, p²₄,
p²₅)^D(f) можно предложить два
алгоритма. Первый состоит из следующих простых
инструкций:

Определить текущие значения предикатов p_i
и составить набор (элементарный
код) из этих значений [p₁(t), p₂(t), . . .,
p_n(t)], представляющий собой
текущее условие P_t для
перехода к определенному действию D^f_j.

Определить обобщенный код К* в таблице, задающей
функцию F(p²₁, p³₂, p²₃,
p²₄, p²₅)^D(f), который включает в себя данный
набор [p₁(t), p₂(t), . . ., p_n(t)].

Определить имя (индекс или символ) подмножества
D^f_j,
соответствующего коду К*.

Перейти к выполнению действий из подмножества D^f_j.

Данный алгоритм вычисления
характеристической функции хорош тем, что он не
зависит от конкретного содержания самой функции.
Поэтому его можно реализовать как универсальный
алгоритм для вычисления любой
характеристической функции. Второй алгоритм
вычисления значений характеристической функции
предписывает последовательное вычисление
значений истинности только тех предикатов p_i(t), которые существенно связаны с
очередными действиями D^f_j. Например, для перехода к выполнению
действий из подмножества D^f₁в рассматриваемом примере
достаточно проверить значение только одного
предиката p₄. Значения
остальных предикатов для условий перехода к D^f₁ не существенны. Это следует из того,
что на месте значений этих предикатов в
обобщенном коде, с которым связаны действия D^f₁, стоят символы “-”. Иначе говоря,
для определения условий перехода к действиям D^f_j следует проверять значения только
тех предикатов p_i,
которые в соответствующей строке таблицы ХФ
содержат символы, отличные от знака тире.

Для реализации такого алгоритма
вычисления ХФ необходимо ее кодовую ДНФ
превратить в эквивалентную ей логическую схему.
Эта процедура может быть выполнена формально
одним из способов, изложенных в докторской
диссертации Устенко А. С. [14].
Для рассматриваемого примера
логическая схема алгоритма вычисления значений
ХФ, полученная из таблицы 2.26,
показана на рис. 2.9.

Рис. 2.9 Логическая схема
алгоритма вычисления значений
характеристической функции проектируемого АП

Частные алгоритмы,
задающие процедуры D^f_j, могут быть так же спроектированы и
построены, как типовые алгоритмические процессы,
если они обладают сложной структурой, или
представлены в виде простейших программ на
некотором алгоритмическом языке. Приведенный
простой пример показывает, что использование
теории обобщенных кодов, логических функций
общего класса и типовых структур
алгоритмических процессов позволяет в
значительной степени формализовать и облегчить
и даже автоматизировать процессы анализа и
синтеза алгоритмов, моделирующих
функционирование сложных систем.

2.11.4. Показатели качества
алгоритмов и алгоритмических процессов

2.11.4.1. Обобщенные и частные показатели

Обобщенными показателями
качества алгоритмов и алгоритмических
процессов являются характеристики их
потребительских свойств:

эффективность использования их по
предназначению,
ресурсоемкость и
стоимость.

Эти характеристики (показатели)
определяются по уже известным нам показателям
частных свойств алгоритмов и алгоритмических
процессов. Структура функциональных связей
между показателями качества алгоритмических
процессов и алгоритмов показаны соответственно
на рис. 2.10 и рис. 2.11

Рис 2.10. Функциональная
структура показателей качества алгоритма

Рис. 2.11. Функциональная
структура показателей качества алгоритмических
процессов

Из всех перечисленных свойств
алгоритмов и алгоритмических процессов наиболее
фундаментальным является сложность. Именно
сложность оказывает наиболее существенное
влияние на ресурсоемкость, стоимость и многие
другие показатели качества алгоритмов и
алгоритмических процессов. Поэтому при
проектировании обычно стремятся из двух
алгоритмов или процессов, решающих одну и ту же
задачу с одинаковым качеством, выбирать тот из
них, который обладает меньшей сложностью.
    Другими словами, вместо оценки по
показателям эффективность - стоимость или
эффективность - ресурсоемкость можно
использовать показатели эффективность -
сложность. Из сказанного следует, что
определение и оценка показателей сложности
алгоритмов и алгоритмических процессов имеет
важное методологическое и практическое
значение. Понятие о сложности алгоритмов и
алгоритмических процессов имеет несколько
различных определений. Чаще всего сложность этих
объектов определяется по количеству элементов
или частей, из которых они состоят. При этом,
например, сложность алгоритмов оценивается по
суммарному числу операторов, содержащихся в
тексте алгоритма, а сложность алгоритмического
процесса - по числу всех действий, выполняемых с
момента запуска процесса до получения
результата решения задачи. Такая оценка
сложности не отражает степени разнообразия
множества структурных элементов данного
алгоритма или алгоритмического процесса.
Поэтому, исходя из определения сложности, как
свойства, отражающего разнообразие структурных
элементов рассматриваемого объекта, определим
показатели сложности для вычисляемых функций
(решаемых задач), для алгоритмов и для
алгоритмических процессов с учетом специфики
оцениваемых объектов.

2.11.4.2. Показатель сложности решаемой задачи X® Y

Сложность решаемой задачи X®
Y определяется степенью неопределенности Н(X® Y) выбора (вычисления) результата
решения данной задачи.

Решение задачи X® Y
представляет собой процесс выбора элемента x_e
из множества Х, e=1,...,m, и выбора
соответствующего ему элемента y_j из множества Y, j=1,...,N, согласно
заданному отображению X® Y. Поэтому
источником неопределенности при решении задачи X® Y является разнообразие элементов в
множествах X, Y и разнообразие связей в
отображении X в Y.

            (2.34)

В общем случае неопределенность
выбора некоторого, безразлично какого именно,
элемента y из множества Y
оценивают величиной энтропии:

где p(y_j) -
вероятность выбора элемента y_j из множества Y,

N - число всех элементов
множества Y,

а - основание логарифма.

Поэтому величина H(Y) может служить
мерой разнообразия элементов множества Y.
Другими словами, величина H(Y) есть математическое
ожидание логарифма вероятности выбора
некоторого элемента из Y, безразлично какого
именно. Вероятность p(y_j) является условной
вероятностью, зависящей от вероятности p(x_e)
выбора элемента x_e из множества исходных
данных X и от заданного отображения X®
Y, согласно которому один и тот же элемент y_j
может соответствовать нескольким различным
наборам исходных данных x_e из Х. Поэтому
вероятность p(y_j) следует вычислять по
формуле:

     где
m_j - количество
элементов x_e из Х,
которым отвечает элемент y_jиз Y.   Таким образом, приходим к
выводу, что величина неопределенности
(сложность) решения задачи X® Y, с
учетом неопределенности выбора наборов x_eисходных данных и заданного
(определенного) отображения X® Y,
может быть вычислена по формуле:


(2.35)

Если вероятности p(x_e) одинаковы для всех x_e из Х, то p(x_e)
= 1/m, где m - количество всех элементов в множестве
Х, и формула (2.35) приобретает вид:

        (2.36)

Выбор показателя 2.34 для
оценки сложности функции X® Y
основан на следующих соображениях:

Величина C(X® Y) определяется
параметрами N и m_j / m, j=1,...N, которые характеризуют
разнообразие элементов в множествах X и Y и
разнообразие отношений между этими элементами,
т. е. - сложность функции X® Y.

Величина C(X® Y) не зависит ни от
способа вычисления функции X® Y, ни
от времени t ее вычисления.
Величина C(X® Y) принимает
минимальное значение, равное нулю, при N=1, то есть
при минимальном разнообразии элементов в
множестве Y, когда разнообразие элементов
множества X не оказывает влияние на выбор
элементов их Y и функция превращается в
константу.

Величина C(X® Y)
принимает максимальное значение C(X®
Y)=log_aN при максимально
возможном разнообразии решений (элементов
множества Y), когда N=m, и p(x_e) = 1/m.

В общем случае величина C(X® Y)
изменяется в пределах:

Здесь величина C(X® Y) представляет
собой меру неопределенности (энтропию H(X® Y)) выбора решения y_jОY при условии, что
задано функциональное соответствие X®
Y, и что все наборы исходных данных x_eОX могут быть взяты
для обработки с одинаковой вероятностью p(x_e)=
1 / m. Энтропия H(X®
Y) есть среднее значение логарифма вероятности
принятия какого-либо решения y_jОY при заданном
функциональном соответствии X® Y.
Эта величина прямо зависит от логической
сложности функции X® Y и поэтому
может служить ее мерой (мерой сложности функции).

Пример. Определим сложность задачи,
которую решал известный сказочный герой, стоя на
распутье перед камнем с надписью:

“Налево пойдешь - женатым будешь.
Направо пойдешь - коня потеряешь.
Прямо пойдешь - сам погибнешь”.

В данном случае множество Y возможных
решений состоит из трех альтернатив: женатым
будешь, коня потеряешь, сам погибнешь. Множество X
исходных данных также определено тремя
условиями: налево пойдешь, направо пойдешь, прямо
пойдешь. Между элементами множеств X и Y
установлено однозначное соответствие. Поэтому

C(X® Y) = -
3 (1 / 3) log_e (1 / 3) =
1,1.     Основание логарифма
в данном случае принято равным величине e.
   При первой же попытке
формального анализа этой задачи выясняется, что
она определена не полностью. В области исходных
данных не учтены два возможных условия: “обратно
пойдешь” и “на месте останешься”. Этим условиям
необходимо сопоставить какие-то следствия y_j из Y. Например, по смыслу сказки
безрезультатное возвращение домой нашего героя,
равно как и безрезультатное сидение на одном
месте, свидетельствуют о его несостоятельности.
Это, очевидно, и подразумевается в данной сказке
“по умолчанию”. Поэтому полностью определенная
задача нашего сказочного героя фактически имеет
следующую постановку:

“Налево пойдешь -
женатым будешь.
Направо пойдешь - коня потеряешь.
Прямо пойдешь - сам погибнешь.
Обратно пойдешь или
на месте останешься - позором
покроешься”.

Если наш герой с равной вероятностью
может принять любое из пяти перечисленных
решений, то сложность получения любого из
четырех перечисленных результатов в среднем
равна величине:

C(X® Y) = -
3 (1 / 5) log_e (1 / 5) - (2 / 5) log_e (2 / 5) = 1,3.     Следовательно,
судя по вычисленным значениям показателя C(X® Y), задача нашего героя на самом деле
несколько сложнее, чем ее постановка, изложенная
в известной сказке.

2.11.4.3. Показатель сложности алгоритма

По определению алгоритм задает
процесс вычисления функции X® Y.
Для этого в алгоритме имеются описатели D_jОD действий D_jОD и описатели
(предикаты) P_rОP условий P_rОP. Здесь символы D_j, D,
P_r, P используются
для обозначения описателей, соответствующих
действий   D_j, D и условий     P_r,
P, r=1,2,...,m , P_rОP_jНP,
j=1,2,...,m_j, .
Другими словами, алгоритм представляет собой
описание детерминированного отображения P® D, которое по определению
является описанием характеристической функции
типового алгоритмического процесса. Поэтому
сложность алгоритма, задающего этот процесс
можно оценить, как сложность функции P® D по формуле:

        (2.37)

В данном выражении
величина m_j / m есть оценка неопределенности или
вероятности выбора подмножества действий D_jиз множества Dв предположении, что вероятности
истинности предикатов P_r одинаковы для всех r=1, 2,...,m, то есть
что вероятность p(P_r)=(1/m). В общем случае эти оценки
различны для различных подмножеств D_j. Однако, для оценки сложности
алгоритма в целом имеет смысл среднее значение (m_j
/ m)* величины (m_j/m), которое можно
вычислить следующим способом: m*_j=(m/N), (m_j
/ m)* = (m/N/m) = (1/N). При
этом сложность алгоритма при условии равных
вероятностей выбора действий D_jОD оценивается по
формуле:

или     a^{C(P® D)}= N,
или e^{C(P® D)}= N.
(2.38)

Последнее уравнение позволяет
объяснить смысл введенной нами оценки сложности
алгоритмов. В правой части этого уравнения стоит
число N описателей D_j альтернативных действий D_j из множества D. Это прямая оценка
разнообразия элементов множества D.

          (2.39)

Для содержательной интерпретации
левой части уравнения 2.39 напомним,
что предикаты P_r представляют
собой конституенты F(p₁, p₂,...,p_n)^Dj характеристической функции F(p₁,
p₂,...,p_n)^D(f), где p₁,
p₂,...,p_n - базовые
переменные данной функции (элементарные
предикаты, определенные на множестве Х исходных
данных и на множестве Z состояний
алгоритмического процесса). Число m конституент
P_r в множестве P (мощность множества P) определяется по формуле: m = k₁-k₂-
... - k_n,
или m = kⁿ, если k₁=k₂
=... =k_n, k- число
значений базовой переменной р_i, i=1,...,n.
   Полагая, что основание а
логарифма в выражении 2.39 равно числу
k значений элементарных предикатов p_i, и что величина C(P®
D) равна числу n переменных
(предикатов p_i) в базе
характеристической функции алгоритма, приходим
к выводу, что kⁿ=N. Это
означает, что в алгоритме минимальное
разнообразие условий, представленных
конституентами P_r должно соответствовать
разнообразию описателей действий D_j. При этом сложность алгоритма C(P® D) оценивается
числом переменных (элементарных предикатов p),
необходимых для корректного задания
характеристической функции данного алгоритма.
Величина C(P® D) зависит также от значности
переменных p_i. Поэтому
при сравнительной оценке сложности алгоритмов
по формуле 2.37 необходимо выбирать
единое значение основания логарифма.
Рекомендуется принимать a=e (основание
натурального логарифма) или а=2 (значность
двоичных переменных). В последнем случае
сложность алгоритма C(P® D) можно интерпретировать, как
среднее число двоичных базовых переменных р_i, подлежащих проверке при
определении переходов между действиями D_j и D_t, j, t О
{1,2,...,N}.   Соотношение C(X® Y) / C(P® D) = K (C) является показателем качества
проектирования алгоритмов. Чем ближе это
отношение к единице, тем проще и, следовательно,
лучше спроектирован алгоритм для решения задачи
X® Y. Наличие в алгоритмах
избыточных описателей условий P_r, переменных p_i, или действий D_j усложняет алгоритм и
соответственно снижает его качество.
Избыточность описателей в алгоритме оправдана
только тогда, когда алгоритм реализует
дополнительные функции, обеспечивающие
устойчивость алгоритмического процесса или
необходимые сервисные возможности при решении
поставленной задачи.

2.11.4.4.
Оценка сложности иерархических алгоритмов

До сих пор мы рассматривали типовые
алгоритмы, с множеством функциональных действий,
относящихся к одному уровню иерархии. Схема
такого алгоритма показана на рис. 2.12.

Рис
2.12. Схема типового алгоритмического процесса с
одним уровнем иерархии

Однако на практике чаще всего
приходится иметь дело со сложными
многоуровневыми иерархическими алгоритмами, в
которых подмножества D_jтакже
представлены типовыми алгоритмами, как это
показано на рис. 2.13. Оценка
сложности таких алгоритмов может быть основана
на следующих соображениях. Пусть сложность
частного типового алгоритма, задающего
подмножество действий D_j равна величине C_j.
По определению C_jесть среднее число
базовых переменных p_i характеристической
функции этого алгоритма, проверяемых при
определении условных переходов между
функциональными действиями в j-том частном
алгоритме. Так как на каждом иерархическом
уровне сложного алгоритма может быть несколько
частных алгоритмов, то имеет смысл оценка C_u
средней сложности частных алгоритмов на данном
иерархическом уровне.

Рис. 2.13. Схема типового
алгоритмического процесса с двумя уровнями
иерархии

При этом сложность
всего сложного иерархического алгоритма в целом
оценивается величиной где u - номер
иерархического уровня в сложном алгоритме, C_u,r=C(P® D)_u,r - сложность r-того
частного алгоритма на уровне с номером

       (2.40)



u, N_u - количество частных алгоритмов на этом
уровне, r=1,2,...,N_u, C(P® D)_u,r определяется по формулам 2.37 или
2.39 применительно к данному частному
алгоритму. Другими словами, сложность
иерархического алгоритма в целом оценивается
средним числом элементарных условий (базовых
переменных p), проверяемых в процессе реализации
алгоритма. Последовательность проверок условий
p, изображенную на схеме алгоритма, называют
маршрутом. В данной терминологии сложность
алгоритма оценивается средней длиной маршрута
реализации алгоритма от ввода исходных данных до
получения какого-нибудь решения поставленной
задачи.

Пример 1. В разделе 2.11.3
мы рассматривали пример синтеза алгоритма для
вычисления корней квадратного уравнения ay² + by + c = 0. Суть этого алгоритма
состоит в том, что он представляет собой точную
инструкцию, как по любому заданному набору x_eзначений действительных
чисел a,b,c получить значение y, удовлетворяющее
заданному уравнению. В общем случае область
исходных данных X={a,b,c} и область значений корней
Y={y} являются бесконечными. Однако многие
значения y из Y вычисляются по одним и тем же
правилам (формулам F_j(x)), если
соответствующие исходные данные x_e из X
удовлетворяют определенным условиям P_r.
Поэтому суть алгоритма состоит в том, чтобы для
любого x_e определить условия P_r
применения соответствующей формулы или действия
F_j(x_e) = y_e. Множества условий P_r
и соответствующих им формул F_j(x) конечны и
должны быть описаны в алгоритме. Поэтому
алгоритм представляет собой описание метода
отображения P ® F, и сложность
алгоритма можно оценить величиной сложности
функционального отображения P ® F.
   Согласно известному методу вычисления
корней квадратного уравнения существует 5
условий P_r, разбивающих множество исходных
данных X на 5 характерных подмножеств X_r:P₁=(a№0)Щ(d>0),
P₂=(a№0)Щ(d=0), P₃=(a=0)Щ(b№0), P₄=(a№0)Щ(d<0)
и P₅=(a=0)Щ(b=0). В результате многообразие
элементов бесконечного множества X
преобразуется в многообразие подмножеств X_r,
которых всего пять. Каждому подмножеству X_rсоответствует
определенная формула F_j. В данном случае
таких формул всего четыре: F₁= (-
b +_Цd)/ 2a, F₂= b/ 2a, F₃= - c/ b и F₄- сообщение
“действительных корней нет”. В методике
предполагается, что формула F₄соответствует
условию P₄и условию P_5.Поэтому оценка
сложности рассматриваемого метода решения
поставленной задачи выполняется по
формуле:



где N - количество
альтернативных формул, преобразующих элементы x_eОX_r в элементы y_jОY,

m_j=1 для jО{1,2,3} и m_j= 2 для j=2,

m = 5 количество условий P_r,
разделяющих множество X на подмножества X_r,

а - основание натурального логарифма.
При этом C(P®F)=-(3/5)log_a(1/5)-(2/5)log_a(2/5)=1,3322.    Однако
реальный алгоритм, реализующий изложенный метод,
должен содержать еще дополнительные условия и
описатели функций или действий, предназначенные
для организации соответствующего
алгоритмического процесса на заданных
технических средствах. В данном примере для этой
цели были добавлены условия, обеспечивающие ввод
исходных данных и вычисление значения
детерминанта d. В результате количество условий P_rувеличилось до семи, а число описателей
действий D^f, реализующих функции F_j(x) и
другие действия, увеличилось до шести.
Таким образом, реальный алгоритм представляет
собой описание отображения P ® D^f,
которое задается таблицей 2.26. Оценке
сложности алгоритма при этом получается в
результате следующих вычислений:   C(P® D^f)= -(5/7)log_a(1/7)-(2/7)log_a(2/7) =1,7487. Для сравнения
оценки сложности математической методики
решения задачи и оценки сложности
соответствующего ей типового алгоритма введем
коэффициент сложности:

^{K(C) = C(P® D^f)
/ C(P® F).      (2.41)

В данном примере K(C) =1,3126 показывает,
что алгоритм сложнее методики, на основании
которой он составлен примерно на 30%. Это
усложнение происходит за счет необходимости
явно описывать в алгоритме все действия, которые
в методике выполняются “по умолчанию”.

Пример 2. Примером
иерархических алгоритмов является так
называемые диалоговые человеко-машинные
системы. В них после запуска алгоритмического
процесса и прихода его в определенное устойчивое
состояние S_g на
экране дисплея появляется сообщение в виде меню,
в котором пользователю предлагается несколько
вариантов дальнейшего продолжения процесса.
Действия пользователя также могут состоять из
нескольких допустимых вариантов, заранее
предусмотренных в алгоритме. Комбинация
элементов меню qОQ_g, значений параметров данного
состояния hОH_g и действий пользователя rОR_g приводит
к следующему состоянию S_t алгоритмического процесса. Каждое
такое состояние соответствует определенному
уровню сложного иерархического алгоритма и
может быть представлено одним типовым
алгоритмом. Макет отдельного состояния S_g представлен на рис. 2.14.

Рис. 2.14. Макет
одного состояния диалоговогоалгоритмического
процесса

Заключительным действием в каждом
состоянии S_gявляется переход в
следующее состояние S_t. В новом
состоянии выдается новое меню и так далее. В
качестве примера диалогового алгоритма
рассмотрим алгоритм, реализующий процесс
автоматизированного обучения иностранному
языку по словарю. Алгоритм предусматривает два
режима обучения. Первый режим заключается в том,
что обучаемому показывают на экране N
иностранных слов из заданного словаря и русское
слово, являющееся переводом одного из показанных
иностранных слов. Обучаемому необходимо
стрелкой “мышки” указать иностранное слово,
соответствующее показанному на экране русскому
слову. Факт правильного ответа подтверждается
сообщением “правильно” и запоминается в памяти
ЭВМ, а обучаемому выдается следующее русское
слово из заданного набора. При этом правильно
переведенные обучаемым русские слова больше не
показывается на экране. Если обучаемым допущена
ошибка, то ему сообщается об этом и выдается
другое русское слово для опознания, а ранее
заданное слово остается для следующего
предъявления. После того, как обучаемый
правильно укажет перевод всех N заданных слов,
первый режим обучения заканчивается сообщением:
“Вы усвоили заданные слова. Переходите ко
второму режиму обучения”. Второй режим обучения
состоит в том, что обучаемому показывают на
экране русское слово из заданного словаря,
состоящего из тех же N слов, а он должен ввести с
клавиатуры соответствующее иностранное слово -
перевод. Реакция системы на правильный и
неправильный ответ обучаемого такая же, как и в
первом режиме обучения. Предварительная
описательная характеристическая таблица
данного алгоритма представлена в виде таблицы
2.27. В ней описаны четыре состояния
алгоритмического процесса: S₀, S₁,
S₂, S₃,. Каждое состояние S_t
определено на собственной базе предикатов p₁,
...,p_n(t) и имеет собственную
характеристическую функцию F_t, по
которой можно определить логическую сложность
алгоритма данного состояния. Так для состояния S₀
по функции F₀ находим:

С(S₀) = - (1/4) log_a
(1/4) - (3/4) log_a (3/4) = 0,562.

Для состояний S₁, S₂,
S₃ на основании функций F₁,
F₂, F₃ соответственно
подучим следующие оценки сложности этих
состояний:

С(S₁) = - (3/6) log_a
(1/6) - (3/6) log_a (3/6) = 1, 242,

С(S₂) = - (2/8) log_a
(1/8) - (2/8) log_a (2/8) -
(4/8) log_a (4/8) = 1,213,

С(S₃) = - (2/8) log_a
(1/8) - (2/8) log_a (2/8) -
(4/8) log_a (4/8) = 1,213.

Таблица 2.27

Для получения оценки сложности
рассматриваемого обучающего алгоритма в целом
желательно предварительно составить наглядную
схему его состояний примерно такую, какая
показана на рис. 2.15.

Рис. 2.15. Иерархическая
схема алгоритма обучения иностранному языку

Из данного рисунка видно, что
рассматриваемый алгоритм состоит из трех
иерархических уровней. Первый и второй уровни
алгоритма описывают по одному состоянию
алгоритмического процесса, а третий уровень
алгоритма описывает два состояния (S₂ и S₃).
Поэтому согласно изложенной выше методике
определения сложности типовых иерархических
алгоритмов искомая оценка сложности может быть
вычислена по следующей формуле:    C(P® D^f)= C(S₀)+C(S₁)+[C(S₂)+C(S₃)]/2
=3,017.    Так как алгоритм однозначно задает
соответствующий алгоритмический процесс, то
сложность алгоритмического процесса можно
оценивать сложностью его алгоритма с учетом
сложности С(L) преобразования алгоритмического
языка L , на котором представлен данный алгоритм,
в соответствующую машинную программу.

C(АП) = C(P®
D^f)*K(L),
(2.42)

где K(L) - коэффициент усложнения
алгоритма при переводе его на машинный язык.

главная
об
авторе
содержание
       часть1
     часть3
      часть4
     литература}}