Системы искусственного интеллекта, основанные на нейронных сетях

Обзор искусственных нейронных сетей, состоящих из множества взаимодействующих простых процессоров и представляющих собой устройства параллельных вычислений. Анализ структуры связей детали сетевой конструкции. Вычисления сигналов и значений нейронов.

Рубрика Программирование, компьютеры и кибернетика
Вид лекция
Язык русский
Дата добавления 21.10.2013
Размер файла 147,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

ЛЕКЦИЯ

ПО КУРСУ: СИСТЕМЫ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА

Системы искусственного интеллекта, основанные на нейронных сетях

1. Понятие и структура нейронных сетей

Искусственные нейронные сети представляют собой устройства параллельных вычислений, состоящие из множества взаимодействующих простых процессоров. Такие процессоры обычно исключительно просты, особенно в сравнении с процессорами, используемыми в персональных компьютерах. Каждый процессор подобной сети имеет дело только с сигналами, которые он периодически получает, и сигналами, которые он периодически посылает другим процессорам, и, тем не менее, будучи соединенными в достаточно большую сеть с управляемым взаимодействием, таки локально простые процессоры вместе способны выполнять довольно сложные задачи.

Разработка искусственных нейронных сетей (НС) началась в начале ХХ века, но только в 90-х годах, когда вычислительные системы стали достаточно мощными, НС получили широкое распространение. Создание НС было вызвано попытками понять принципы работы человеческого мозга и, без сомнения, это будет влиять и на дальнейшее их развитие. Однако, в сравнении с человеческим мозгом НС сегодня представляют собой весьма упрощенную модель. Несмотря на это НС весьма успешно используются при решении самых различных задач. Например, программная реализация НС может использоваться для составления плана кредитных выплат людей, обращающихся в банк за займом. Хотя решение на основе нейронных сетей может выглядеть и вести себя как обычное программное обеспечение, они различны в принципе, поскольку большинство реализаций на основе нейронных сетей «обучается», а «не программируется»: сеть учиться выполнять задачу, а не программируется непосредственно. На самом деле НС используются тогда, когда невозможно написать подходящую программу, или по причине того найденной НС решение оказывается более совершенным. Например, эксперт по продаже недвижимости из своего опыта может знать, какие факторы влияют на продажную цену каждого конкретного дома, но при этом часто имеются такие особенности, которые будет весьма трудно объяснить программисту. Агентство по продаже недвижимости может пожелать иметь «предсказателя цен на основе НС», обученного на множестве примеров реальных продаж тому, какие факторы влияют на цену продаваемого объекта, и тому, какую относительную важность имеет каждый из этих факторов. Но здесь более важным оказывается то, что решение на основе НС является более гибким, поскольку соответствующая система может в дальнейшем совершенствовать точность предсказаний по мере накопления ею опыта и адаптироваться к происходящим на рынке изменениям.

Основные компоненты.

НС представляет собой совокупность элементов, соединенных некоторым образом так, чтобы между ними обеспечивалось взаимодействие. Эти элементы, называемые также нейронами или узлами, представляют собой простые процессоры, вычислительные возможности которых обычно ограничиваются некоторым правилом комбинирования входных сигналов и правилом активизации, позволяющим вычислить выходной сигнал по совокупности входных сигналов. Выходной сигнал элемента может посылаться другим элементам по взвешенным связям, с каждой из которых связан весовой коэффициент или вес. В зависимости от значения весового коэффициента передаваемый сигнал или усиливается, или подавляется. Элемент нейронной сети, также называемый нейроном, схематически показан на рис. 1.

Рис. 1:

Структура связей отражает детали конструкции сети, а именно то, какие элементы соединены, в каком направлении работают соединения и каков уровень значимости (т. е., вес) каждого соединения. Задача, которую понимает связь описывается в терминах весовых значений связей, связывающих элементы. Структура связей обычно определяется в два этапа: сначала разработчик системы указывает, какие элементы должны быть связаны, и в каком направлении, а затем в процессе фазы обучения определяются значения соответствующих весовых коэффициентов.

Весовые коэффициенты можно определить и без проведения обучения, но как раз самое большое преимущество НС заключается в их способности обучаться выполнению задачи на основе тех данных, которые сеть будет получать в процессе реальной работы.

Для многих приложений обучение является не только средством программирования сети, когда нет достаточных знаний о способе решения задачи, позволяющих выполнить программирование в традиционной форме, но часто единственной целью обучения является проверка того, что сеть действительно сможет научиться решать поставленные перед ней задачи.

Существует множество различных типов нейронных сетей.

Рис. 2. - Варианты наиболее распространенных архитектур искусственных НС:

Все рассматриваемые НС можно представить с помощью следующих абстракций:

- Множество простых процессоров;

- Структура связей;

- Правило распространения сигналов в сети;

- Правило комбинирования входящих сигналов;

- Правило вычисления сигнала активности;

- Правило обучения, корректирующее связи.

Множество простых процессоров.

С каждым процессором, т. е., обрабатывающим элементом сети связывается набор входящих связей, по которым к данному элементу поступают сигналы от других элементов сети, и набор исходящих связей, по которым сигналы данного элемента передаются другим элементам. Некоторые элементы предназначены для получения сигналов из внешней среды (и поэтому называются входными элементами), а некоторые - для вывода во внешнюю среду результатов вычислений (выходные элементы).

Структура связей.

Структура связей отражает то, как соединены элементы сети. В одной модели (т. е., для одного типа сети) каждый элемент может быть связан со всеми другими элементами сети, в другой модели элементы могут быть организованы в некоторой упорядоченной по уровням (слоям) иерархии, где связи допускаются только между элементами в смежных слоях, а в третьей - могут допускаться обратные связи между смежными слоями или внутри одного слоя, или же допускаться посылка сигналов элементами самим себе. Возможности здесь бесконечны, но обычно для каждой конкретной модели сети указывается тип допустимых связей.

Каждая связь определяется тремя параметрами: элементами, от которого исходит данная связь, элементом, к которому данная связь направлена, и числом, указывающим весовой коэффициент. Отрицательное значение веса соответствует подавлению активности соответствующего элемента, а положительной значение - усилению его активности. Абсолютное значение весового коэффициента характеризует силу связи.

Структура связей обычно представляется в виде весовой матрицы W, в которой каждый элемент представляет величину весового коэффициента для связи, идущей от элемента i к элементу j. Для описания структуры связей может использоваться не одна, а несколько весовых матриц, если элементы сети оказываются не одна, а несколько весовых матриц, если элементы сети оказываются сгруппированными в слои. На рис. 3 и 4 предлагаются примеры представления структуры связей в виде соответствующих матриц.

Рис. 3:

Правило распространения сигналов в сети.

а) правило комбинирования входящих сигналов.

Довольно часто входящие сигналы элемента предполагается комбинировать путем суммирования их взвешенных значений. Пример этого метода суммирования показан на рис. 5, где обозначает результат комбинирования ввода элемента j, - выход элемента i, а n - число задействованных связей.

Рис. 4:

Рис. 5:

Используются и другие формы комбинирования входящих сигналов, и другим часто встречающимся методом является рассмотрение квадрата разности между значением силы связи и значением передаваемого по связи сигнала с последующим суммированием таких разностей для всех входящих связей данного элемента:

Или в векторном представлении:

Правило вычисления сигнала активности.

Для всех элементов имеется правило вычисления выходного значения, которое предполагается передать другим элементам или во внешнюю среду. Это правило называют правилом активности, а соответствующее выходное значение называют активностью соответствующего элемента. Активность может представляться либо некоторым действительным значением произвольного вида, либо действительным значением из некоторого ограниченного интервала значений (например, из интервала [0,1]), или же некоторым значением из определенного дискретного набора значений.

На вход функции активности поступает значение комбинированного ввода данного элемента. Примеры функций активности приводятся ниже.

Тождественная функция.

Функция активности для входных элементов может быть тождественной функцией, и это просто означает, что значение (сигнал, посылаемый другим элементам) оказывается в точности равным комбинированному вводу (рис. 6).

Входные элементы обычно предназначены для распределения вводимых сигналов между другими элементами сети, поэтому для входных элементов обычно требуется, чтобы исходящий от элемента сигнал был таким же, как и входной.

В отличие от других элементов сети, входные элементы сети только по одному входному значению.

Например, каждый входной элемент может получать сигнал от одного соответствующего ему датчика, размещенного на фюзеляже самолета. Один этот элемент связывается со многими другими элементами сети, так что данные, полученные от одного датчика, оказываются распределенными между многими элементами сети.

Рис. 6:

Пороговая функция.

В большинстве моделей НС используются нелинейные функции активности.

Пороговая функция ограничивает активность значениями 1 или 0 в зависимости от значения комбинированного ввода в сравнении с некоторой пороговой величиной (рис. 7).

Рис. 7. - Пороговая функция:

Чаще всего удобнее вычесть пороговое значение (называемое смещением или сдвигом) из значения комбинированного ввода и рассмотреть пороговую функцию в ее математически эквивалентной форме, показанной на рис. 8. Сдвиг в данном случае оказывается отрицательным, а значение комбинированного ввода вычисляется по формуле:

Рис. 8:

Сдвиг обычно интерпретируется как связь. Исходящая от элемента активность которого всегда равна 1. комбинированный ввод в этом случае можно представить в виде:

Где:

х0 - всегда считается равным 1.

Сигмоидальная функция.

Наиболее часто используемой функцией активности является сигмоидальная функция. Выходные значения такой функции непрерывно заполняют диапазон от 0 до 1. примером может служить логистическая функция, показанная на рис. 9.

Наклон и область выходных значений логистической функции могут быть разными. Например, для биполярного сигмоида областью выходных значений является диапазон -1 и 1.

Рис. 9:

Обучение НС.

Качество работы НС сильно зависти от предъявляемого ей в процессе набора учебных данных, учебные данные должны быть типичными для задачи, решению которой обучается сеть. Обучение часто оказывается уникальным процессом, когда приемлемые решения многих проблем могут быть получены только в процессе многочисленных экспериментов. Разработчикам решения на основе нейронной сети требуется следующее:

- Выбрать соответствующую модель сети;

- Определить топологию сети (т. е., число элементов и их связи);

- Указать параметры обучения.

Существуют три парадигмы обучения: с учителем, без учителя и смешанная.

Обучение с учителем.

Обучение с учителем предполагает, что для каждого входного вектора существует целевой вектор, представляющий собой требуемый выход (решение задачи). Вместе он называются обучающей парой. Обычно сеть обучается на некотором числе таких обучающих пар.

Когда в сети один слой, алгоритм ее обучения с учителем довольно очевиден, так как правильные выходные состояния нейронов единственного слоя заведомо известны, и подстройка связей идет в направлении, минимум ошибку на выходе сети.

В многослойных сетях оптимальные выходные значения нейронов всех слоев, кроме последнего, как правило, не известны, и двух или более многослойную НС уже невозможно обучить, руководствуясь только величинами ошибок на выходах сети.

Один из вариантов решения этой проблемы - разработка наборов выходных сигналов, соответствующих входным, для каждого слоя НС, что конечно является трудоемкой операцией и не всегда осуществимо.

Второй вариант - динамическая подстройка весовых коэффициентов синапсов, в ходе которой выбираются наиболее слабые связи, которые изменяются на малую величину в ту или другую сторону. Сохраняются же только те изменения, которые повлекли уменьшение ошибки на выходе сети. Очевидно, что данный метод «проб» требует громоздких рутинных вычислений. искусственный параллельный нейрон

Третий более приемлемый вариант - распространение сигналов ошибки от выходов НС к ее входам, в направлении обратном прямому распространению сигналов в обычном режиме работы. Этот алгоритм обучения НС получил название процедуры обратного распространения и является наиболее широко распространенным.

Обучение без учителя.

Обучение без учителя является более правдоподобной моделью обучения в биологической системе. Процесс обучения, как и в случае обучения с учителем, заключается в настраивании весов синапсов. Некоторые алгоритмы предусматривают изменение и структуры сети, т. е., количества нейронов и их взаимосвязи, такие преобразования называют - самоорганизацией. Очевидно, что подстройка синапсов может проводиться только на основании информации, доступной нейрону, то есть его состояния и уже имеющихся весовых коэффициентов. Исходя из этого соображения и по аналогии с известными принципами самоорганизации нервных клеток, построены алгоритмы обучения Хебба. Существуют и другие алгоритмы обучения НС без учителя: обучение методом соревнования, проекции Саммона, анализ главных компонентов.

Размещено на Allbest.ru


Подобные документы

  • Преимущества нейронных сетей. Модели нейронов, представляющих собой единицу обработки информации в нейронной сети. Ее представление с помощью направленных графов. Понятие обратной связи (feedback). Основная задача и значение искусственного интеллекта.

    реферат [1,2 M], добавлен 24.05.2015

  • Особенности нейронных сетей как параллельных вычислительных структур, ассоциируемых с работой человеческого мозга. История искусственных нейронных сетей как универсального инструмента для решения широкого класса задач. Программное обеспечение их работы.

    презентация [582,1 K], добавлен 25.06.2013

  • Принципы организации и функционирования биологических нейронных сетей. Система соединенных и взаимодействующих между собой простых процессоров. Нейронные сети Маккалока и Питтса. Оценка качества кластеризации. Обучение многослойного персептрона.

    курсовая работа [1,1 M], добавлен 06.12.2010

  • Рост активности в области теории и технической реализации искусственных нейронных сетей. Основные архитектуры нейронных сетей, их общие и функциональные свойства и наиболее распространенные алгоритмы обучения. Решение проблемы мертвых нейронов.

    реферат [347,6 K], добавлен 17.12.2011

  • Понятие искусственного интеллекта как свойства автоматических систем брать на себя отдельные функции интеллекта человека. Экспертные системы в области медицины. Различные подходы к построению систем искусственного интеллекта. Создание нейронных сетей.

    презентация [3,0 M], добавлен 28.05.2015

  • Понятие и свойства искусственных нейронных сетей, их функциональное сходство с человеческим мозгом, принцип их работы, области использования. Экспертная система и надежность нейронных сетей. Модель искусственного нейрона с активационной функцией.

    реферат [158,2 K], добавлен 16.03.2011

  • Искусственные нейронные сети как одна из широко известных и используемых моделей машинного обучения. Знакомство с особенностями разработки системы распознавания изображений на основе аппарата искусственных нейронных сетей. Анализ типов машинного обучения.

    дипломная работа [1,8 M], добавлен 08.02.2017

  • История создания и основные направления в моделировании искусственного интеллекта. Проблемы обучения зрительному восприятию и распознаванию. Разработка элементов интеллекта роботов. Исследования в области нейронных сетей. Принцип обратной связи Винера.

    реферат [45,1 K], добавлен 20.11.2009

  • Понятие искусственного нейрона и искусственных нейронных сетей. Сущность процесса обучения нейронной сети и аппроксимации функции. Смысл алгоритма обучения с учителем. Построение и обучение нейронной сети для аппроксимации функции в среде Matlab.

    лабораторная работа [1,1 M], добавлен 05.10.2010

  • Нейрокомпьютеры и их применение в современном обществе. Некоторые характеризующие нейрокомпьютеры свойства. Задачи, решаемые с помощью нейрокомпьютеров. Типы искусственных нейронов. Классификация искусственных нейронных сетей, их достоинства и недостатки.

    курсовая работа [835,9 K], добавлен 17.06.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.