На главную

Непрерывные генетические алгоритмы


Непрерывные генетические алгоритмы

Федеральное агентство по образованию Российской Федерации

Государственное образовательное учреждение высшего профессионального

образования

Государственный университет управления

Институт информационных систем управления

Кафедра информационных систем

Курсовая работа

По дисциплине: «Теория систем и системный анализ»

По теме: «Непрерывные генетические алгоритмы»

Выполнила:

Студентка 3 курса 1 группы

Специальности ПИУ

Антипина Г.С.

Проверил:

Доцент кафедры Информационных систем,

к.ф-м.н. Фёдоров Л.И.

МОСКВА - 2006Содержание

+----------------------------------------------------------------------+

| Введение | 3 |

|-----------------------------------------------------------------+----|

| 1. Теория алгоритмов. Задача коммивояжера. | 6 |

|-----------------------------------------------------------------+----|

| 2. Генетические алгоритмы. Общее описание. Математический | 9 |

| аппарат. | |

|-----------------------------------------------------------------+----|

| 3. Непрерывные генетические алгоритмы. Математический аппарат. | 15 |

|-----------------------------------------------------------------+----|

| 4. Заключение. | 23 |

|-----------------------------------------------------------------+----|

| 5. Список использованной литературы. | 26 |

+----------------------------------------------------------------------+

Введение

В нашей жизни мы регулярно сталкиваемся с необходимостью решения

оптимизационных и прогностических задач. Так, например, доход любой

компании определяется качеством этих решений - точностью прогнозов и

оптимальностью выбранных стратегий.

Примерами таких задач могут являться:

* Прогнозирование курсов валют;

* Прогнозирование спроса;

* Прогнозирование дохода компании;

* Прогнозирование уровня безработицы;

* Оптимизация расписаний;

* Оптимизация плана закупок, плана инвестиций;

* Оптимизация стратегии развития.

Как правило, для реальных задач бизнеса не существует четких алгоритмов

решения. Раньше руководители и эксперты решали такие задачи только на

основе личного опыта. С помощью аналитических технологий строятся системы,

позволяющие существенно повысить эффективность решений.

Рассмотрим пример реальной задачи об оптимальном распределении инвестиций:

Имеется инвестиционный капитал, который нужно распределить среди 10

проектов. Для каждого проекта задана функция зависимости прибыли от объема

вложения. Требуется найти наиболее прибыльный вариант распределения

капитала, при условии, что заданы минимальный и максимальный объем

инвестиций для каждого проекта.

Традиционное решение: Чаще всего решение в данном случае принимает

руководитель, основываясь только на личных впечатлениях о проектах.

Размеры упущенной выгоды при этом не подсчитывают, и неоптимальность

решения может остаться незамеченной.

Если же руководитель поручает аналитикам выбрать наиболее прибыльный

вариант, применяются математические методы оптимизации. Если все данные

функции линейны, то можно применить методы линейного программирования

(симплекс-метод). Если хотя бы одна из функций нелинейна, то можно

использовать метод градиентного спуска или полного перебора.

К сожалению, классические методики оказываются малоэффективными во многих

практических задачах. Это связано с тем, что невозможно достаточно полно

описать реальность с помощью небольшого числа параметров модели, либо

расчет модели требует слишком много времени и вычислительных ресурсов.

В частности, рассмотрим проблемы, возникающие при решении этой задачи:

1. В реальной задаче ни одна из функций не известна точно - известны лишь

приблизительные или ожидаемые значения прибыли. Для того, чтобы

избавиться от неопределенности, мы вынуждены зафиксировать функции,

теряя при этом в точности описания задачи.

2. Детерминированный алгоритм для поиска оптимального решения

(симплекс-метод) применим только в том случае, если все данные функции

линейны. В реальных задачах бизнеса это условие не выполняется. Хотя

данные функции можно аппроксимировать линейными, решение в этом случае

будет далеким от оптимального.

3. Если одна из функций нелинейна, то симплекс-метод неприменим, и

остается два традиционных пути решения этой задачи:

a. Первый путь - использовать метод градиентного спуска для поиска

максимума прибыли. В данном случае область определения функции

прибыли имеет сложную форму, а сама функция - несколько локальных

максимумов, поэтому градиентный метод может привести к

неоптимальному решению.

b. Второй путь - провести полный перебор вариантов инвестирования.

Если каждая из 10 функций задана в 100 точках, то придется

проверить около 1020 вариантов, что потребует не менее нескольких

месяцев работы современного компьютера.

Из-за описанных выше недостатков традиционных методик в последние 10 лет

идет активное развитие аналитических систем нового типа. В их основе -

технологии искусственного интеллекта, имитирующие природные процессы,

такие как деятельность нейронов мозга или процесс естественного отбора.

Наиболее популярными и проверенными из этих технологий являются нейронные

сети и генетические алгоритмы. Первые коммерческие реализации на их основе

появились в 80-х годах и получили широкое распространение в развитых

странах.

1. Теория алгоритмов. Задача коммивояжера.

В настоящее время теория алгоритмов развивается, главным образом, по трем

направлениям.

* Классическая теория алгоритмов изучает проблемы формулировки задач в

терминах формальных языков, вводит понятие задачи разрешения, проводит

классификацию задач по классам сложности P, NP и другим.

* Теория асимптотического анализа алгоритмов рассматривает методы

получения асимптотических оценок ресурсоемкости или времени выполнения

алгоритмов, в частности, для рекурсивных алгоритмов. Асимптотический

анализ позволяет оценить рост потребности алгоритма в ресурсах

(например, времени выполнения) с увеличением объема входных данных.

* Теория практического анализа вычислительных алгоритмов решает задачи

получения явных функции трудоёмкости, интервального анализа функций,

поиска практических критериев качества алгоритмов, разработки методики

выбора рациональных алгоритмов.

В рамках классической теории осуществляется классификация задач по классам

сложности (P-сложные, NP-сложные, экспоненциально сложные и др.).

К классу P относятся задачи, которые могут быть решены за время,

полиномиально зависящее от объёма исходных данных, с помощью

детерминированной вычислительной машины (например, машины Тьюринга).

К классу NP - задачи, которые могут быть решены за полиномиально

выраженное время с помощью недетерминированной вычислительной машины, т.е.

машины, следующее состояние которой не всегда однозначно определяется

предыдущими. Работу такой машины можно представить как разветвляющийся на

каждой неоднозначности процесс: задача считается решённой, если хотя бы

одна ветвь процесса пришла к ответу.

Другое определение класса NP: классом NP (от англ. non-deterministic

polynomial) называют множество алгоритмов, время работы которых сильно

зависит от размера входных данных, но если предоставить алгоритму

некоторые дополнительные сведения (так называемых свидетелей решения), то

он сможет достаточно быстро (за время, не превосходящее многочлена от

размера данных) решить задачу. Проблема в том, что найти таких свидетелей

бывает сложно, поэтому многие алгоритмы из класса NP считаются долгими.

Классическим примером NP-задачи является задача коммивояжёра.

Задача коммивояжёра (коммивояжёр — бродячий торговец) заключается в

отыскании самого выгодного маршрута, проходящего через указанные города

хотя бы по одному разу. В условиях задачи указываются критерий выгодности

маршрута (кратчайший, самый дешёвый, совокупный критерий и т. п.) и

соответствующие матрицы расстояний, стоимости и т. п. Как правило,

указывается, что маршрут должен проходить через каждый город только один

раз, в таком случае выбор осуществляется среди гамильтоновых циклов.

Существует масса разновидностей обобщённой постановки задачи, в частности

геометрическая задача коммивояжёра (когда матрица расстояний отражает

расстояния между точками на плоскости), треугольная задача коммивояжёра

(когда на матрице стоимостей выполняется неравенство треугольника),

симметричная и асимметричная задачи коммивояжёра.

Простейшие методы решения задачи коммивояжёра: полный лексический перебор,

жадные алгоритмы (метод ближайшего соседа, метод включения ближайшего

города, метод самого дешёвого включения), метод минимального остовного

дерева. На практике применяются различные модификации более эффективных

методов: метод ветвей и границ и метод генетических алгоритмов.

Задача коммивояжёра есть NP-полная задача. Часто на ней проводят обкатку

новых подходов к эвристическому сокращению полного перебора.

В основе метода ветвей и границ лежит простое наблюдение, что если нижняя

граница для подобласти A дерева поиска больше, чем верхняя граница

какой-либо ранее просмотренной подобласти B, то A может быть исключена из

дальнейшего рассмотрения. Это обычно выполняется с помощью глобальной

переменной m, в которой запоминается минимальная верхняя граница,

полученная для всех просмотренных до настоящего времени вариантах; любая

вершина дерева поиска, нижняя граница которой больше m, может быть

исключена из дальнейшего рассмотрения.

В следующем разделе мы перейдём к рассмотрению генетических алгоритмов.

2. Генетические алгоритмы. Общее описание. Математический аппарат.

Генетические алгоритмы предназначены для решения задач оптимизации.

Примером подобной задачи может служить обучение нейросети, то есть подбора

таких значений весов, при которых достигается минимальная ошибка. При этом

в основе генетического алгоритма лежит метод случайного поиска. Основным

недостатком случайного поиска является то, что нам неизвестно, сколько

понадобится времени для решения задачи. Для того чтобы избежать таких

расходов времени при решении задачи, применяются методы, проявившиеся в

биологии. При этом используются методы открытые при изучении эволюции и

происхождения видов. Как известно, в процессе эволюции выживают наиболее

приспособленные особи. Это приводит к тому, что приспособленность

популяции возрастает, позволяя ей лучше выживать в изменяющихся условиях.

Впервые подобный алгоритм был предложен в 1975 году Джоном Холландом (John

Holland) в Мичиганском университете. Он получил название «репродуктивный

план Холланда» и лег в основу практически всех вариантов генетических

алгоритмов. Однако, перед тем как мы его рассмотрим подробнее, необходимо

остановится на том, каким образом объекты реального мира могут быть

закодированы для использования в генетических алгоритмах.

Представление объектов.

Из биологии мы знаем, что любой организм может быть представлен своим

фенотипом, который фактически определяет, чем является объект в реальном

мире, и генотипом, который содержит всю информацию об объекте на уровне

хромосомного набора. При этом каждый ген, то есть элемент информации

генотипа, имеет свое отражение в фенотипе. Таким образом, для решения

задач нам необходимо представить каждый признак объекта в форме,

подходящей для использования в генетическом алгоритме. Все дальнейшее

функционирование механизмов генетического алгоритма производится на уровне

генотипа, позволяя обойтись без информации о внутренней структуре объекта,

что и обуславливает его широкое применение в самых разных задачах.

В наиболее часто встречающейся разновидности генетического алгоритма для

представления генотипа объекта применяются битовые строки. При этом

каждому атрибуту объекта в фенотипе соответствует один ген в генотипе

объекта. Ген представляет собой битовую строку, чаще всего фиксированной

длины, которая представляет собой значение этого признака.

Кодирование признаков, представленных целыми числами

Для кодирования таких признаков можно использовать самый простой вариант -

битовое значение этого признака. Тогда нам будет весьма просто

использовать ген определенной длины, достаточной для представления всех

возможных значений такого признака. Но, к сожалению, такое кодирование не

лишено недостатков. Основной недостаток заключается в том, что соседние

числа отличаются в значениях нескольких битов, так например числа 7 и 8 в

битовом представлении различаются в 4-х позициях, что затрудняет

функционирование генетического алгоритма и увеличивает время, необходимое

для его сходимости. Для того, чтобы избежать эту проблему лучше

использовать кодирование, при котором соседние числа отличаются меньшим

количеством позиций, в идеале значением одного бита. Таким кодом является

код Грея, который целесообразно использовать в реализации генетического

алгоритма. Значения кодов Грея рассмотрены в таблице ниже:

+---------------------------------------------------------------------------------------+

| Двоичное кодирование | Кодирование по коду Грея |

|-------------------------------------------+-------------------------------------------|

| Десятичный | Двоичное | Шестнадцатеричное | Десятичный | Двоичное | Шестнадцатеричное |

| код | значение | значение | код | значение | значение |

|------------+----------+-------------------+------------+----------+-------------------|

| 0 | 0000 | 0h | 0 | 0000 | 0h |

|------------+----------+-------------------+------------+----------+-------------------|

| 1 | 0001 | 1h | 1 | 0001 | 1h |

|------------+----------+-------------------+------------+----------+-------------------|

| 2 | 0010 | 2h | 3 | 0011 | 3h |

|------------+----------+-------------------+------------+----------+-------------------|

| 3 | 0011 | 3h | 2 | 0010 | 2h |

|------------+----------+-------------------+------------+----------+-------------------|

| 4 | 0100 | 4h | 6 | 0110 | 6h |

|------------+----------+-------------------+------------+----------+-------------------|

| 5 | 0101 | 5h | 7 | 0111 | 7h |

|------------+----------+-------------------+------------+----------+-------------------|

| 6 | 0110 | 6h | 5 | 0101 | 5h |

|------------+----------+-------------------+------------+----------+-------------------|

| 7 | 0111 | 7h | 4 | 0100 | 4h |

|------------+----------+-------------------+------------+----------+-------------------|

| 8 | 1000 | 8h | 12 | 1100 | Ch |

|------------+----------+-------------------+------------+----------+-------------------|

| 9 | 1001 | 9h | 13 | 1101 | Dh |

|------------+----------+-------------------+------------+----------+-------------------|

| 10 | 1010 | Ah | 15 | 1111 | Fh |

|------------+----------+-------------------+------------+----------+-------------------|

| 11 | 1011 | Bh | 14 | 1110 | Eh |

|------------+----------+-------------------+------------+----------+-------------------|

| 12 | 1100 | Ch | 10 | 1010 | Ah |

|------------+----------+-------------------+------------+----------+-------------------|

| 13 | 1101 | Dh | 11 | 1011 | Bh |

|------------+----------+-------------------+------------+----------+-------------------|

| 14 | 1110 | Eh | 9 | 1001 | 9h |

|------------+----------+-------------------+------------+----------+-------------------|

| 15 | 1111 | Fh | 8 | 1000 | 8h |

+---------------------------------------------------------------------------------------+

Таблица 1. Соответствие десятичных кодов и кодов Грея.

Таким образом, при кодировании целочисленного признака мы разбиваем его на

тетрады и каждую тетраду преобразуем по коду Грея.

В практических реализациях генетических алгоритмов обычно не возникает

необходимости преобразовывать значения признака в значение гена. На

практике имеет место обратная задача, когда по значению гена необходимо

определить значение соответствующего ему признака.

Таким образом, задача декодирования значения генов, которым соответствуют

целочисленные признаки, тривиальна.

Кодирование признаков, которым соответствуют числа с плавающей точкой

Самый простой способ кодирования, который лежит на поверхности -

использовать битовое представление. Хотя такой вариант имеет те же

недостатки, что и для целых чисел. Поэтому на практике обычно применяют

следующую последовательность действий:

1. Разбивают весь интервал допустимых значений признака на участки с

требуемой точностью.

2. Принимают значение гена как целочисленное число, определяющее номер

интервала (используя код Грея).

3. В качестве значения параметра принимают число, являющиеся серединой

этого интервала.

Рассмотрим вышеописанную последовательность действий на примере:

Допустим, что значения признака лежат в интервале [0,1]. При кодировании

использовалось разбиение участка на 256 интервалов. Для кодирования их

номера нам потребуется таким образом 8 бит. Допустим значение гена:

00100101bG (заглавная буква G показывает, что используется кодирование по

коду Грея). Для начала, используя код Грея, найдем соответствующий ему

номер интервала: 0x01 graphic

. Теперь посмотрим, какой интервал ему соответствует… После несложных

подсчетов получаем интервал 0x01 graphic

. Значит значение нашего параметра будет 0x01 graphic

.

Основные генетические операторы

Как известно в теории эволюции важную роль играет то, каким образом

признаки родителей передаются потомкам. В генетических алгоритмах за

передачу признаков родителей потомкам отвечает оператор, который

называется скрещивание (его также называют кроссовер или кроссинговер).

Этот оператор определяет передачу признаков родителей потомкам. Действует

он следующим образом:

1. из популяции выбираются две особи, которые будут родителями;

2. определяется (обычно случайным образом) точка разрыва;

3. потомок определяется как конкатенация части первого и второго

родителя.

Рассмотрим функционирование этого оператора:

+---------------------------+

| Хромосома_1: | 0000000000 |

|--------------+------------|

| Хромосома_2: | 1111111111 |

+---------------------------+

Допустим разрыв происходит после 3-го бита хромосомы, тогда

+------------------------------------------------------------------------------+

| Хромосома_1: | 0000000000 | >> | 000 | 1111111 |  Результирующая_хромосома_1 |

|--------------+------------+----+-----+---------+-----------------------------|

| Хромосома_2: | 1111111111 | >> | 111 | 0000000 |  Результирующая_хромосома_2 |

+------------------------------------------------------------------------------+

Затем с вероятностью 0,5 определяется одна из результирующих хромосом в

качестве потомка.

Следующий генетический оператор предназначен для того, чтобы поддерживать

разнообразие особей с популяции. Он называется оператором мутации. При

использовании данного оператора каждый бит в хромосоме с определенной

вероятностью инвертируется.

Кроме того, используется еще и так называемый оператор инверсии, который

заключается в том, что хромосома делится на две части, и затем они

меняются местами. Схематически это можно представить следующим образом:

+------------------------------------+

| 000 | 1111111 | >> | 1111111 | 000 |

+------------------------------------+

В принципе для функционирования генетического алгоритма достаточно этих

двух генетических операторов, но на практике применяют еще и некоторые

дополнительные операторы или модификации этих двух операторов. Например,

кроссовер может быть не одноточечный (как было описано выше), а

многоточечный, когда формируется несколько точек разрыва (чаще всего две).

Кроме того, в некоторых реализациях алгоритма оператор мутации

представляет собой инверсию только одного случайно выбранного бита

хромосомы.

Схема функционирования генетического алгоритма

Теперь, зная как интерпретировать значения генов, перейдем к описанию

функционирования генетического алгоритма. Рассмотрим схему

функционирования генетического алгоритма в его классическом варианте.

1. Инициировать начальный момент времени 0x01 graphic

. Случайным образом сформировать начальную популяцию, состоящую из k

особей.

0x01 graphic

2. Вычислить приспособленность каждой особи 0x01 graphic

и популяции в целом 0x01 graphic

(также иногда называемую термином фиттнес). Значение этой функции

определяет насколько хорошо подходит особь, описанная данной

хромосомой, для решения задачи.

3. Выбрать особь 0x01 graphic

из популяции. 0x01 graphic

4. С определенной вероятностью (вероятностью кроссовера 0x01 graphic

) выбрать вторую особь из популяции 0x01 graphic

и произвести оператор кроссовера 0x01 graphic

.

5. С определенной вероятностью (вероятностью мутации 0x01 graphic

) выполнить оператор мутации. 0x01 graphic

.

6. С определенной вероятностью (вероятностью инверсии 0x01 graphic

) выполнить оператор инверсии 0x01 graphic

.

7. Поместить полученную хромосому в новую популяцию 0x01 graphic

.

8. Выполнить операции, начиная с пункта 3, k раз.

9. Увеличить номер текущей эпохи 0x01 graphic

.

10. Если выполнилось условие останова, то завершить работу, иначе переход

на шаг 2.

Теперь рассмотрим подробнее отдельные этапы алгоритма.

Наибольшую роль в успешном функционировании алгоритма играет этап отбора

родительских хромосом на шагах 3 и 4. При этом возможны различные

варианты. Наиболее часто используется метод отбора, называемый рулеткой.

При использовании такого метода вероятность выбора хромосомы определяется

ее приспособленностью, то есть 0x01 graphic

. Использование этого метода приводит к тому, что вероятность передачи

признаков более приспособленными особями потомкам возрастает. Другой часто

используемый метод - турнирный отбор. Он заключается в том, что случайно

выбирается несколько особей из популяции (обычно 2) и победителем

выбирается особь с наибольшей приспособленностью. Кроме того, в некоторых

реализациях алгоритма применяется так называемая стратегия элитизма,

которая заключается в том, что особи с наибольшей приспособленностью

гарантировано переходят в новую популяцию. Использование элитизма обычно

позволяет ускорить сходимость генетического алгоритма. Недостаток

использования стратегии элитизма в том, что повышается вероятность

попадания алгоритма в локальный минимум.

Другой важный момент - определение критериев останова. Обычно в качестве

них применяются или ограничение на максимальное число эпох

функционирования алгоритма, или определение его сходимости, обычно путем

сравнивания приспособленности популяции на нескольких эпохах и остановки

при стабилизации этого параметра.

3. Непрерывные генетические алгоритмы.

Фиксированная длина хромосомы и кодирование строк двоичным алфавитом

преобладали в теории генетических алгоритмов с момента начала ее развития,

когда были получены теоретические результаты о целесообразности

использования именно двоичного алфавита. К тому же, реализация такого

генетического алгоритма на ЭВМ была сравнительно легкой. Все же, небольшая

группа исследователей шла по пути применения в генетических алгоритмах

отличных от двоичных алфавитов для решения частных прикладных задач. Одной

из таких задач является нахождение решений, представленных в форме

вещественных чисел, что называется не иначе как «поисковая оптимизация в

непрерывных пространствах». Возникла следующая идея: решение в хромосоме

представлять напрямую в виде набора вещественных чисел. Естественно, что

потребовались специальные реализации биологических операторов. Такой тип

генетического алгоритма получил название непрерывного генетического

алгоритма (RGA, или real-coded genetic algorithm), или генетического

алгоритма с вещественным кодированием.

Первоначально непрерывные гены стали использоваться в специфических

приложениях (например, хемометрика, оптимальный подбор параметров

операторов стандартных генетических алгоритмов и др.). Позднее они

начинают применяться для решения других задач оптимизации в непрерывных

пространствах (работы исследователей Wright, Davis, Michalewicz, Eshelman,

Herrera в 1991-1995 гг). Поскольку до 1991 теоретических обоснований

работы непрерывных генетических алгоритмов не существовало, использование

этого нового подвида было спорным; ученые, знакомые с фундаментальной

теорией эволюционных вычислений, в которой было доказано превосходство

двоичного алфавита перед другими, критически воспринимали успехи

алгоритмов с вещественным кодированием. После того, как спустя некоторое

время теоретическое обоснование появилось, непрерывные генетические

алгоритмы полностью вытеснили двоичные хромосомы при поиске в непрерывных

пространствах.

Преимущества и недостатки двоичного кодирования

Прежде чем излагать особенности математического аппарата непрерывных

генетических алгоритмов, остановимся на анализе достоинств и недостатков

двоичной схем кодирования.

Как известно, высокая эффективность отыскания глобального минимума или

максимума генетическим алгоритмом с двоичным кодированием теоретически

обоснована в фундаментальной теореме генетических алгоритмов («теореме о

шаблоне»), доказанной Холландом. Ее суть в том, что двоичный алфавит

позволяет обрабатывать максимальное количество информации по сравнению с

другими схемами кодирования.

Однако двоичное представление хромосом влечет за собой определенные

трудности при поиске в непрерывных пространствах большой размерности, и

когда требуется высокая точность найденного решения. В генетических

алгоритмах с двоичным кодированием для преобразования генотипа в фенотип

используется специальный прием, основанный на том, что весь интервал

допустимых значений признака объекта 0x01 graphic

разбивается на участки с требуемой точностью. Заданная точность p

определяется выражением

0x01 graphic

где N - количество разрядов для кодирования битовой строки.

Эта формула показывает, что p сильно зависит от N, т.е. точность

представления определяется количеством разрядов, используемых для

кодирования одной хромосомы. Поэтому при увеличении N пространство поиска

расширяется и становится огромным.

Известный книжный пример: пусть для 100 переменных, изменяющихся в

интервале 0x01 graphic

, требуется найти экстремум с точностью до шестого знака после запятой. В

этом случае при использовании генетических алгоритмов с двоичным

кодированием длина строки составит 3000 элементов, а пространство поиска -

около 0x01 graphic

хромосом.

Эффективность генетических алгоритмов с двоичным кодированием в этом

случае будет невысокой. На первых итерациях алгоритм потратит много усилий

на оценку младших разрядов числа, закодированных во фрагменте двоичной

хромосомы. Но оптимальное значение на первых итерациях будет зависеть от

старших разрядов числа. Следовательно, пока в процессе эволюции алгоритм

не выйдет на значение старшего разряда в окрестности оптимума, операции с

младшими разрядами окажутся бесполезными. С другой стороны, когда это

произойдет, станут не нужны операции со старшими разрядами - необходимо

улучшать точность решения поиском в младших разрядах. Такое «идеальное»

поведение не обеспечивает семейство генетических алгоритмов с двоичным

кодированием, т.к. эти алгоритмы оперируют битовой строкой целиком, и на

первых же эпохах младшие разряды чисел "застывают", принимая случайное

значение. В классических генетических алгоритмах разработаны специальные

приемы по выходу из этой ситуации. Например, последовательный запуск

ансамбля генетических алгоритмов с постепенным сужением пространства

поиска.

Есть и другая проблема: при увеличении длины битовой строки необходимо

увеличивать и численность популяции.

Математический аппарат непрерывных генетических алгоритмов

Как уже отмечалось, при работе с оптимизационными задачами в непрерывных

пространствах вполне естественно представлять гены напрямую вещественными

числами. В этом случае хромосома есть вектор вещественных чисел. Их

точность будет определяться исключительно разрядной сеткой той ЭВМ, на

которой реализуется real-coded алгоритм. Длина хромосомы будет совпадать с

длиной вектора-решения оптимизационной задачи, иначе говоря, каждый ген

будет отвечать за одну переменную. Генотип объекта становится идентичным

его фенотипу.

Вышесказанное определяет список основных преимуществ алгоритмов с

непрерывными генами:

1. Использование непрерывных генов делает возможным поиск в больших

пространствах (даже в неизвестных), что трудно делать в случае

двоичных генов, когда увеличение пространства поиска сокращает

точность решения при неизменной длине хромосомы.

2. Одной из важных черт непрерывных генетических алгоритмов является их

способность к локальной настройке решений.

3. Использование непрерывных генетических алгоритмов для представления

решений удобно, поскольку близко к постановке большинства прикладных

задач. Кроме того, отсутствие операций кодирования/декодирования,

которые необходимы в генетических алгоритмах с двоичным кодированием,

повышает скорость работы алгоритма.

Как известно, появление новых особей в популяции канонического

генетического алгоритма обеспечивают несколько биологических операторов:

отбор, скрещивание и мутация. В качестве операторов отбора особей в

родительскую пару здесь подходят любые известные из двоичных генетических

алгоритмов: рулетка, турнирный, случайный. Однако операторы скрещивания и

мутации не годятся: в классических реализациях они работают с битовыми

строками. Нужны собственные реализации, учитывающие специфику real-coded

алгоритмов.

Оператор скрещивания непрерывного генетического алгоритма, или кроссовер,

порождает одного или нескольких потомков от двух хромосом. Собственно

говоря, требуется из двух векторов вещественных чисел получить новые

векторы по каким-либо законам. Большинство real-coded алгоритмов

генерируют новые векторы в окрестности родительских пар. Для начала

рассмотрим простые и популярные кроссоверы.

Пусть 0x01 graphic

и 0x01 graphic

- две хромосомы, выбранные оператором селекции для скрещивания. После

формулы для некоторых кроссоверов приводится рисунок - геометрическая

интерпретация его работы. Предполагается, что 0x01 graphic

и 0x01 graphic

.

* Плоский кроссовер (flat crossover): создается потомок 0x01 graphic

- случайное число из интервала 0x01 graphic

.

* Простейший кроссовер (simple crossover): случайным образом выбирается

число k из интервала 0x01 graphic

и генерируются два потомка 0x01 graphic

и 0x01 graphic

.

* Арифметический кроссовер (arithmetical crossover): создаются два

потомка 0x01 graphic

, 0x01 graphic

, где 0x01 graphic

, 0x01 graphic

, 0x01 graphic

, w либо константа (равномерный арифметический кроссовер) из интервала

0x01 graphic

, либо изменяется с увеличением эпох (неравномерный арифметический

кроссовер).

0x01 graphic

* Геометрический кроссовер (geometrical crossover): создаются два

потомка 0x01 graphic

, 0x01 graphic

, где 0x01 graphic

, 0x01 graphic

, w - случайное число из интервала 0x01 graphic

.

0x01 graphic

* Смешанный кроссовер (blend, BLX-alpha crossover): генерируется один

потомок 0x01 graphic

, где 0x01 graphic

- случайное число из интервала 0x01 graphic

, 0x01 graphic

, 0x01 graphic

, 0x01 graphic

. BLX-0.0 кроссовер превращается в плоский.

0x01 graphic

* Линейный кроссовер (linear crossover): создаются три потомка 0x01

graphic

, 0x01 graphic

, где 0x01 graphic

, 0x01 graphic

, 0x01 graphic

. На этапе селекции в этом кроссовере отбираются два наиболее сильных

потомка.

0x01 graphic

* Дискретный кроссовер (discrete crossover): каждый ген 0x01 graphic

выбирается случайно по равномерному закону из конечного множества 0x01

graphic

.

0x01 graphic

* Расширенный линейчатый кроссовер (extended line crossover): ген 0x01

graphic

, w - случайное число из интервала 0x01 graphic

.

0x01 graphic

* Эвристический кроссовер (Wright's heuristic crossover). Пусть 0x01

graphic

- один из двух родителей с лучшей приспособленностью. Тогда 0x01

graphic

, w - случайное число из интервала 0x01 graphic

.

0x01 graphic

Нечеткий кроссовер (fuzzy recombination, FR-d crossover): создаются два

потомка 0x01 graphic

, 0x01 graphic

. Вероятность того, что в i-том гене появится число 0x01 graphic

, задается распределением 0x01 graphic

, где 0x01 graphic

- распределения вероятностей треугольной формы (треугольные нечеткие

функции принадлежности) со следующими свойствами 0x01 graphic

( 0x01 graphic

и 0x01 graphic

):

+----------------------------------------------+

| Распределение |Минимум | Центр |Максимум|

| вероятностей | | | |

|-------------------+--------+--------+--------|

|0x01 graphic |0x01 |0x01 |0x01 |

| |graphic |graphic |graphic |

|-------------------+--------+--------+--------|

|0x01 graphic |0x01 |0x01 |0x01 |

| |graphic |graphic |graphic |

+----------------------------------------------+

Параметр d определяет степень перекрытия треугольных функций

принадлежности, по умолчанию 0x01 graphic

.

0x01 graphic

В качестве оператора мутации наибольшее распространение получили:

случайная и неравномерная мутация (random and non-uniform mutation).

При случайной мутации ген, подлежащий изменению, принимает случайное

значение из интервала своего изменения. В неравномерной мутации значение

гена после оператора мутации рассчитывается по формуле:

0x01 graphic

Сложно сказать, что более эффективно в каждом конкретном случае, но

многочисленные исследования доказывают, что непрерывные генетические

алгоритмы не менее эффективно, а часто гораздо эффективнее справляются с

задачами оптимизации в многомерных пространствах, при этом более просты в

реализации из-за отсутствия процедур кодирования и декодирования хромосом.

Рассмотренные кроссоверы исторически были предложены первыми, однако во

многих задачах их эффективность оказывается невысокой. Исключение

составляет BLX-кроссовер с параметром 0x01 graphic

- он превосходит по эффективности большинство простых кроссоверов. Позднее

были разработаны улучшенные операторы скрещивания, аналитическая формула

которых и эффективность обоснованы теоретически. Рассмотрим подробнее один

из таких кроссоверов - SBX.

SBX (англ.: Simulated Binary Crossover) - кроссовер, имитирующий двоичный.

Был разработан в 1995 году исследовательской группой под руководством K.

Deb'а. Как следует из его названия, этот кроссовер моделирует принципы

работы двоичного оператора скрещивания.

SBX кроссовер был получен следующим способом. У двоичного кроссовера было

обнаружено важное свойство - среднее значение функции приспособленности

оставалось неизменным у родителей и их потомков, полученных путем

скрещивания. Затем автором было введено понятие силы поиска кроссовера

(search power). Это количественная величина, характеризующая распределение

вероятностей появления любого потомка от двух произвольных родителей.

Первоначально была рассчитана сила поиска для одноточечного двоичного

кроссовера, а затем был разработан вещественный SBX кроссовер с такой же

силой поиска. В нем сила поиска характеризуется распределением

вероятностей случайной величины 0x01 graphic

:

0x01 graphic

Для генерации потомков используется следующий алгоритм, использующий

выражение для 0x01 graphic

. Создаются два потомка 0x01 graphic

, 0x01 graphic

, где 0x01 graphic

, 0x01 graphic

- число, полученное по формуле:

0x01 graphic

В формуле 0x01 graphic

- случайное число, распределенное по равномерному закону, 0x01 graphic

- параметр кроссовера.

На рисунке приведена геометрическая интерпретация работы SBX кроссовера

при скрещивании двух хромосом, соответствующих вещественным числам 2 и 5.

Видно, как параметр n влияет на конечный результат: увеличение n влечет за

собой увеличение вероятности появления потомка в окрестности родителя и

наоборот.

0x01 graphic

Эксперименты автора SBX кроссовера показали, что он во многих случаях

эффективнее BLX, хотя, очевидно, что не существует ни одного кроссовера,

эффективного во всех случаях. Исследования показывают, что использование

нескольких различных операторов кроссовера позволяет уменьшить вероятность

преждевременной сходимости, т.е. улучшить эффективность алгоритма

оптимизации в целом. Для этого могут использоваться специальные стратегии,

изменяющие вероятность применения отдельного эволюционного оператора в

зависимости от его «успешности», или использование гибридных кроссоверов,

которых в настоящее время насчитывается несколько десятков. В любом

случае, если перед Вами стоит задача оптимизации в непрерывных

пространствах, и Вы планируете применить эволюционные техники, то следует

сделать выбор в пользу непрерывного генетического алгоритма.

4. Заключение

За последние годы объёмы экономической информации возросли в несколько

раз, и это является дополнительным стимулом для многих учёных, работающих

в области анализа данных, теории информации и теории алгоритмов,

заниматься генетическими алгоритмами.

Очевидно, этим объясняется появление статей по данной теме и на русском

языке (на других языках уже опубликовано 9000 работ). Правда, стоит

отметить, что пока многие публикации частично (в большей или меньшей

степени) повторяют друг друга и может создаться ложное представление о

том, что теория генетических алгоритмов и, в частности, такая её часть,

как непрерывные генетические алгоритмы, - тема узкая и исчерпываемая

двадцатью страницами данной работы. На самом же деле есть не только

теория, но и практика генетических алгоритмов. В настоящее время известно

о существовании более пятисот программных продуктов, в том или ином виде

использующих генетические алгоритмы для решения оптимизационных и

прогностических задача.

Также стоит отметить, что талантливые программисты создали популярную

игру, базирующуюся на наработках теории генетических алгоритмов, которая

называется «Амёбы: Борьба видов» (http://amebas.ru). Суть игры заключается

в том, что каждый игрок «выращивает» на своём компьютере колонию амёб.

Каждая амёба имеет свой генотип и ведёт борьбу за выживание. В каждом

поколении в ходе сражений часть из них остаётся в проигрыше и не получает

возможности размножаться. По ходу развития (с каждым следующим поколением)

амёбы накапливают в себе всё больше и больше генетической информации. Раз

в некоторое время проводятся Интернет-турниры, на которые каждый игрок

выставляет свою лучшую амёбу. В игре учитываются разные возможности

скрещивания, возможность направить отбор в том или ином направлении,

регулировка количества и силы мутаций и прочие настройки.

В заключение можно сказать, что мои прогнозы развития генетических

алгоритмов являются очень оптимистичными по двум причинам:

1. С повышением вычислительной мощности ЭВМ (не исключено, что после

перехода на квантовые или молекулярные компьютеры) станет возможным

моделировать при помощи генетических алгоритмов всё более и более

сложные ситуации.

2. Не исключено, что учёные, работающие в области классической теории

алгоритмов, найдут решение одной из NP-полных задач, и тогда окажутся

решаемыми все алгоритмы, относящиеся к сложности NP.

5. Список использованной литературы.

1. «АНАЛИТИЧЕСКИЕ ТЕХНОЛОГИИ для прогнозирования и анализа данных», 2005.

«НейроПроект»

2. http://www.gotai.ru

3. http://basegroup.ru

4. http://ru.wikipedia.org

Гамильтоновым циклом в графе называют простой цикл, содержащий все вершины

графа ровно по одному разу. По материалам Википедии - свободной

энциклопедии.

NP-полные задачи — это класс задач, лежащих в классе NP, то есть для

которых пока не найдено быстрых алгоритмов решения, но проверка того,

является ли данное решение правильным, проходит быстро. По материалам

Википедии - свободной энциклопедии.

3

© 2010