Однако использование такого агента может быть довольно эффективно. Во многих задачах текущее состояние окружения несет в себе всю необходимую информацию о своей истории. Про такое окружение говорят, что оно является Марковским, или несет в себе свойство Маркова.
В случае, если агент использует для принятия решения оценки будущего, необходимо выстроить прогноз об изменении окружения агента после совершения им какого-либо действия. Здесь возможны два варинта:
в детерминистическом мире модель перехода отображает единственным образом пару состояние-действие в новое состояние;
в стохастическом мире модель перехода отображает пару состояние-действие в распределение вероятности состояний.
В качестве примера алгоритма, использующего мультиагентные системы, рассмотрим алгоритм, предложенный в [3]. Данный алгоритм основан на том, все БЛА связаны в единую сеть, внутри которой принимаются решения о распределении объектов наблюдения между ними. Как и во многих других схожих алгоритмах, принятие решения является коллективным и базируется на том, что каждый БЛА выдвигает предложение о том, к какому объекту он считает необходимым двигаться. Остальные БЛА в процессе переговоров могут принять или отвергнуть это решение.
Сам процесс принятия решения состоит в следующем. Каждый агент в течение одного цикла переговоров совершает 4 действия:
отправляет или получает предложение,
обдумывает полученное предложение,
отправляет ответ (согласие или несогласие),
принимает решение.
Каждый агент вычисляет выигрыш, полученный в том случае, если он последует за ней по следующей формуле
bi(Tj) = VTjwr – St,
где VTjwr – «цена» объекта,
St – относительное время преследования объекта
Таким образом, для каждой цели БЛА формирует списки выигрышей, полученных от следования за каждым объектом, и рассылает другим БЛА номер того объекта, за который он получит максимальную выгоду.
На втором и третьем шагах, когда данные от всех БЛА собраны, каждый из них анализирует полученную информацию и принимает решение о согласии или несогласии и этим на основании следующих правил:
если объект выбран только одним БЛА, то данное предложение одобряется;
если объект выбран несколькими БЛА, то согласие посылается только тому БЛА, для которого максимален выигрыш;
один БЛА может отправить только одно согласие для каждой цели;
если все соседи данного БЛА (то есть те БЛА, от которых он находится в непосредственной близости) согласны с его целью, он получает право на принятие решения о целесообразности следования до его текущей цели;
Четвертый шаг заключается в анализе полученных ответов и принятии решения. Если БЛА получил согласия от всех соседей, он выполняет запланированное действие. Если он получил отказ хотя бы от одного из соседей, он участвует в следующем цикле переговоров. Если же БЛА получил отказ от всех своих соседей, он выполняет задачу поиска новых объектов.
Выделим сильные и слабы стороны данного подхода
Сильные стороны:
постоянное взаимодействие между агентами;
коллективное принятие решения всеми агентами.
Слабые стороны:
в случае необходимости использования большой истории действий возрастает ресурсоемкость данного подхода;
агент зачастую действует по аналогии с жадным алгоритмом, а значит его решение в общем случае нельзя считать оптимальным;
необходимость использования стохастических прогнозов в случае использования информации об оценках будущей реакции окружения да действия агентов.
Задача многих коммивояжеров
В своей исторической формулировке задача коммивояжера заключается в том, чтобы найти оптимальный путь торговца между некоторым количеством пунктов маршрута из начальной точки в конечную. При этом в исходной задаче коммивояжера рассматривается только один торговец. В задаче многих коммивояжеров рассматривается поиск пути для нескольких торговцев, причем каждый пункт маршрута должен быть посещен один раз одним из торговцев.
Очевидно, что вместо торговцев в данной задаче также могут быть представлены БЛА, которым нужно облететь некоторое количество наземных объектов.
Похожие статьи:
ДТП по факторам
Человек не научился еще в достаточной степени, абсолютно правильно управлять автомобилем и предупреждать ДТП. Статистика показывает, что главные виновники - водитель и другие участники дорожного движения. Большинство ДТП совершается из-за самонадеянности или легкомыслия, невнимательности к окружающ ...
Корректура карт и пособий
Для контроля за своевременным изменением навигационной обстановки необходимо произвести наиболее полную корректуру, выбранных в п. 1.1, карт и пособий на переход. При корректуре карт и пособий используем последние выпуски извещений мореплавателям ГУНиО и ГС Флота. Таблица 2 Перечень выполненной кор ...
Расчет коммутации
Целью данного расчета является проверка напряженности коммутации, которая характеризуется реактивной ЭДС коммутируемой секции /1, стр.172/. Изменение тока в проводнике сопровождается ЭДС самоиндукции (12.1) где - число витков секции (для всех тяговых двигателей); - поток, сцепленный с секцией. Поск ...