On the three-stage version of stable dynamic model
Alexander Gasnikov, Yuriy Dorn, Yurii Nesterov, Sergey Shpirko
УДК 519.8
Трехстадийная модель равновесного распределения транспортных потоков
А.В. Гасников (МФТИ), Ю.В. Дорн (МФТИ), Ю.Е. Нестеров (ВШЭ), С.В. Шпирко (МФТИ)
В работе предпринята попытка объединить в одну общую модель, сводящуюся к решению задачи негладкой выпуклой оптимизации: модель расчета матрицы корреспонденций (энтропийная модель), модель равновес-ного расщепления потоков (по способу передвижений) и модель равновесного распределения потоков по путям (модель стабильной динамики, также называемую в литературе моделью Нестерова–деПальма, 1998). Данная работа представляет собой переработанную и осовремененную (в контексте недавно получен-ных численных результатов) версию работы:
Гасников А.В., Дорн Ю.В., Нестеров Ю.Е, Шпирко С.В.
О трехстадийной версии модели стационарной динамики транспортных потоков // Математическое моделирование. 2014. Т. 26:6. C. 34–70.
Ключевые слова: равновесное распределение транспортных потоков, расщепление потоков, матрица коррес-понденций, модель стабильной динамики, теорема о минимаксе, принцип Вардропа, равновесие Нэша. Библиография: 65 названий, 3 рисунка. Работа А.В. Гасникова выполнена при поддержке гранта РФФИ 15-31-70001 мол_а_мос. Работа Ю.В. Дорна выполнена при поддержке гранта РФФИ 15-31-20571-мол_а_вед. Работа Ю.Е. Нестерова и С.В. Шпирко выполнена при поддержке гранта РФФИ 14-01-00722-а.
Оглавление
1. Введение .............................................................................................................................................. 2 2. Структура работы и предварительные сведения ............................................................................. 4 3. Энтропийная модель расчета матрицы корреспонденций ............................................................. 6 4. Модель равновесного распределения потоков Бэкмана .............................................................. 13 5. Краткий обзор подходов к построению многостадийных моделей транспортных потоков, с моделью типа Бэкмана в качестве модели равновесного распределения потоков .......................... 22 6. Модель стабильной динамики ........................................................................................................ 29 7. Связь модели стабильной динамики с моделью Бэкмана ............................................................ 33 8. Учет расщепления потоков по способам передвижений .............................................................. 37 9. Трехстадийная модель стабильной динамики ............................................................................... 39 10. Стохастический вариант трехстадийной модели стабильной динамики................................. 40 11. Калибровка модели стабильной динамики ................................................................................ 41 СПИСОК ЦИТИРОВАННОЙ ЛИТЕРАТУРЫ ................................................................................................. 43 Введение
Одной из основных задач последнего времени, остро стоящих в Москве и ряде других крупных городов России (Санкт-Петербург, Пермь, Владивосток, Иркутск, Калининград и др.) является разработка транспортной модели города, позволяющей решать задачи долгосрочного планирования (развития) транспортной инфраструктуры города [1]. В частности, ожидается, что разработка такой модели поможет ответить на вопросы: какой из проектов дорожного строительства оптимален, где пропуская способность дороги недостаточна, как изменится транспортная ситуация, если построить в этом месте торговый центр (жилой район, стадион), как правильно определять маршруты и расписание движения общественного транспорта, какой эффект даст выделение полос для общественного транспорта и т.п. Уже имеется программное обеспечение, позволяющее частично решать указанные выше задачи. Однако имеется много вопросов к тому, какие модели и алгоритмы используются в большинстве программных продуктах. Например, не очевидным элементом почти всех этих продуктов является использование в качестве одного из блоков модели равновесного распределения транспортных потоков Бэкмана (1955) [2–6]. Эта во многом хорошая модель, тем не менее, имеет довольно много недостатков (см. [7]). Например, калибровка такой модели требует знания функций затрат на ребрах графа транспортной сети (эти функции связывают время в пути по ребру с величиной транспортного потока по этому ребру), причем сама модель оказывается довольно чувствительной к выбору этих функций, которые в модели Бэкмана, как правило, предполагаются выпуклыми, монотонно возрастающими. Достаточно сказать, что в случае наличия платных дорог, для расчета оптимальных плат за проезд требуется вычислять, например, производные этих неизвестных функций [8, 9]. Существование таких функций в модели Бэкмана является одним из основных предположений, и, одновременно, одним из самых слабых мест. Реальные данные показывают (см. рис. 1, по-лученный В.А. Данилкиным по данным ЦОДД в 2012 году), что предположение о классе функций затрат не выполняется. Но даже если предположить, что такая зависимость все же существует, то по-прежнему остается другая проблема: как калибровать модель Бэкмана, то есть откуда брать эти зависимости. Не получится ли переобучения у Это допущение можно оправдать, например, тем, что, как правило, мы рассматриваем равновесные конфигурации с точки зрения пользователей сети в модели Бэкмана, которым соответствует только одна из веток – верхняя (рис. 1). В модели Бэкмана пользователи сети при принятии решений оценивают время в пути в зависимости от величины потока, которая интерпретируется, как число желающих проехать по этому ребру в единицу времени. Нижняя ветка, отвечающая приблизительно линейному росту скорости с ростом потока max
V f , соответствует ситуации, когда есть узкое место, пропускная способность которого по каким-то причинам определяется не типичными характеристиками рассматриваемого ребра, а скажем, проб-кой, пришедшей с впереди идущего ребра (по ходу движения). И в таких ситуациях величина потока f ин-терпретируется не как число желающих, а как число могущих проехать. Такие ситуации просто исключают-ся в модели Бэкмана. создаваемой нами модели? То есть, не получится ли так, что распоряжаясь большим произволом при калибровке по обучающей выборке (историческим данным) мы “переподгоним” модель: исторические данные за счет большого числа подкручиваемых параметров мы, действительно, можем хорошо научиться описывать, но использовать такую модель для планирования будет опасно, поскольку не будет контроля переобучения. Обычным средством борьбы с переобучением в этом месте является параметризация функций затрат, например, в классе BPR функций [1–6]. К сожалению, какого бы то ни было научного обоснования, почему именно такая параметризация используется, нам не известно. По оси абсцисс – поток по двум полосам (авт/мин), а по оси ординат – скорость (км/час)
Рис. 1
Другим, не очевидным элементом этих программных продуктов являются используемые вычислительные алгоритмы: контроль их робастности [10], к неточности (неполноте) данных, ошибкам округления (поскольку возникают задачи огромных размеров, то такие ошибки могут интенсивно накапливаться). Наконец, сама философия, использующаяся в таких продуктах при построении равновесной модели города [1] также вызывает много вопросов, о которых немного подробнее будет написано в п. 5. Несмотря на отмеченные выше проблемы, разработчики программного обеспечения часто находят вполне разумные инженерные компромиссы (нам известно о положительном опыте PTV VISSUM и TRANSNET), не плохо работающие практике. Целью данной работы является предложить математическую трехстадийную транспортную модель города, в которой один из блоков (модель равновесного распределения потоков) предлагается заменить с модели Бэкмана на модель стабильной динамики [7, 11]. К сожалению, целый ряд проблем, свойственных ранее известным многостадийным моделям будет присущ и модели, предлагаемой в данной работе. Однако несколько важных недостатков, по-видимому, удалось устранить. Прежде всего, речь идет о возможности калибровки модели по реальным данным, контроле переобучения и существовании эффективного робастного вычислительного алгоритма с гарантированными (не улучшаемыми) оценками числа затраченных арифметических операций для достижения требуемой точности. Последнее обстоятельство представляется особенно важным в контексте того, как обычно используются такие модели. А именно, с помощью таких моделей просматривается множество различных сценариев. К сожалению, оптимизационные задачи вида: “где и какую дорогу стоит построить при заданных бюджетных ограничениях”, а также многие другие задачи, решаются непосредственным перебором различных вариантов, где для расчета каждого варианта потребуется запускать модель, меняя каждый раз что-то на входе. Кстати сказать, предложенный для расчета модели алгоритм позволяет также учитывать масштаб изменения входных данных. Если эти изменения не большие (точнее говоря, меняется не большое количество входных параметров), то для выполнения перерасчета по модели потребуется значительно меньше времени, чем при первом запуске. Структура работы и предварительные сведения
Опишем вкратце структуру работы. В п. 3 описывается эволюционный способ вывода популярного на практике статического способа расчета матрицы корреспонденций (энтропийной модели). Также приводится основная идея, базирующаяся на теореме Тихонова о разделении времен [12], получения трехстадийной модели из отдельных блоков (расчет матрицы корреспонденций + равновесное расщепление потоков + равновесное распределение потоков). Точнее говоря, использование теоремы Тихонова – лишь часть идеи, которая сводит решение задачи к поиску (единственного) притягивающего положения равновесия системы в медленном времени, отвечающей за формирование корреспонденций, при подстановке в неѐ зависимостей времен в пути от корреспонденций (такие зависимости получаются из системы в быстром времени). Другая еѐ часть, заключается в том, что задачи поиска (единственного) притягивающего положения равновесия системы в медленном времени и поиска зависимостей времен в пути от корреспонденций с помощью некоторых вариационных принципов, о которых говорится в пп. 3 и 4, 6–8, сводятся к задачам выпуклой оптимизации, которые можно объединить в одну общую задачу поиска седловой точки негладкой выпукло-вогнутой функции. В конце пункта указывается возможность обобщения трехстадийной модели до четырехстадийной (есть некоторые нюансы в трактовках – стоит иметь в виду, что в раз-ных литературных источниках к таким моделям могут предъявляться немного разные тре-бования), в которой учитываются различные типы пользователей и различные типы передвижений (моделирование идет на больших масштабах времени). В п. 4 описывается модель равновесного распределения потоков Бэкмана. В конце пункта приводится эволюционный способ интерпретации возникающего в этой модели равновесия Нэша–Вардропа. В п. 5 приводится краткий обзор многостадийных моделей, построенных на основе моделей описанных в пп. 3 и 4. В п. 6 описывается модель равновесного распределения потоков, которую мы далее будем называть моделью стабильной динамики. Модель стабильной динамики требует намного меньше данных для своей калибровки, наследует практически все основные “хорошие” свойства модели Бэкмана, и не наследует ряд недостатков. В п. 7 модель стабильной динамики выводится с помощью предельного перехода из модели Бэкмана. В п. 8 строится обобщение модели стабильной динамики на случай, когда есть несколько способов передвижения (личный транспорт и общественный; отметим при этом, что в Москве и области более 70% пользователей сети используют общественный транспорт). Таким образом, в пункте 8 в модель стабильной динамики органично встраивается модель равновесного расщепления потоков. В п. 9 энтропийная модель расчета матрицы корреспонденций из п. 3 объединяется с моделью из п. 8. В результате получается трехстадийная модель, в которой учитывается и формирование корреспонденций, и расщепление потоков, и равновесное распределение потоков по графу транспортной сети. Примечательно, что поиск равновесия в полученной трехстадийной модели (из задачи поиска седловой точки негладкой выпукло-вогнутой функции – см. п. 3) в итоге сводится к решению задачи негладкой выпуклой оптимизации, с ограниченной константой Липшица функционала, но с неконтролируемой начальной невязкой. Важно отметить, что помимо самого решения, нужно определять и часть двойственных переменных, имеющих содержательный физический смысл. В п. 10 модель п. 9 обобщается на случай поиска стохастического равновесия, что можно проинтерпретировать как ограниченную рациональность водителей или их неполную информированность. Это допущение делает модель п. 9 более приближенной к практике. С вычислительной точки зрения, сделанная модификация сводит задачу к задаче гладкой выпуклой оптимизации с немного более громоздким функционалом. Полученная задача во многом наследует все вычислительные минусы и плюсы негладкого случая. Обе задачи выпуклой оптимизации из пп. 9, 10 требуют разработки адекватных прямо-двойственных субградиентных алгоритмов решения. Заметим, что использовать методы с оракулом (сообщающим, в зависимости от своего порядка, значения функций в выбранных точках, их градиенты, и т.д.) порядка выше первого [13] не представляется возможным в виду размеров задач. В заключительном пункте 11 приводятся (с объяснениями) несколько практических рецептов по калибровке предложенных моделей. На протяжении всей работы (и последующих работ в этом направлении) мы будем активно использовать элементы выпуклого анализа и методы численного решения задач выпуклой оптимизации ориентируясь на априорное знакомство читателя с этими дисциплинами, например, в объеме книг [13, 14]. Одним из основных инструментов работы будет теорема фон Неймана о минимаксе для выпукло-вогнутых функций [15]. Причем использоваться эта теорема будет не только для функций, заданных на произведении компактов, но и на неограниченных множествах. Надо лишь иметь гарантию, что максимумы и минимумы существуют (достигаются). Проблема сводится к существованию неподвижной точки у многозначного отображения. В этой области имеется большое количество результатов, с запасом покрывающих потребности данной работы, для обоснования возможности перемены порядка взятия максимума и минимума. В частности, в этой работе мы будем пользоваться вариантом минимаксной теоремы, на-зываемой в зарубежной литературе “Sion’s minimax theorem” [16], в которой предполага-ется компактность лишь одного из множеств, отвечающих выпуклым или вогнутым пере-менным, и непрерывность функции. Тем не менее, далее мы будем использовать более привычное название “минимаксная теорема фон Неймана”. Все необходимые обозначения и ссылки будут вводиться в работе по мере необходимости. Энтропийная модель расчета матрицы корреспонден-ций
Приведем, во многом следуя книге [6], обоснование (ориентированное, скорее, на западный уклад жизни, поскольку предполагается, что человек за жизнь несколько раз меняет место жительство и место работы), пожалуй, одному из самых популярных спосо-бов расчета матрицы корреспонденций, имеющему более чем сорокалетнюю историю, – энтропийной модели [17–19]. Пусть в некотором городе имеется n районов, i L – число жителей i -го района, j W – число работающих в j -м районе. При этом n ni ji j N L W , – общее число жи-телей города. В последующих пунктах, под i L будет пониматься число жителей рай-она, выезжающих в типичный день за рассматриваемый промежуток времени из i -го рай- она, а под j W – число жителей города, приезжающих на работу в j -й район в типич-ный день за рассматриваемый промежуток времени. Обычно, так введенные, i L , j W рас-считываются через число жителей i -го района и число работающих в j -м районе с по-мощью более менее универсальных (в частности, не зависящих от i , j ) коэффициентов пропорциональности. Эти величины являются входными параметрами модели, т.е. они не моделируются (во всяком случае, в рамках выбранного подхода). Для долгосрочных рас-четов с разрабатываемой моделью требуется иметь прогноз изменения значений этих ве-личин. Обозначим через ij d t – число жителей, живущих в i -м районе и работающих в j -м в момент времени t . Со временем жители могут только меняться квартирами, поэтому во все моменты времени t ij d t , n ij ij d t L , n ij ji d t W , , 1, ..., i j n , n N . ( A ) Опишем основной стимул к обмену: работать далеко от дома плохо из-за транспорт-ных издержек. Будем считать, что эффективной функцией затрат [6] будет R T T , где T – время в пути от дома до работы, а – настраиваемый параметр модели (который также можно проинтерпретировать и даже оценить). Теперь опишем саму динамику (детали см. в [6, 21]). Пусть в момент времени t r -й житель живет в k -м районе и работает в m -м, а s -й житель живет в p -м районе и работа-ет в q -м. Тогда , ; , k m p q t t o t – есть вероятность того, что жители с номерами r и s ( r s N ) “поменяются” квартирами в промежутке времени , t t t . Вероятность обмена местами жительства зависит только от мест проживания и работы обменивающих-ся:
1, ; , , ; , суммарные затраты суммарные затратыдо обмена после обмена exp 0 k m p q k m p q km pq pm kq t N R T R T R T R T , Для Москвы (и других крупных мегаполисов) часто выбирают
10 10 n . Следовательно, корреспон-денций будет
10 10 n , и чтобы каждую из корреспонденций определить с точностью 10% (относи-тельной точностью ) потребуется (это оценка снизу) опросить не менее
10 10 n жителей города, что не представляется возможным – это обстоятельство является одной из причин (не единствен-ной), почему стараются снизить размерность пространства параметров, считая, что матрица корреспонден-ций задается не n параметрами, а только, например, n ( L и W ), которые и надо определять (см. также п. 5, в котором параметров n ). На самом деле выбирать критерием качества “относительную точность” для каждой (в том числе очень маленькой) корреспонденции не очень разумно. Более естественно восста-навливать матрицу (вектор) корреспонденций в 1-норме. Другой причиной использования описанной ниже энтропийной модели является возможность прогнозирования с еѐ помощью того, как будет меняться матри-ца корреспонденций при изменении инфраструктуры города, собственно эта одна из тех задач, которые не-обходимо уметь решать, для получения ответов на вопросы, приведенные в п. 1. Кроме того, важно заметить, что крупный Мегаполис, как правило, представляется в такого рода мо-делях вместе со всеми своими окрестными территориями. Скажем, для Москвы – это Московская область. Отметим также, что для Москвы и области N . где коэффициент характеризует интенсивность обменов. Совершенно аналогичным образом можно было рассматривать случай “обмена местами работы”. Здесь стоит огово-риться, что “обмены” не стоит понимать буквально – это лишь одна из возможных интер-претаций. Фактически используется, так называемое, “приближение среднего поля” [20], т.е. некое равноправие агентов (жителей) внутри фиксированной корреспонденции и их независимость. Согласно эргодической теореме для марковских цепей (в независимости от началь-ной конфигурации ,1, 1 n nij i j d ) [6, 24] предельное распределение совпадает со стацио-нарным (инвариантным), которое можно посчитать (получается проекция прямого произ-ведение распределений Пуассона на гипергрань некоторого многогранника): ,1, 1 n nn ij ni j c d t c N N , , 1,..., exp 2 ! , n def n nij ij ij ij ij ij i ji j P d t d i j n Z R T d d p d где “статсумма” Z находится из условия нормировки получившейся “пуассоновской” ве-роятностной меры. Отметим, что стационарное распределение ,1, 1 n nij i j p d удовлетворя-ет условию детального равновесия:
11 , ; , km pq km pq pm kq nn k m p q d d p d d d d d d , , ; ,1, 1 n npm kq ij p m k qi j d d p d . При N распределение ,1, 1 n nij i j p d экспоненциально сконцентрировано на множестве ( A ) в N окрестности наиболее вероятного значения ,* 1, 1 n nij i j d , которое определяется, как решение задачи энтропийно-линейного программирования [6] (подроб-нее о таких задачах и о том, как их решать см. [17–20, 25–33] – при небольших успешно работает метод балансировки [29], при больших доминирует подход из [32, 33]): ,1, 1 ,1, 1 A, 1 , 1 ln ln max n nij i j n nn nij ij ij ij iji j di j i j p d d d e d T . (1) Отметим также, что конечной цели (получение задачи (1)) можно добиться отличными способами. Ска-жем, используя формализм Л.И. Розоноэра “систем обмена и распределения ресурсов” со структурной функцией энтропией (кстати, это можно не постулировать, структурная функция появляется, при работе с условием интегрируемости дифференциальной формы возможных обменов ресурсами) – см., например, [22] и цитированную там литературу. При таком подходе стохастика не нужна, и вариационный принцип (мак-симизации энтропии при аффинных ограничениях) получается мало чувствительным к особенностям воз-можных превращений в системе. Другие способы получения (1) связаны с информационно-статистическими соображениями, например, принципом максимума правдоподобия [17, 19, 23]. При получении этой формулы использовалась асимптотическая формула Стирлинга [6, 17, 19], то есть предполагалось, что если ij d , то ij d (если все i L , j W , то и все ij d [6, 19]) и, как следст-вие, целочисленностью переменных ij d можно пренебречь, то есть решать не NP -полную задачу выпуклого целочисленного программирования, а обычную задачу выпуклой оптимизации (1). Сделанное предположе-ние “если ij d , то ij d ” во многом будет следовать из дальнейших рассуждений (см. также [6, 19]). Естественно принимать решение этой задачи ,* 1, 1 n nij i j d за равновесную конфигура-цию [34]. Однако имеется проблема: ij T – неизвестны, и зависят от ij d . Эту проблему мы постараемся решить в дальнейшем. Обратим внимание, что предложенный выше вывод энтропийной модели расчета матрицы корреспонденций отличается от классического [17]. В монографии А.Дж. Виль-сона [17] интерпретируется как множитель Лагранжа к ограничению на среднее “время в пути”: , 1 n ij iji j d T C . Сделано это нами для того, чтобы контролировать знак параметра и лучше понимать его физический смысл (нам это понадобится в дальнейшем). Отметим также, что характерный временной масштаб формирования корреспонденций – годы (это не совсем так для корреспонденций типа дом–торговля, дом–отдых). В то время как характерное время установления равновесных значений ij T d недели (см. ниже). Хо-чется сказать, что мы здесь находимся в условиях теоремы Тихонова о разделении времен [12], точнее говоря, что можно просто подставить в (1) зависимости ij T d и решать полу-ченную задачу. Но теорема Тихонова должна применяться для системы ОДУ, представ-ляющей собой, в данном случае, динамику квазисредних введенной выше стохастической динамики [6, 20]: , 1 exp 2 nij ip kj ij kp ip kjk p d c T T T T c cdt , 1 exp 2 n ij kp ip kj ij kpk p T T T T c c , ij ij c d N ; сложный оператор, зависящий от ij d T cdt ,
10 10 1 . При этом остальные ограничения имеют такой же вид, а функционал , 1 ln n ij iji j F d d d e . Тогда, согласно экономической интерпретации двойственных множителей Л.В. Канторовича [22]: C F d C C . Из такой интерпретации иногда делают вывод о том, что можно понимать, как цену единицы времени в пути. Чем больше C , тем меньше . Отметим, что также как и в [17] из принципа ле Шателье–Самуэльсона [22] следует, что с ростом среднее время в пути , 1 n ij iji j d T d будет убывать. В связи с этим обстоятельством, а также исходя из соображений размерности, вполне естественно понимать под величину, обратную к характерному (сред-нему) времени в пути [17] – физическая интерпретация. Собственно, такая интерпретация параметра , как правило, и используется в многостадийных моделях (см., например, [1], а также п. 5). Точнее говоря, из теоремы Т. Куртца [35] следует (с некоторыми, довольно общими, оговорками относи-тельно зависимостей ij T d N ): если предположить, что делается такой предельный переход, что ij ijN c d N , то . . п нij ijN t c t d t N (в общем случае пределы существуют не равномерно по времени, но в нашем случае равномерно), где функции ij c t (не случайные) удовлетворяют выписанной системе ОДУ. Для обоснования возможности применения здесь такого рода результата как теорема Ти-хонова требуется много усилий: во-первых, изначально введенные динамики стохастиче-ские (см. также пп. 4, 7, 8 для ij T ), поэтому, в конечном итоге, нужно все обосновывать именно для них, во-вторых, нам интересна асимптотика по времени первой системы – в медленном времени (то есть нельзя ограничиться классическим случаем: ограниченного отрезка времени), в-третьих, сложный характер оператора, стоящего в правой части вто-рой системы – в быстром времени, не позволяет явно его выписать. Тем не менее, проце-дура построения этого оператора, которая, в свою, очередь, предполагает переход к пре-делу (по и по числу пользователей транспортной сети (аналог N ) – см. п. 7), может быть при необходимости получена из того, что будет далее приведено в пп. 4, 7, 8. Мы не будем здесь подробно описывать, как можно бороться с указанными проблема-ми, заметим лишь, что в виду “хороших” свойств зависимостей ij T c (см. пп. 7, 8), полу-чающихся из приравнивания нулю левой части системы в быстром времени, функция , 1 ln n ij iji j H c c c c , (следует сравнить с (1)) где ij ij c с T c (то, что такая функция существует, показано ниже), будет функцией Ляпунова, и, одновременно, функцией Санова (действием), то есть функцией, которая с точностью до знака и аддитивной постоянной характеризует экспоненциальную концентрацию стационарной меры введенной марковской динамики. Это довольно общий факт, справедливый для широкого класса систем [6, 20]. Поиск равновесной конфигура-ции ,* 1, 1 n nij i j c представляет собой решение задачи min : 0, , w n nij i ij jj i H c c c l c , где l L N , w W N , то есть (1). По ,* 1, 1 n nij i j c ( , ,* *1, 1 1, 1 n n n nij iji j i j d N c ) уже можно будет определить и равновесные * ij ij T T c . В дальнейшем, нам будет удобно привести задачу (1) к следующему виду (при по-мощи метода множителей Лагранжа [14], теоремы фон Неймана о минимаксе [15] и пере-нормировки : d d N ): , 1 ,, , 1 1, 1 1 1 1 11, 0 min max ln w L W n ij iji j n nn n n n nL Wij ij ij ij i i ij j j iji j i j i j i id d d d d T l d d , (2) Полученная функция будет выпуклой. Далее это будет проясняться. где, напомним, l L N , w W N . Вместо того, чтобы подставлять сюда зависимость ij T d , мы используем следующий трюк. В пп. 6–8 задача поиска зависимости ij T d будет сведена к задаче вида: ,1, 1 min , n n defij ijt t i j f t t d T t d , где t и f – известные векторы (входные параметры модели) временных затрат в пути на ребрах графа транспортной сети и максимальных пропускных способностей ребер графа транспортной сети, ij T t – длина кратчайшего пути из района i в район j (на графе транспортной сети имеется много вершин – намного больше числа районов, но мы считаем, что в каждом районе есть только одна вершина транспортного графа, являющаяся источником/стоком для пользователей сети, именно между такими представителями вершин районов i и j берется кратчайшие расстояние), если веса ребер графа транспортной сети задаются вектором t . Не стоит путать ij T t с искомой зависимостью ij T d – это разные функциональные зависимости. Решив указанную задачу * t d минимизации, считая d параметрами, мы получили бы искомую зависимость * : ij ij T d T t d . Но явно это нельзя сделать в типичных ситуациях, да и не нужно, потому что в итоге все равно необ-ходимо работать с потенциалом d . Поэтому предлагается ввести в задачу (1) подзадачу и добавить слагаемое , 1 , 1, 0 min max min , L W n ij iji j t td d f t t . Решение такой задачи сразу даст все, что нужно. Это следует из формулы Демьянова–Данскина [14]. Пункт 9 посвящен упрощению только что сформулированной конструкции. Более полное обосно-вание и дальнейшее развитие можно отследить по работам [36–38]. Обратим внимание, что мы берем максимум в (2) при дополнительном ограничении , 1 n iji j d , которого изначально не было. Однако легко показать, что это ограничения является следствием системы ограничений (A), точнее следствием одновременно двух подсистем в (А) – отвечающих l и w . Как следствие, можно считать, что n Lii , n Wjj . Отметим также, что задача (2) может быть упрощена, поскольку внут-ренний максимум явно находится, однако мы отложим соответствующие выкладки до п. 9. Здесь же мы рас-смотрим случай, когда мы заносим в функционал с помощью множителей Лагранжа только часть ограниче-ний (соответствующих l или w ). В таком случае, вычисляя внутренний максимум по d , получим, соответ-ственно, задачи: min ln exp w ; W n n nW Wi j ij j ji j j l T min ln exp , L n n nL Lj i ij i ij i i w T l где, соответственно exp exp ; nW Wij i j ij k ikk d l T T exp exp nL Lij j i ij k kjk d w T T . Отсюда можно усмотреть интерпретацию двойственных множителей как соответствующих “потенциалов притяжения/отталкивания районов” [17]. К этому мы еще вернемся в замечании п. 4. В принципе далее удобнее было бы работать с одной из этих задач, а не с (2), однако для сохранения симметрии, мы оставляем задачу в форме (2). Подобно тому, как мы рассматривали в этом пункте трудовые корреспонденции (в утренние и вечерние часы более 70% корреспонденций по Москве и области именно такие), можно рассматривать перемещения, например, из дома к местам учебы, отдыха, в магазины и т.п. (по хорошему, еще надо было учитывать перемещения типа работа–магазин–детский_сад–дом) – рассмотрение всего этого вкупе приведет также к задаче (1). Только будет больше типов корреспонденций d : помимо пары районов, еще нужно будет учитывать тип корреспонденции [глава 2, 17]. Все это следует из того, что инвариантной мерой динамики с несколькими типами корреспонденций по-прежнему будет прямое произведение пуассоновских мер. Важно отметить при этом, что в таком контексте (равновесные) ij T будут определяться парами районов, а не типом передвижения, то есть с точки зрения последующего изложения это означает, что ничего по-сути не поменяется. Другое дело, когда мы рассматриваем разного типа пользователей транспортной сети, например: имеющих личный автомобиль и не имеющих личный автомобиль. Первые могут им воспользоваться равно, как и общественным транспортом, а вторые нет. И на рассматриваемых масштабах времени пользователи могут менять свой тип. То есть время в пути может для разных типов пользователей быть различным [глава 2, 17]. Считая, подобно тому как мы делали раньше, что желание пользователей корреспонденции , i j сети сменить свой тип (вероятность в единицу времени) есть суммарные затраты суммарные затратыдо смены типа после смены типа exp old newij ij R T R T , где
R T T , и учитывая в “обменах” тип пользователя (будет больше типов корреспонденций d , но “меняются местами работы” только пользователи одного типа), можно показать, что все это вкупе приведет также к задаче типа (1), и все последующие рассуждения распространяются на этот случай. Но с оговоркой, что в п. 8 расщепление потоков надо делать только для тех пользователей, для которых имеется возможность использовать личный транспорт. При этом часть пользователей (в зависимости от текущего d ) распределяются только по сети общественного транспорта. Несложно понять, что это ничего принципиально не изменит. Фактически, в этом абзаце мы описали, как сделать из трехстадийной модели полноценную четырехстадийную модель, которыми обычно и пользуются на практике. Чтобы не делать изложение излишне громоздким, далее мы не учитываем нюансы, описанные в этом абзаце. Здесь, конечно, надо учитывать не только трудовые миграции, но и все остальные, поскольку для замет-ной части жителей Москвы и области решение о покупки автомобиля напрямую связано с желанием ездить на нем в основном только на дачу. В этом месте возникает необходимость моделирования (учета) переме-щений пользователей сети не только в рамках установленного диапазона времени в течение типичного дня, но и в целом все возможные перемещения. Это обстоятельство вынуждает использовать здесь различного рода эвристики, дабы не отказываться от важного предположения: “в рамках установленного диапазона времени в течение типичного дня”. Модель равновесного распределения потоков Бэкмана
Следуя книге [6], опишем наиболее популярную на протяжении более чем полувека модель равновесного распределения потоков Бэкмана [2–6]. Пусть транспортная сеть города представлена ориентированным графом , V E , где V – узлы сети (вершины), E V V – дуги сети (рѐбра графа). В современных моделях равновесного распределения потоков в крупном мегаполисе число узлов графа транспорт-ной сети обычно выбирают порядка
10 10 V . Число ребер E получается в три четыре раза больше. Пусть , : , W w i j i j V – множество корреспонденций, т.е. возможных пар «исходный пункт» – «цель поездки» ( W по порядку величины может быть n ); , ,..., m p v v v – путь из v в m v , если , k k v v E , k m , m ; w P – множество путей, отвечающих корреспонденции w W , то есть если , w i j , то w P – множество пу-тей, начинающихся в вершине i и заканчивающихся в j ; ww W P P – совокупность всех путей в сети (число “разумных” маршрутов P , которые потенциально могут использо-ваться, обычно растет с ростом числа узлов сети не быстрее чем V , однако теоретиче-ски может быть экспоненциально большим); p x [автомобилей/час] – величина потока по пути p , : p x p P x ; e f [автомобилей/час] – величина потока по дуге e : e ep pp P f x x , где
1, 0, ep e pe p ; e e f – удельные затраты на проезд по дуге e . Как правило, предполагают, что это – (строго) возрастающие, гладкие функции от e f (в конце этого раздела нам потребуется еще и выпуклость). Точнее говоря, под e e f правильнее понимать представление поль-зователей транспортной сети об оценке собственных затрат (обычно временных в случае личного транспорта и комфортности пути (с учетом времени в пути) в случае обществен-ного транспорта) при прохождении дуги e , если поток желающих оказаться на этой дуге будет e f . Зависимость e e f можно попробовать и вывести, например, из следующих сооб-ражений [6] (вариация на тему модели Бобкова–Буслаева–Танака). Рассматривается одна полоса длины L и транспортный поток, характеризующийся максимальной скоростью max v и следующей зависимостью безопасного расстояния (“комфортного” расстояния до впереди идущего транспортного средства) от скорости: d l v cv v , где l – средняя длина автомобиля в “стоячей” пробке (эта длина немного больше средней “физической” длины автомобиля м), – время реакции водителей (эксперименты показывают, что для европейских водителей эта величина обычно равна одной секунде, для российских водителей она, как правило, не превышает полсекунды), c – характеризует коэффициент трения шин о поверхность дороги, поскольку слагаемое cv характеризует в d v тор-мозной путь. Действительно, пока водитель среагирует на ситуацию он в среднем проедет (не изменяя своей скорости) путь v . Когда уже реакция произошла, водитель начинает тормозить и кинетическая энергия автомобиля mv должна быть “погашена” работой силой трения на участке h тормозного пути mgh ( – коэффициент трения, g – уско-рение свободного падения). Отсюда можно найти c g . Имея зависимость d v , можно ввести зависимость d v v , которая порождает зависимость потока от ско-рости f v v v . Используя то, что f v L v и max v v можно явно выписать искомую зависимость f . Рассмотрим теперь p G x – затраты временные или финансовые на проезд по пути p . Естественно считать, что p e e epe E G f x x . В приложениях часто требуется учитывать также затраты на прохождения вершин графа, которые могут зависеть от вели-чин всех потоков через рассматриваемую вершину. Пусть также известно, сколько перемещений в единицу времени w d осуществляется согласно корреспонденции w W . Тогда вектор x , характеризующий распределение по-токов, должен лежать в допустимом множестве: w p wp P X x d w W x . Это множество может иметь и более сложный вид, если дополнительно учитывать, например, конечность пропускных способностей рѐбер (ограничения сверху на e f ). Рассмотрим игру, в которой каждому элементу w W соответствует свой, достаточ-но большой ( w d ), набор однотипных “игроков”, осуществляющих передвижение со-гласно корреспонденции w . Чистыми стратегиями игрока служат пути, а выигрышем – величина p G x . Игрок “выбирает” путь следования w p P , при этом, делая выбор, он пренебрегает тем, что от его выбора также “немного” зависят w P компонент вектора x и, следовательно, сам выигрыш p G x . Можно показать, что отыскание равновесия Нэша–Вардропа * X x (макро описание равновесия) равносильно решению задачи нелинейной комплементарности (принцип Вардропа): для любых , w w W p P выполняется * * * min 0. w p p qq P x G G x x Действительно допустим, что реализовалось какое-то другое равновесие * X x , ко-торое не удовлетворяет этому условию. Покажем, что тогда найдется водитель, которому выгодно поменять свой маршрут следования. Действительно, тогда существуют такие , w w W p P , что * * * min 0 w p p qq P x G G x x . Каждый водитель (множество таких водителей не пусто * p x ), принадлежащий корреспонденции w W , и использующий путь w p P , действует не разумно, поскольку существует такой путь такой путь w q P , q p , что * * min w q qq P G G x x . Этот путь q более выгоден, чем p . Аналогично показывается, что при * X x никому из водителей уже не выгодно отклоняться от своих стратегий. Но это по определению и называется равновесием Нэша, которое ввел в своей диссертации в конце 40-х годов XX века Джон Нэш, получивший именно за эту концепцию в 1994 г. нобелевскую премию по экономике [39]. Мы также добавляем фамилию Дж.Г. Вардропа, которой чуть позже Дж. Нэша прив-нес к этой концепции условие “конкурентного рынка”: игрок, принимающий решение, пренебрегает тем, что его решение сколько-нибудь значительно поменяет ситуацию на “рынке”. Когда игроков двое, трое (ситуации, рассматриваемые Дж. Нэшем), то, очевидно, что так делать нельзя. Но когда игроков (водителей) десятки и сотни тысяч… Вся эта кон-струкция неявно предполагает, что * * p p x x . Поэтому, не боясь сильно ошибиться, можно искать решение задачи нелинейной комплементарности, не предполагая целочис-ленности компонент вектора * X x . Такая релаксация изначально целочисленной задачи заметно упрощает еѐ с вычислительной точки зрения! Хотя мы и смогли выписать условие равновесия в виде задачи нелинейной компле-ментарности, это не сильно продвинуло нас в понимании того, как его находить. Пытаться честно решить задачу в таком виде – вычислительно бесперспективная задача. С другой стороны современные вычислительные методы позволяют эффективно решать задачи вы-пуклой оптимизации. Постараемся свести нашу задачу к таковой. Для этого, прежде всего, заметим, что рассматриваемая нами игра принадлежит к классу, так называемых, потенциальных игр. В нашем случае это означает, что существует такая функция ep pp P x e e ee E e E x z dz f x , где e f xe e e f z dz , что p p x x G x для любого p P . Таким образом, мы имеем дело с потенциальной игрой. Оказывается, что * X x – равновесие Нэша–Вардропа тогда и только тогда, когда оно доставляет минимум x на множестве X . Действительно, предположим, что * X x – точка минимума. Тогда, в частности, для лю-бых w W , , w p q P ( * p x ) и достаточно маленького p x выполняется: * * p pp q x xx x x x . Иначе, заменив * x на * * p p pq x x X x x , мы пришли бы к вектору * x , доставляющему меньшее значение x на множестве X : * ** * * p pp q x xx x x xx x x . Вспоминая, что p p x x G x , и учитывая, что q можно выбирать произволь-но из множества w P , получаем: для любых , w w W p P , если * p x , то выполняется * * min w q pq P G G x x . Но это и есть по-другому записанное условие нелинейной комплементарности. Строго го-воря, мы показали сейчас только то, что точка минимума x на множестве X будет равновесием Нэша–Вардропа. Аналогично рассуждая, можно показать и обратное: равно-весие Нэша–Вардропа доставляет минимум x на множестве X . Этот минимум мож-но искать, например, с помощью метода условного градиента [18, 40] (Франк–Вульф). Теорема 1 [3–6].
Вектор * x будет равновесием Нэша–Вардропа тогда и только то-гда, когда Arg min : , e ex e E x f x f x f x x X . (3) Если преобразование G строго монотонное, то равновесие x единственно. Если e , то равновесный вектор распределения потоков по ребрам f – единственный ( это еще не гарантирует единственность вектора распределения потоков по путям x [6] ) . Проинтерпретируем, следуя [6, 9, 21, 41], эволюционным образом полученное рав-новесие, попутно отвечая на вопрос (поскольку задача (4) ниже имеет единственное реше-ние, детали см. в [21, 42]): какому из равновесий стоит отдать предпочтение, в случае не-единственности? Опишем марковскую логит динамику (также говорят гиббсовскую ди-намику) в повторяющейся игре загрузки графа транспортной сети [9]. Пусть каждой кор-респонденции отвечает w d M агентов ( M ), : x x M , : f f M , : e e e e f f M . Пусть имеется tN шагов ( N ). Пусть k -й агент, принадлежащий корреспонденции w W , независимо от остальных на шаге m с вероятностью с вероятность N выбирает путь , k m p , который использовал на шаге m tN , а с вероятностью N ( ) решает “поменять” путь, и выбирает (возможно тот же самый) зашумленный крат-чайший путь , 1 , 1 arg max w k m m k mq qq P p G x , где независимые случайные величины , 1 k mq , имеют одинаковое двойное экспоненциаль-ное распределение, также называемое распределением Гумбеля [9, 41]: , 1 exp k m T Eq P e , T . Отметим, что , 1 expагент решил "поменять" путь exp w mpk m mqq P G x TP p p G x T . Кроме того, если взять E – константа Эйлера, то , 1 k mq M , , 1 2 2 k mq D T . Такая динамика отражает ограниченную рациональность агентов (см. п. 5), и часто используется в популяционной теории игр [9] и теории дискретного выбора [41]. Оказы-вается эта марковская динамика в пределе N превращается в марковскую логит ди-намику в непрерывном времени (вырождающуюся при T в динамику наилучших ответов [9] – последующие рассуждения, в частности, формулы (4), (5), допускают пере-ход к пределу T ). Марковская логит динамика в непрерывном времени допускает два предельных перехода (обоснование перестановочности этих пределов см. в [34, 35]): t , M или M , t . При первом порядке переходов мы сначала ( t ) согласно эргодической теореме для марковских процессов (в нашем случае марковский процесс – модель стохастической химической кинетики с унарными реакциями в условиях детального баланса [21, 34]) приходим к финальной (=стационарной) вероятностной мере, имеющей в основе мультиномиальное распределение. С ростом числа агентов ( M ) эта мера exp 1 T M x oT Распределение Гумбеля можно объяснить исходя из идемпотентного аналога центральной предельной теоремы (вместо суммы случайных величин – максимум) для независимых случайных величин с экспоненциальным и более быстро убывающим правым хвостом [43]. Распределение Гумбеля возникает в данном контексте, например, если при принятии решения водитель собирает информацию с большого числа разных (независимых) зашумленных источников, ориентируясь на худшие прогнозы по каждому из путей. экспоненциально концентрируется около наиболее вероятного состояния, поиск которого сводится к решению энтропийно регуляризованной задачи (3) (как численно решать эту задачу описано в работе [44], см. также [32]) ln min w T p p f x xw W p P x X x f x T x x . (4) Функционал в этой задаче оптимизации с точностью до потенцирования и мультиплика-тивных и аддитивных констант соответствует исследуемой стационарной мере – то есть это функционал Санова [21, 34]. При обратном порядке предельных переходов, мы снача-ла ( M ) осуществляем, так называемый, канонический скейлинг [34, 35], приводящий к детерминированной кинетической динамике, описываемой СОДУ на x expexp w pp w pll P G x Tdx d xdt G x T , w p P , w W , (5) а затем ( t ) ищем аттрактор получившейся СОДУ. Глобальным аттрактором оказыва-ется неподвижная точка, которая определяется решением задачи (4). Более того, функцио-нал T x является функцией Ляпунова полученной кинетической динамики (5) (то есть является функционалом Больцмана). Последнее утверждение – достаточно общий факт (функционал Санова, является функционалом Больцмана), верный при намного более об-щих условиях (см. [34] и цитированную там литературу). Хотелось бы подчеркнуть, что рассматриваемая выше “игра” – потенциальная (это общий факт для игр загрузок [9]; Розенталь 1973, Мондерер–Шэпли 1996), поэтому из общих результатов эволюционной теории игр [9, 45], следует, что любые разумные со-держательно интерпретируемы (суб-)градиентные спуски приводят к равновесию Нэша–Вардропа (или его стохастическому варианту, даваемому решением задачи (4)). В частно-сти, в [6, 46, 47] содержательно интерпретируется быстро сходящаяся динамика, связан-ная с методом зеркального спуска, которая порождается имитационной логит динамикой [9]. Хотелось бы также обратить внимание на эволюционную интерпретацию парадокса Браесса: когда не эффективное по Парето, единственное равновесие Нэша–Вардропа в специально сконструированной транспортной сети является, тем не менее, эволюционно устойчивым [6, 9]. Нетривиальным является следующее наблюдение. Если рассмотреть энтропийно-регуляризованный функционал T x и взять предел (см. пп. 6, 7) , 0 ,, , e e ee e e e e t f ff t f f
0, 0 , e e e e e d f df f f то переход к двойственной задаче (для задачи минимизации этого функционала на множе-стве X ) дает стохастический вариант модели стабильной динамики (см. п. 6), который используется в стохастическом варианте трехстадийной модели стабильной динамики (см. п. 10). Замечание 1 (“облачная модель” расчета матрицы корреспонденций [21]).
В контексте написанного выше полезно отметить другой способ обоснования энтропийной модели расчета матрицы корреспонденций из п. 3. Предположим, что все вершины, отве-чающие источникам корреспонденций, соединены ребрами с одной вспомогательной вершиной (облако № 1). Аналогично, все вершины, отвечающие стокам корреспонденций, соединены ребрами с другой вспомогательной вершиной (облако № 2). Припишем всем новым ребрам постоянные веса. И проинтерпретируем веса ребер, отвечающих источни-кам Li , например, как средние затраты на проживание (в единицу времени, скажем, в день) в этом источнике (районе), а веса ребер, отвечающих стокам Wj , как уровень сред-ней заработной платы со знаком минус (в единицу времени) в этом стоке (районе), если изучаем трудовые корреспонденции. Будем следить за системой в медленном времени, то есть будем считать, что равновесное распределение потоков по путям стационарно. По-скольку речь идет о равновесном распределении потоков, то нет необходимости говорить о затратах на путях или ребрах детализированного транспортного графа, достаточно гово-рить только затратах (в единицу времени), отвечающих той или иной корреспонденции. Таким образом, у нас есть взвешенный транспортный граф с одним источником (облако 1) и одним стоком (облако 2). Все вершины этого графа, кроме двух вспомогательных (обла-ков), соответствуют районам в модели расчета матрицы корреспонденций из п. 3. Все ребра этого графа имеют стационарные (не меняющиеся и не зависящие от текущих кор-респонденций) веса ; ; L Wij i j T . Если рассмотреть естественную в данном контексте ло-гит динамику с T (здесь полезно напомнить, что согласно п. 3 обратно пропор-ционально средним затратам, а T имеет как раз физическую размерность затрат), описан-ную выше, то поиск равновесия рассматриваемой макросистемы приводит (в прошкали-рованных переменных) к задаче, сильно похожей на задачу (2) из п. 3 , 1 ,, 1 1, 1 1 1 1 11, 0 max ln . n ij iji j n nn n n n nL Wij ij ij ij i ij j iji j i j i j i id d d d d T d d Разница состоит в том, что здесь мы не оптимизируем по n двойственным множителям L , W . Более того, мы их и не интерпретируем здесь как двойственные множители, по-скольку мы их ввели на этапе взвешивания ребер графа. Тем не менее, значения этих пе-ременных, как правило, не откуда брать. Тем более, что приведенная выше (наивная) ин-терпретация вряд ли может всерьез рассматриваться, как способ определения этих пара- метров исходя из данных статистики. Более правильно понимать Li , Wj как потенциалы притяжения/отталкивания районов, включающиеся в себя плату за жилье и зарплату, но включающие также и многое другое, что сложно описать количественно. И здесь как раз помогает информация об источниках и стоках, содержащаяся в n уравнениях из форму-лы ( А ) п. 3. Таким образом, мы приходим ровно к той же самой задаче (2) с той лишь раз-ницей, что мы получили дополнительную интерпретацию двойственных множителей в задаче (2). При этом двойственные множители в задаче (2) равны (с точностью до мульти-пликативного фактора ) введенным здесь потенциалам притяжения районов. Несложно распространить на изложенную здесь модель написанное в п. 3 по поводу того, как с по-мощью разделения времен можно учитывать обратную связь: перераспределение потоков по путям изменяется (в быстром времени) при изменении корреспонденций, а также рас-пространить на то, что написано в самом конце п. 3. Нам представляется такой способ рассуждения даже более привлекательным, чем способ, описанный в п. 3, и основанный на “обменах”. И связано это с тем, что для получения равновесия в многостадийной моде-ли, мы можем рассмотреть всего одну (общую) логит динамику, в которой с малой интен-сивностью (в медленном времени) происходят переходы, описанные в этом замечании (жители города меняют места жительства, работы), а с высокой интенсивностью (в быст-ром времени, изо дня в день) жители города перераспределяются по путям (в зависимости от текущих корреспонденций, подстраиваясь под корреспонденции) – это как раз и было описано непосредственно перед замечанием. Другая причина – большая вариативность модели построенной в этом замечании. Нам представляется очень плодотворной и пер-спективной идея перенесения имеющейся информации об исследуемой системе из обре-менительных законов сохранения динамики, описывающей эволюцию этой системы, в са-му динамику путем введения дополнительных естественно интерпретируемых парамет-ров. При таком подходе становится возможным, например, учитывать в моделях и рост транспортной сети. Другими словами, при таком подходе, например, можно естественным образом рассматривать также и ситуацию, когда число пользователей транспортной сетью меняется со временем (медленно). В заключение отметим, что если штрафовать (назначать платы) за использование различных стратегий (маршрутов) по правилу w qp p qw W q P pштраф GG G x x xx x , p P , то найдется такая функция w p pw W p P x x G x , что p p x x G x . Поэтому из сказанного выше в этом пункте будет следовать, что возникающее в такой управляемой транспортной сети равновесие Нэша–Вардропа будет (единственным) глобально устойчи- вым и соответствовать социальному оптимуму в изначальной транспортной сети [8]. Что-бы в этом убедиться, достаточно (в виду линейной связи f x ) проверить строгую вы-пуклость функции w p p e e ew W p P e E x x G f x f x x , для чего достаточно вы-пуклости функций e e f , e E . Все это хорошо соответствует механизму Викри–Кларка–Гроуса [48] (VCG mechanism) – штраф (плата) за использование маршрута новым пользователем равен дополнительным потерям, которые понесут из-за этого все осталь-ные пользователи. Однако важно сделать две оговорки. Во-первых, все это хотя и можно попытаться практически осуществить (например, собирая транспортные налоги исходя из трековой информации, которую в перспективе можно будет иметь о каждом автомобиле), но довольно сложным оказывается механизм. Платы взимаются не за проезд по ребру, как хотелось бы, а именно за выбор (проезд) маршрута. Кроме того, плата является функцией состояния транспортной системы x , которое, в отличие от f , не наблюдаемо. Во-вторых, взимая платы за проезд, мы с одной стороны приводим систему в социальный оптимум, а с другой стороны для достижения этой цели вынуждены собирать с участников движения налоги. К сожалению, их размер может оказаться внушительным, и это уже необходимо учитывать с точки зрения расщепления участников движения по выбору типа передвиже-ния. Относительно второй проблемы – готовых решений нам не известно. Это известная проблема в современном разделе теории игр: mechanism design [48]. А вот по первой про-блеме (адаптивное) решение есть [8]: e e e e e e eштраф f f f f , e E . Легко проверить, что это приведет к указанному выше пересчету p p G G x x . Далее, если мы зафиксируем (знаем) социальный оптимум opt f , то платы за проезд можно выби-рать постоянными opt opte e e f f , e E . Все сказанное выше об устойчивости останется в силе (без всяких дополнительных предположений о выпуклости функций e e f , e E ) с одной лишь оговоркой, что транспортная система должна поддерживаться при заданных корреспонденциях w d и функциях затрат e e f . В противном случае, возникающее рав-новесие уже может не соответствовать социальному оптимуму. Краткий обзор подходов к построению многостадий-ных моделей транспортных потоков, с моделью типа Бэкмана в качестве модели равновесного распределе-ния потоков
Так называемая «4-стадийная» модель является наиболее употребительной методо-логией моделирования транспортных систем городов и агломераций (см., например, [1]). В рамках данной модели производится поиск равновесия спроса и предложения на поезд-ки. При этом рассматриваются в единой совокупности модели генерации трафика, его распределения по типам передвижения и дальнейшее распределение по маршрутам. Методология, как уже описывалось ранее, включает последовательное выполнение четырех этапов, последние три из которых закольцовываются для получения самосогласо-ванных результатов. Исходными данными для модели являются: граф дорожной сети и сети общественного транспорта с заданными функциями издержек и других определяю-щих параметров, разделение города на транспортные зоны и параметры этих зон (напри-мер, количество рабочих мест или мест жительства). На выходе модели выдаются: оценка матрицы корреспонденций для каждого типа передвижения, загрузка элементов сети (на-пример, конкретной дороги) и издержки, соответствующие данному уровню загрузки. По-нятие «тип передвижения», используемое выше, является обобщением понятия тип транс-порта и обозначает последовательность (или просто множество) используемых типов транспорта. Например, типом передвижения может считаться поездка на общественном транспорте (не важно, автобусе или троллейбусе или на них обоих поочередно с пересад-ками) или же использование схемы park-and-ride. Уровень детализации при этом опреде-ляется самим модельером. Обычно выбирается или модель с тремя типами передвижений (общественный и личный транспорт, пешие прогулки) или с детализацией до типа транс-порта (автомобиль, наземный общественный транспорт, метро, пешие прогулки, и различ-ные комбинации, перечисленные ранее). При этом стараются не учитывать типы пере-движений, которые используются очень редко. Структурно, расчет модели можно описать следующим образом: 1.
На первом шаге из исходных данных о транспортных зонах получают вектора от-правления и прибытия для транспортных зон, т.е. в наших обозначениях nii L и njj W . 2. Рассчитывается первая оценка матрицы корреспонденций (обычно, с помощью гра-витационной модели [6, 18]). 3.
Рассчитывается расщепление корреспонденций по типам передвижений. 4.
Для каждого типа передвижений рассчитывается распределение потоков по маршру-там. Получается оценка матрицы издержек корреспонденций и вектор загрузки сети. 6.
Проверяется критерий остановки. 7.
Если критерий выполнен, решение получено. 8.
Если критерий не выполнен, вернуться на шаг 2 с переоцененной матрицей издер-жек. Первый этап модели мы разбирать не будем, так как он является достаточно обособ-ленным от других в том смысле, что он не входит в итерационную часть метода и практи-чески «бесплатен» с точки зрения сложности операций. Отметим лишь, что вектора от-правления и прибытия рассчитываются из параметров зон с помощью простейших регрес-сионных моделей. Рассмотрим модели, лежащие в основе этого алгоритма более подробно. Данный ал-горитм – итерационный, после «прогонки» очередной итерации мы возвращаемся на вто-рой «шаг» схемы. На m -й итерации на 2-м шаге формируется m -я оценка матрицы коррес-понденций. Для еѐ построения необходимо знание о матрице издержек в сети (т.е. знание о стоимости проезда из каждой зоны в каждую). На всех шагах, кроме первого, данные значения получаются из предыдущей ( m– для каждого слоя спроса свои. После этого, данные матрицы корреспонденций суммируются. Полученная агрегирован-ная матрица корреспонденций используется для проведения этапа расщепления коррес-понденций (суммарных) по типам передвижений. Далее алгоритм работает только с ней (агрегированной матрицей) до начала следующей итерации, когда вся процедура повторя-ется. Более подробно вся процедура рассматривается ниже. После построения очередной оценки матрицы корреспонденций, используя, опять же, матрицу издержек, происходит расщепление корреспонденций по типам передвиже-ний. Для этого используются модели дискретного выбора, родственные уже описанной выше logit-choice модели. На выходе данного этапа (3-го шага в описанной схеме) полу-чаются матрицы корреспонденций для каждого типа передвижений. Отметим, что нет единой методологии и стандарта, какую из моделей дискретного выбора стоит использовать. Каждая из моделей имеет свои недостатки. Так, например, для модели logit-choice получаемое стохастическое равновесие даже в простейших постанов-ках может сильно отличаться от равновесия Нэша. Также, результаты данной модели очень чувствительны к тому, как задается набор альтернатив для выбора. Например, рас-щепление для дерева выбора (личный транспорт, автобус) и для дерева выбора (личный транспорт, зеленый автобус, красный автобус) будут разными (даже если выбор описыва-ется для одной и той же транспортной системы и вся разница только в том, что во втором случае указан цвет автобуса). Наиболее используемыми на практике являются родствен-ные logit-модели Nested Logit Model и Multinomial Logit Model, а также композитная мо-дель Mixed Logit Model (см. [1]). Важно сказать, что порядок шагов 2 и 3 зависит от того, какой слой спроса описыва-ется, т.е., грубо говоря, от цели поездки и некоторых параметров жителей. Например, слой спроса может определяться как «люди предпенсионного возраста, совершающие поездки из дома на дачу». Иногда слои спроса определяются как цель поездки с учетом пункта от-правления, например «поездка из дома на работу». Выше мы отмечали, что характерное время формирования корреспонденций – годы. Это справедливо для поездок дом – работа и обратно. Однако данный тезис кажется не совсем точным, например, для поездок за по-купками. В этом случае можно предположить, что люди определяют место покупок уже после того, как будет определен тип передвижения, т.е. для данного слоя спроса, шаги 2 и 3 оказывается возможным поменять местами. Наконец, последним этапом (шаг 4) является расчет равновесного распределения по-токов для каждого типа передвижения. Для личного транспорта при этом используется модель Бэкмана. Для общественного транспорта не существует единого подхода к моде-лированию и, как правило, используются композитные модели, включающие элементы моделей дискретного выбора. Стоит лишь отметить, что при численном расчете моделей реального города именно этап расчета равновесного распределения потоков является са-мым затратным по времени. На выходе этого этапа получаются вектора загрузки сети (т.е. потоки по ребрам транспортного графа) и матрица издержек (шаг 5). Шаги 6–8 в приведенной выше схеме отвечают за создание обратной связи в модели, которая позволит учесть взаимное влияние матрицы корреспонденций и матрицы издер-жек. Напомним, что мы использовали матрицу издержек для расчета матрицы корреспон-денций на шаге 2 и матрицу корреспонденций для получения матрицы издержек на шаге 4. Логично требовать, чтобы матрица издержек, подаваемая на вход на шаге 2 и матрица издержек, получаемая на выходе на шаге 5 если не совпадали, то были «близки» по како-му-либо разумному критерию. Критерием остановки служит равенство (с требуемой точностью) средних издержек для матрицы издержек, полученной по модели расчета матрицы корреспонденций, и сред-них издержек, полученных эмпирическим путем. Мы к этому еще вернемся чуть позже. В статьях [23, 50] было показано, что данный критерий остановки в нашей постановке соот-ветствует оценке матрицы корреспонденций методом максимального правдоподобия [51] для описанной далее модели. Пусть имеются данные о реализации некоторой случайной матрицы корреспонден-ций ij R , каждый элемент которой (независимо от всех остальных) распределен по зако-ну Пуассона с математическим ожиданием ij ij M R d , причем верно параметрическое предположение о том, что матрица корреспонденций представляется следующим образом: ij i j ij d A B f С , где ij f С – функция притяжения (часто выбирают exp ij ij f С С ), а матрица из-держек ij С считается известной. Зададимся целью найти оценку ij d при заданной (наблюдаемой) матрице ij R и известной матрице ij С методом максимума правдоподобия (на основе теоремы Фишера) [51]. Точнее говоря, оценивать требуется не саму матрицу ij d , а неизвестные параметры , , A B . Для возможности применять теорему Фишера [51], и таким образом гарантиро-вать хорошие (асимптотические) свойства полученных оценок (в 1-норме), будем считать, Важно заметить, что мы допускаем, следуя В.Г. Спокойному, “model misspecification” [51], т.е., что эти предположения не верны, и истинное распределение вероятностей ij R не лежит в этом семействе. Тогда полученное решение по методу максимума правдоподобия можно интерпретировать, как дающее асимпто-тически (по , 1 n iji j N R ) наиболее близкое (по расстоянию Кульбака – Лейблера) распределение в этом се-мействе к истинному распределению. Другими словами, так полученные параметры – являются “асимптоти-чески наилучшими” оценками параметров проекции (по расстоянию Кульбака – Лейблера) истинного рас-пределения вероятностей на выбранное нами параметрическое семейство. Детали см. в [51]. что число оцениваемых параметров p n и объем выборки , 1 n iji j
N R удовлетворяют следующему соотношению: p N . Из определения распределения Пуассона следует, что вероятность реализации кор-респонденции ij R может быть посчитана как: exp| ! ij Rij ijij ij ij d dP R d R . Функция правдоподобия (вероятность того, что “выпадет” матрица ij R , если значения параметров , , A B ) будет иметь следующий вид: , 1 , 1 expexp, , ! ! ijij RRn n i j ij i j ijij ijij i j i jij ij
A B f С A B f Сd dR A B R R . Нам нужно найти точку , , A B , в которой достигается максимум функции прав-доподобия. Как известно, точка максимума неотрицательной функции (каковой по опре-делению является вероятность) не изменится, если решать задачу максимизации не для исходной функции, а для ее логарифма. Перейдем к логарифму функции правдоподобия: , 1 ln ln ln ln ln ! n i j ij ij i j ij iji j A B f С R A B f С R . Получаем следующую задачу оптимизации:
0, 0,, 1 ln ln ln ln ! max n i j ij ij i j ij ij A Bi j
A B f С R A B f С R . Выпишем условия оптимальности: ln exp 0 n ijj ijji i RB СA A , ln exp 0 n iji ijij j RA СB B , , 1 ln exp 0 n i j ij ij ij iji j A B C С R С . Мы получили n уравнение максимума правдоподобия: exp n ni j ij ijj j A B С R , Легко понять, что максимум не может достигаться на границе. Если допустить, что, скажем, i L равно ну-лю в точке максимума, то поскольку ln i L в этой точке, сдвинувшись немного перпендикулярно гиперплоскости i L внутрь области определения, мы увеличили бы значения функционала – то есть пришли бы к противоречию с предположением о равенстве нулю i L в точке максимума. exp n ni j ij iji i A B С R , , 1 exp 0 n i j ij ij ij iji j A B C С R С . Положим по определению ni ijj L R и nj iji W R , i i i A L A и j j j B W B . Тогда ij i i j j ij d A L B W f С , где i A , j B – структурные параметры (гравитационной) модели. Их рассчитывают с помо-щью простого итерационного алгоритма (метод балансировки = метод простых итераций [6, 18, 19, 29, 30]) по значениям i L , j W следующим образом: i n j j ijj A B W f С , j n i i iji B A L f С . (6) Последнее же уравнение системы уравнений максимума правдоподобия даст нам: , 1 n ij ij ij iji j d С R С или , 1 , 1 n nij ij ij iji j i j R С d С . (7) Замечание 2.
Обратим внимание, что к тем же самым соотношениям можно было прийти (при той же параметрической гипотезе), если вместо предположения: ij R – незави-симые случайные величины, распределенные по законам Пуассона с математическим ожиданием ij ij M R d , считать, что ij R имеют мультиномиальное распределение с параметрами , ij iji j d d . Такой подход представляется более естественным, чем изло-женный выше. Кроме того, поскольку константа строгой выпуклости энтропии в 1-норме равна 1 [13] (неравенство Пинскера, оценивающее снизу расстояние Кульбака – Лейблера с помощью квадрата 1-нормы), то на базе асимптотического представления логарифма функции правдоподобия в окрестности точки максимума [51], можно построить довери- При exp ij ij f С С эту модель называют также энтропийной моделью [18] или моделью А.Дж. Вильсона [6, 17]. Энтропийная модель, использованная нами ранее (см. п. 3), для связи матрицы корреспон-денций и матрицы издержек является частным случаем гравитационной модели при указанном выборе функции притяжения. Точнее, говоря, если бы мы считали, что ij ij
С T не зависит от ij d и ij ij R C f C , то решение задачи (2) в точности давало бы гравитационную модель. При этом i A , j B выражались бы через множители Лагранжа (двойственные переменные), соответственно, Li , Wj . Система (6) при этом получалась бы при подстановке решения задачи (2), зависящего от этих 2 n неизвестных пара-метров, в ограничения (A) (которых тоже 2 n ), точнее говоря, независимых параметров и уравнений было бы 2 n –1 [6]. тельный интервал для разности оценок и оцениваемых параметров в (наиболее естествен-ной) 1-норме. Соответственно, если критерий остановки (7) не выполняется, то происходит пере-расчет матрицы корреспонденций с учетом обновленной матрицы издержек. Калибровку можно проводить в случае, когда имеется дополнительная информа-ция о реальных издержках на дорогах. Для этого применяется следующий алгоритм. Пусть * l С – средние издержки на проезд в системе (известны, например, из опросов) для l -го слоя спроса [1], например, для трудовых миграций. Алгоритм [52]: 1. Рассчитываем l l С , m ; 2. Рассчитываем ,, 1 n nmij l i j d – матрицу корреспонденций при ml l ; 3. Пересчет «4-стадийной модели»; 4.
Рассчитываем ml С – средние издержки на проезд, соответствующие матрице кор-респонденций ,, 1 n nmij l i j d ; 5. При m проверяем условие: ml l С С (критерий остановки); 6. Рассчитываем l С по l ll l СС (при m ) и полагаем * 1 * 11 1 m m m ml l l l l lml m ml l C C C CC C (при m ); 7. Переходим на шаг 2. Данный алгоритм (и его вариации) дает оценку коэффициента при известных средних издержках в сети и является наиболее часто применяемым на практике [1]. Критерий остановки выбран именно таким по следующей причине. Если критерий остановки из пункта 5) выполняется, то, подставляя ml l C C в формулу расчета ml на шаге 6, получаем: * * * 11 1* m m ml l l l l lm ml lml l C C C CC C . Полученное значение параметра * C «соответствует» средним издержкам * C , наблю-даемым «в жизни». Сходимость алгоритма и монотонная зависимость C (следова-тельно, и взаимно-однозначное соответствие) между средними издержками c и значением параметра были показаны в работе [53]. Стоит, однако, отметить, что при численной реализации алгоритма возникает мно-жество проблем. В частности, при «плохом» выборе точки старта или при плохой калиб-ровке параметров функций издержек возникают ситуации, в которых алгоритм требует вычисления экстремально больших чисел и превышает размер доступной памяти даже на самых современных машинах (кластерах). Другой проблемой является отсутствие оценки скорости сходимости алгоритма. За-частую, при моделировании критерий остановки устанавливается жестко. Например, про-писывается, что алгоритм калибровки должен быть использован не более 20 раз (или другое, разумное, по мнению модельера, количество итераций). При этом отсутствует четкий критерий качества оценок, полученных таким образом. Еще одной проблемой описанного подхода является высокая чувствительность к па-раметрам модели с одной стороны, и невозможность учесть реальные подтвержденные данные на отдельных элементах сети с другой. Другими словами, допустим нам известны величины потоков на той или иной дороге каждый день, к сожалению, данную информа-цию использовать в такой модели не представляется возможным. Модель стабильной динамики
Приведем основные положения модели стабильной динамики, следуя [6, 7]. В рам-ках модели предполагается, что водители действуют оппортунистически, т.е. выполнен первый принцип Вардропа. Рассмотрим ориентированный граф , Г V E . В модели каж-дому ребру e E ставятся в соответствия параметры e f и e t . Они имеют следующую трактовку: e f – максимальная пропускная способность ребра e , e t – минимальные вре-менные издержки на прохождение ребра e . Таким образом, сама модель задается графом , , , Г V E f t , где ,..., TE f f f , ,..., TE t t t . Пусть f – вектор распределения пото-ков по ребрам, инициируемый равновесным распределением потоков по маршрутам, а t – вектор временных издержек, соответствующий распределению f . Тогда, если транспорт-ная система находится в стабильном состоянии, всегда выполняются неравенства f f и t t . При этом считается, что, если поток по ребру e f меньше, чем максимальная пропу-скная способность ребра e f , то все автомобили в потоке двигаются с максимальной ско-ростью, а их временные издержки e t минимальны и равны e t . Если же поток по ребру e f становится равным пропускной способности ребра e f , то временные издержки водителей e t могут быть сколь угодно большими. Это удобно объяснить следующим образом. До-пустим, на некоторое ребро e стало поступать больше автомобилей, чем оно способно обслужить. Тогда на этом ребре начинает образовываться очередь (пробка). Временные издержки на прохождение ребра e t складываются из минимальных временных издержек e t и времени, которое водитель вынужден отстоять в пробке. При этом, очевидно, если входящий поток автомобилей на ребро e не снизится до максимально допустимого уров-ня (пропускной способности ребра), то очередь будет продолжать расти и система не бу-дет находиться в стабильном состоянии. Если же в какой-то момент входящий на ребро e поток снизится до уровня пропускной способности ребра, то в системе наступит равнове-сие. При этом пробка на ребре e (если входящий поток e f будет равен e f ) не будет расса-сываться, т.е. временные издержки так и останутся на уровне e t ( e e t t ). Рассмотрим это на примере из статьи [7]. Пример 1.
Рассмотрим (в рамках модели стабильной динамики) граф , , ,
Г V E t f (см. рис. 2). Пункты 1 и 2 – потокообразующая пара. При этом выполнено: d – поток из 1 в 2, up down t t . Если выполнено up d f , то все водители будут использовать ребро up, причем пробка образовываться не будет, так как пропускная способность ребра больше, чем количество желающих проехать (в единицу времени) водителей. В момент, когда up d f возможности ребра up будут использоваться на пределе. Если же в какой-то мо-мент величина f станет больше up f , то на ребре up начнет образовываться пробка. Проб-ка будет расти до тех пор, пока издержки от использования маршрута up с не сравняются с издержками от использования маршрута down . В этот момент оставшаяся часть начнет использовать маршрут down . Если же корреспонденция из 1 в 2 превысит суммарную пропускную способность ребер up и down , то пробки будут расти неограниченно (входя-щий поток на ребро будет больше, чем исходящий, соответственно количество автомоби-лей в очереди будет расти постоянно), т.е. стабильное распределение в системе никогда не установится. Более подробно рассмотрение данной задачи (и модели) стоит смотреть в работе [7]. ■ Рассмотрим другой модельный пример из статьи [7]. Пример (Парадокс Браесса). Задан граф , , ,
Г V E t f (см. рис. 3). При этом вы-полнено: t час, t минут, t минут; (1,3) и (2,3) – потокообразующие пары, d авт/час и d авт/час – соответствующие корреспонденции. Пусть про-пускные способности всех ребер одинаковы и равны 2000 авт/час. Тогда равновесие будет такое: 500 авт/час из 1 будут направляться в 3 через 2, а 1000 авт/час будут ехать напря-мую (для выезжающих из 2 никаких альтернатив нет). При этом все водители, выезжаю-щие из 1, потратят 1 час, а водители, выезжающие из 2, потратят 45 минут. Таким обра-зом, водителям, едущим из 2 в 3 выгодно, чтобы ребро 1–2 отсутствовало, в то время как для водителей, которые едут из 1 в 3, наличие ребра 1–2 безразлично. Т.е., другими сло-вами, если бы мы имели власть запретить проезд по ребру 1–2, то часть водителей выиг-рала бы от такого решения, и никто бы не проиграл. Интересно заметить, что для модели Бэкмана это не выполняется. Действительно, в модели Бэкмана, как и для модели ста-бильной динамики, издержки для водителей, следующих из 1 в 3 равны издержкам на ребре 1–3. Однако они монотонно возрастают от потока на данном ребре. Если бы мы за-претили проезд по ребру 1–2, то поток на 1–3 увеличился бы, следовательно, возросли бы и издержки на ребре 1–3. Другими словами, улучшение ситуации для водителей, следую-щих из 2 в 3, привело бы к ухудшению ситуации для водителей, следующих из 1 в 3. ■ Рис. 2
Рис.3
Введем ряд новых обозначений. Пусть , w i j – потокообразующая пара (источ-ник – сток) графа , , , Г V E t f , w P – множество соответствующих w маршрутов, а t – установившийся на графе вектор временных издержек. Тогда временные издержки, соот-ветствующие самому “быстрому” (наикратчайшему) маршруту из w P равны: min w w ep ep P e E T t t . Функция w T t зависит от вектора временных издержек t . Важно за-метить, что функция w T t и еѐ супердифференциал эффективно вычисляются, например, алгоритмом Дейкстры [54, 55] или более быстрыми современными методами [56]. Пусть корреспонденция потокообразующей пары w равна w d . Тогда, если * f явля-ется равновесным распределением потоков для заданного графа , , , Г V E t f , а * t – соот-
1 2 up down ветствующий равновесному распределению вектор временных издержек, то * * ww W f f , где * w f – вектор распределения потока, порождаемого потокообразующей парой w ( w OD ). При этом * w f удовлетворяет * w w w f d T t , где w T t – супердифференциал, который можно посчитать с помощью теоремы Милю-тина–Дубовицкого [14] используя структуру функции w T t . Следовательно, по теореме Моро–Рокафеллара [14] * w ww W f d T t . Остается вопрос: как искать равновесный век-тор временных издержек * t . Теорема 2 [7] . Распределение потоков * f и вектор временных издержек * t являют-ся равновесными для графа , , , Г V E t f , заданного множества потокообразующих пар W и соответствующих им потоков w d , тогда и только тогда, когда * t является реше-нием следующий задачи вогнутой оптимизации (максимизация количества свободно движущихся автомобилей, то есть автомобилей не стоящих в пробках): max , w wt t w W d T t f t t , (8) где * * f f s , где * s – (оптимальный) вектор двойственных множителей для ограниче-ний t t в задаче (8) или, другими словами, решение двойственной задачи. Схема доказательства.
Резюмируем далее основные постулаты модели стабиль-ной динамики: 1. e e t t , e e f f , e E ; 2. e e e e t t f f , e E ; 3. w ww W f d T t (принцип (Нэша – )Вардропа). Наша цель, подобрать такую задачу выпуклой (вогнутой) оптимизации, решение ко-торой давало бы пару , t f , удовлетворяющую этим постулатам. С задачей выпуклой оп-тимизации намного удобнее работать (разработаны эффективные способы решения таких задач [13]), чем с описанием 1 –
3. Если бы мы могли ограничиться только п. 3, то тогда этот пункт можно было бы переписать max , w wt w W d T t f t t , (9) но есть еще пп. 1, 2. Подсказка содержится в п. 2, который удобно понимать как условие дополняющей нежесткости [14] ограничения t t (в задаче (9)) с множителями Лагранжа s f f . Причем, нет необходимости оговаривать дополнительно, что f f , по-скольку множители Лагранжа к ограничениям вида неравенство автоматически неотрица-тельны. Таким образом, мы приходим к (8). Все же необходимо оговориться, что полу-чившаяся задача (8) хотя и является довольно простой задачей (не сложно заметить, что это просто задача линейного программирования (ЛП), записанная в более компактной форме, действительно:
0; ; max , ; , , ; w w ep e w w wt T C e E w W C f t t T t p P w W C d T ), но требуется также найти двойственные множители (чтобы определить f ). □ Задача (8) имеет (конечное) решение тогда и только тогда, когда существует хотя бы один вектор потоков f f , соответствующий заданным корреспонденциям. Другими словами, существует способ так организовать движение, чтобы при заданных корреспон-денциях не нарушались условия f f . В противном случае, равновесного (стационарно-го) режима в системе не будет, и со временем весь граф превратится в одну большую пробку, которая начнет нарушать условия заданных корреспонденций, не позволяя новым пользователям приходить в сеть с той интенсивностью, с которой они этого хотят. В отличие от модели Бэкмана, в которой при монотонно возрастающих функциях за-трат на ребрах равновесие (по потокам на ребрах) единственно, в модели стабильной ди-намики это может быть не так. Хотя типичной ситуацией (общим положением) будет единственность равновесия, поскольку поиск стабильной конфигурации эквивалентен ре-шению задачи ЛП, все же в определенных “вырожденных” ситуациях может возникать не единственность. Скажем, если в примере 1 (см. рис. 2) up f d . Возникает вопрос: как выбрать единственное равновесие, то которое реализуется? Один из ответов имеется в [7]: следить за динамикой во времени d t , а именно за T up d t f dt . Другой ответ связан с прямым осуществлением для данного примера предельного перехода, опи-санного в следующем пункте. По сути, с помощью этого и следующего пункта мы установим, что если , 0 ,, , e e ee e e e e t f ff t f f
0, 0 , e e e e e d f df f f x – равновесное распределение потоков по путям в модели Бэкмана при функциях за-трат на ребрах e e f , то , e e e f x t , e e f x f где пара , t f – равновесие в модели стабильной динамики с тем же графом и матрицей корреспонденций, что и в модели Бэкмана, и с ребрами, характеризующимися набором , t f из определения функций e e f . Численно решать задачу (1) можно различными способами (см., например, [40]). Связь модели стабильной динамики с моделью Бэкмана
Получим модель стабильной динамики в результате предельного перехода из модели Бэкмана. Для этого будем считать, что e e e e e f t f f . Перепишем исходную задачу поиска равновесного распределения потоков (здесь используются обозначения: * e e t – сопряженная функция к e e f ): * *, , dom min : , min max : , e e e e e e e ef x f x te E e E f f x x X f t t f x x X * *,dom max min : , e e e ef xt e E e E f t f x x X t . Найдем * e ee E t : * 0 0 sup sup 1 ln 1 e ee e f fe e e e e e e ef f t t f z dz t f t z f dz sup ln 1 ee fe e e e ef t t f t z f dz . Из принципа Ферма [14] найдем e f , доставляющее максимум: ln 1 0 e fe e e e ee t t f t z f dzf exp 1 e e e ee t t f ft e ee e e t tf f t . Подставляем в * e e t :
10 1 ln 1 ln e e e f f fe e e e e e e e e e t t f t z f dz t t f t f z dz e e ee e e e e e e e f f ft t f t f f f f e e e e e e e e e t t f f f t t f t e ee e e e e e e e e e e t tt t f f t t t f f t t . Возвращаясь к исходной задаче имеем: * *,dom max min : , e e e ef xt e E e E f t f x x X t * max , 1 exp e ew w e et w W e E e t td T t f t t f t t max , w wt t w W d T t f t t . Возможность поменять местами порядок взятия максимума и минимума следует из теоремы фон Неймана о минимаксе [15]. Выбор именно функции e e e e e f t f f не является определяющим. Вместо этой функции может быть взят любой другой гладкий внутренний барьер области e e f f , например, ee e e e e ff t f f – такую функцию вполне естественно использовать при поиске равновесного распределения пользователей сети общественного транспорта [7]. Найдем * e e t : * 0 sup 1 sup ln 1 ee e f ee e e e e e e e e e e ef fe e fzt t f t dz t t f t f t ff z f . Вновь выписывая условия оптимальности первого порядка имеем: ln 1 0 e ee e e e e e e e e e ee e e e f ft t f t f t f t t t tf f f f ee e e e tf f t t . Подставляя в * e e t , имеем: * e e ee e e e e e e e ee e e e e e t t tt t t f t f t ft t t t t t ln 1 ee e e e e e e tt t f t f t t . В итоге получаем: * *,dom max min : , e e e ef xt e E e E f t f x x X t * max , ln 1 max , e ew w e e w wt tt w W e E w We t td T t f t t f t d T t f t tt . Наконец, рассмотрим третий вариант выбора функции e e f : ee e e e ff t f . Функции такого вида называются BPR-функциями и наиболее часто применяются при моделировании. Так, при использовании модели Бэкмана обычно полагают , а значение параметра варьируется от 0.15 до 2 и определяется типом дороги [1]. Найдем * e e t : sup 1 sup e ee e f fe e e e e e e e ef fe e z zt t f t dz t t f t dzf f
11 1 sup 1 e ee e e ef e ft t f t f . Аналогично рассуждая: e ee e e e e e ee e e f ft t f t t t tf f f e ee e e t tf f t . Тогда
11* 1 sup 1 1 e e ee e ee e e e e e ef ee t tf t tt t t f t f tf . В итоге получаем: * max max ,1 e ee ew w e w wt tt w W e E w We t tt td T t f d T t f t tt . Замечание 3.
Естественно в контексте всего написанного выше теперь задаться во-просом: а можно ли получить модель стабильной динамики эволюционным образом, то есть подобно тому, как в конце п. 4 была эволюционно проинтерпретирована модель Бэк-мана. Действительно, рассмотрим логит динамику (с T ) или, скажем, просто ими-тационную логит динамику [9]. Предположим, что гладкие, возрастающие, выпуклые функции затрат на всех ребрах e e f при превращаются в “ступеньки” (много-значные функции) , 0, , e e ee e e e e t f ff t f f . Согласно п. 4 равновесная конфигурация при таком переходе должна находиться из решения задачи ,0 min . e f e f x x Xe E z dz Считая, что в равновесии не может быть e e f (иначе, равновесие просто не дости-жимо, и со временем весь граф превратится в одну большую пробку, см. конец п. 6), мож-но не учитывать в интеграле вклад точек e f (в случае попадания в промежуток интегри-рования), то есть переписать задачу следующим образом , ,0 min min , e e f e e eff x x X f x x Xe E e Ef f t z dz f t где
0, 0, e ef e z fz z f . Мы получили задачу линейного программирования. Интересно заметить, что двойствен-ные множители к ограничениям f f имеют размерность (“физический смысл”) времени (см. интерпретацию двойственных множителей из п. 3). Чему равно это время сразу может быть не ясно из решения только что выписанной задачи линейного програм-мирования. Но если перейти к двойственной задаче, то мы получим уже рассматриваемую нами ранее задачу (9) из п. 6. Причем двойственные множители связаны с временами проезда ребер t следующим образом: t t , то есть, действительно, получают со-держательную интерпретацию времени, потерянного на ребрах (дополнительно к времени проезда по свободной дороге) из-за наличия пробок. Еще одним подтверждением только что сказанному является то, что если e e f f , то на ребре e пробка и время прохождения этого ребра e e t t ( ), а если пробки нет, то e e f f и e e t t ( ). То есть имеют ме-сто условия дополняющей нежесткости. Из данного замечания становится ясно, как оптимально назначать платы за проезд в модели стабильной динамики. Переведем предварительно время в деньги. Назначая пла-ты за проезд по ребрам графа в соответствии с вектором , получим, что равновесное распределение пользователей транспортной сети по этой сети будет описываться парой , f t , что, очевидно, лучше, чем до введения плат , f t . Действительно, задачу поиска равновесных потоков f : , min e ef x x X e Ef f f t можно переписать с помощью метода множителей Лагранжа, следующим образом , min . e e e e ef x x X e E f t f f Другими словами, у этих двух задач одинаковые решения f . Но t t , поэтому тот же самый вектор f будет доставлять решение задаче , min e ef x x X e E f t . Поскольку мы знаем, что f f , то f будет доставлять решение также и этой задаче , min e ef x x X e Ef f f t . Таким образом, один и тот же вектор f отвечает оптимальному (с точки зрения социаль-ного оптимума) распределению потоков в графе с ребрами, взвешенными согласно векто-рам t и t . Более того, не сложно понять, что все это остается верным не только для двух векторов t и t , но и для целого “отрезка” векторов: t t t , . К сожа-лению, если не взимать платы за проезд, то всегда реализуется сценарий , то есть вектор затрат будет t (объяснению причин были посвящены пп. 6 и 7), но если мы взима-ем платы согласно вектору t t , то вектор реальных затрат (не учитывающих платы) будет t t t . Следовательно, оптимально выбирать , то есть платы согласно t t . Собственно, всю эту процедуру (назначения плат) можно делать адаптивно: посте-пенно увеличивая плату за проезд на тех ребрах, на которых наблюдаются пробки. И де-лать это нужно до тех пор, пока пробки не перестанут появляться. Учет расщепления потоков по способам передвижений
Распространим модель стабильной динамики на тот случай, когда (все) пользователи (игроки) транспортной сети имеют возможность выбирать между двумя альтернативными видами транспорта: личным и общественным [49]. Соответственно, теперь у нас имеется информация о , , , л л лл
Г V E t f – для личного транспорта и , , , о о оо
Г V E t f – для общественного транспорта. Аналогично рассматривается общий случай. Имеет место следующий результат, получаемый аналогично [7].
Теорема 3 . Распределение потоков * , л о f f f и вектор временных издержек * , л о t t t являются равновесными для графа , , , Г V E t f , заданного множества пото-кообразующих пар W и соответствующих им потоков w d , тогда и только тогда, когда * t является решением следующий задачи выпуклой оптимизации (в дальнейшем для нас будет удобно писать эту задачу как задачу минимизации, а не максимизации, как рань-ше): min , , min , л ло о л л л о о о л л о оw w wt t w Wt t f t t f t t d T t T t , (10) где л л л f f s , о о о f f s , а л s , о s – (оптимальные) векторы двойственных множи-телей для ограничений л л t t , о о t t в задаче (10) или, другими словами, решение двой-ственной задачи. Если мы хотим учитывать возможность пересаживания пользователей сети в пути с личного транспорта на общественный (и наоборот), то выражение min , л л о оw w
T t T t нужно будет немного изменить. Мы не будем здесь вдаваться в детали, скажем лишь, что с точки зрении всего дальнейшего это не принципиально. Более того, хотя на время рабо-ты алгоритма это и скажется (время увеличится), но не критическим образом, поскольку решение задачи о кратчайшем маршруте, которое возникает на каждом шаге субградиент-ного спуска, естественным образом (небольшим раздутием графа) обобщается на случай когда есть несколько весов ребер, отвечающих разным типам транспортных средств, и в вершинах графа есть затраты на пересадку (изменение транспортного средства), при усло-вии наличия возможности еѐ осуществления. Отметим, что единого подхода для моделирования общественного транспорта пока не существует. Указанный нами метод соответствует подходу, когда предполагается, что пассажиры выбирают только “оптимальные стратегии”, т.е. соответствует концепции рав-новесия по Нэшу. Другой, альтернативный подход, который сейчас чаще используется на практике, следует концепции «стохастического равновесия». В нем предполагается, что пассажиры выбирают каждый из возможных маршрутов с некоторой вероятностью, зави-сящей от ожидаемых издержек в сети и ожидаемого времени ожидания соответствующего маршрута на остановочной станции. Об этом немного подробнее будет рассказано в п. 10. Обратим внимание на то, что общественный транспорт все же более естественно описывать моделью Бэкмана, а не моделью стабильной динамики. Во всяком случае, к та- кому выводу склоняются авторы модели стабильной динамики [7]. В этой связи далее приводится смешанная модель, в которой личный транспорт описывается моделью ста-бильной динамики, а общественный – моделью Бэкмана (см. п. 7): min , , ln 1 min , л ло о о ол л л о о о о о л л о оe ee e w w wоt t e E w Wet t t tf t t f t t f t d T t T tt , где л л л f f s , oo o ee e o oe e tf f t t , л s – (оптимальный) вектор двойственных множителей для ограничений л л t t . Несложно распространить все проводимые в следующих пунктах рассуждения именно на такую версию модели стабильной динамики с учетом расщепления по типам передвижений. Однако мы не будем здесь этого делать. Укажем лишь, что для разработки эффективного способа решения возникающих задач оптимизации потребуется привлекать прямо-двойственные субградиентные спуски для задач композитной оптимизации [57]. Трехстадийная модель стабильной динамики
Объединим теперь задачи (2) и (10) в одну задачу: , 1 , , 1 1 1 1 11, 0 min max ln w L W n ij iji j n n n n nL Wij ij i i ij j j iji j i j j id d d d l d d , 1 min , , min , л ло о nл л л о о о л л о оij ij ijt t i jt t f t t f t t d T t T t , 1 , 1 , 11, 0, min max ln min , л л nо о ij iji jL W n n л л о оij ij ij ij ijt t i j i jd dt t d d d T t T t , 1 1 1 w , , n n nL W L W л л л о о оij i j i i j ji j i j d l f t t f t t , 1, min ln exp min , л ло оL W n л л о о L Wij ij i jt t i jt t T t T t w , , n nL W л л л о о оi i j ji j l f t t f t t , (11) причем exp min , л л о о L Wij ij ij i j d Z T t T t , где Z – ищется из условия нормировки, * , л о f f f , л л л f f s , о о о f f s , а л s , о s – (оптимальные) векторы Отметим, что все приводимые далее выкладки (а также выкладки следующего пункта) можно провести, отталкиваясь не от задачи (2), а от еѐ упрощенного варианта, описанного в сноске 9. двойственных множителей для ограничений л л t t , о о t t в задаче (11). Таким образом, все что осталось сделать, это решить задачу негладкой выпуклой оптимизации (11) прямо-двойственным методом. Заметим при этом, что на переменные л t , о t – ограничения сверху возникают из вполне естественных соображений. Пусть f максимально возможный поток на ребре, поскольку нас интересует оценка сверху, то можно считать t t , стало быть, f f . Представим себе самую плохую ситуацию: все ребро стоит в пробке. Пусть длина ребра L , а средняя длина автомобиля l , число полос r . Тогда t Lr lf t не может превышать нескольких часов. Задачу (11) можно решать, напри-мер, прямо-двойственным универсальным композитным методом треугольника [58] или методом из работ [59, 60]. Отметим, что если известна информация о потоках по ряду дуг л лe e f f , л e ; о оe e f f , о e , то эту информацию можно “зашить” в модель (ЗС) подобно тому, как это делается в работе [7]: а именно брать минимум по множеству л лe e t t , \ л e E , лe t , л e , о оe e t t , \ о e E , оe t , о e , а слагаемые , , л л л о о о f t t f t t стоит заменить на (параметры лe t , л e и оe t , о e – неизвестны, но они и не нужны для рас-четов, поскольку входят в виде аддитивных констант в функционал) \ \ л л о о л л л л л л о о о о о оe e e e e e e e e e e ee E e e E e f t t f t t f t t f t t . Стохастический вариант трехстадийной модели ста-бильной динамики
Рассуждая аналогично тому, как мы делали выше, можно обобщить результаты п. 9 на случай, когда вместо модели стабильной динамики используется еѐ стохастический ва-риант (с параметром T ) [6, 38, 61]: , 1, min ln exp , л ло оL W л оn L Wij i jt t i jt t t tT T T w , , n nL W л л л о о оi i j ji j l f t t f t t , (12) где , , , ln exp exp Л Оi j i j л о л оij ep e ep ee E e Ep P p P t t t t . Причем здесь, также как и в предыдущем пункте, exp , л о L Wij ij i j d Z T t T t T , где Z – ищется из условия нормировки, * , л о f f f , л л л f f s , о о о f f s , а л s , о s – (оптимальные) векторы двойственных множителей для ограничений л л t t , о о t t в задаче (11). Таким образом, все что осталось сделать, это решить задачу гладкой выпуклой оптимизации (12) прямо-двойственным методом, например, [58–60]. Мы не бу-дем здесь подробно описывать возможные способы решения. Обратим только внимание на то, что задача вычисления значений и градиента функции , л о t t – вычислительно сложная, и, на первый взгляд, даже кажется бесперспективной из-за потенциально экспо-ненциально большого числа возможных маршрутов. Однако с помощью “аппарата харак-теристических функций на ориентированных графах” [6, 61, 44] и быстрого автоматиче-ского дифференцирования [62, 63] пересчитывать значения функции , л о t t и ее гради-ента можно довольно эффективно – см. алгоритм из работ [6, 61, 44], который вырождает-ся при T в алгоритм Беллмана–Форда [54–56]. Отметим, что при этом предельном переходе модель п. 10 перейдет в модель п. 9. Отметим также, что все сказанное здесь переносится и на функции , л оij t t более общего вида, соответствующие различным иерархическим способам выбора (типа Nested Logit) [38, 41]. Например, “практически бесплатно” можно сделать такую замену: , л оij t tT T T , , ln exp ln exp exp ln exp Л Оi j i j л оe eep epe E e Ep P p P t tT TT T . Калибровка модели стабильной динамики
О практическом использовании модели стабильной динамики написано, например, в [64] и немного в [7]. В этом пункте мы сконцентрируем внимание на потенциальных плюсах описанной модели с точки зрения еѐ калибровки. Далее мы опускаем нижней индекс e . Способ оценки t довольно очевиден: t определяется длиной участка (ребра) и типом ребра (в сельской местности, в городе, шоссе). Вся эта информация обычно бывает доступной. С оценкой f немного посложнее. Пусть в конце дуги, состоящей из r полос, стоит светофор, который пускает поток с этой дуги долю времени . Пусть max q авт час – максимально возможное значение потока по одной полосе (это понятие не совсем корректное, но в первом приближении, им можно пользоваться [6], и оно довольно универсально). Тогда [6] max f rq . Тут имеется важный нюанс. Во время зеленой фазы (в зависимости от того, что это за фаза, скажем, движение прямо и налево или движение только направо) “работают” не все полосы: ... l l f r q r q , где l – число фаз, “пускающих” поток с рассматриваемой дуги, k – доля времени отводимое фазе k , k r – эффективное число полос рассматриваемой дуги, задействованных на фазе k . Раздобыть информацию по работе светофоров как правило не удается. Однако, существует определенные регламенты, согласно которым и устанавливаются фазы работы светофора. Поскольку все довольно типизировано, то часто бывает достаточно иметь информацию только о полосности дорог. Такая информация с 2012 года уже включается в коммерческие системы ГИС. К сожалению, в реальных транспортных сетях в часы пик бывают пробки, которые приводят к тому, что пропускная способность ребра определяется пропускной способностью не данного ребра, а какого-то из впереди идущих (по ходу движения) ребер. Другими словами, пробка с ребра полностью “заполнила” это ребро и распространилась на ребра, входящие в это ребро. В таких ситуациях f нужно считать исходя из ограничений на пропускную способность на впереди идущих ребрах. При этом в выборе разбиения транспортного графа на ребра и в определении на этих ребрах значений f , t стоит исходить из того, чтобы в типичной ситуации пробка если и переходила с ребра на ребро, то, желательно, чтобы это происходило без изменения пропускной способности входящего ребра. Этого не всегда можно добиться, поскольку часто приходится осуществлять разбиение без особого произвола, исходя из въездов/съездов, перекрестков. В таких случаях, формула ... l l f r q r q является лишь оценкой сверху для “среднего” (типичного) значения, которое надо подставлять в модель (часть этого бремени придется переносить и на t , увеличивая его). Заметим, что также как и для обычных многостадийных моделей, для калибровки предложенной модели необходимо использовать один и тот же промежуток времени (скажем, обеденные часы) каждого типового дня (например, буднего) – в зависимости от целей. Кроме того, для Москвы в утреннее часы пик значения потоков существенно не стационарные, и в течение час они, как правило, меняются сильно. Вместе с этим среднее время в пути оказывается больше часа. Таким образом, возникает вопрос: что понимается, например, под равновесным распределением потоков f ? Ответ: “средние значения” нуждается в пояснении. Средние значения не только по дням, но и по исследуемому промежутку времени (в несколько часов) внутри каждого дня. Как следствие получаем, что выводы, сделанные по предложенной модели, нельзя, например, напрямую использовать для краткосрочного прогнозирования ситуации на дорогах или адаптивного управления светофорной сигнализацией. Таким образом, модель работает и выдает не реальные данные, хотя многие переменные модели и обозначают реальные физические параметры транспортного потока, а лишь некоторые средние (агрегированные) показатели, которые, тем не менее, многое могут сказать о ситуации на дорогах. В данной работе была предложена модель, описывающая равновесие в транспортной сети с точки зрения макро масштабов времени (месяцы). Для исследования поведения транспортного потока внутри одного дня требуются микро модели. Контекст, в котором такие модели используются, часто связан с необходимостью краткосрочного прогнозиро-вания (на несколько часов вперед) и оптимального управления, например, светофорами. Как правило, в таких микро моделях численно исследуется начально-краевая задача для нелинейных УЧП (системы законов сохранения), в которой начальные условия имеются в наличии, а краевые условия (характеристики источников и стоков во времени, матрицы перемешивания в узлах графа транспортной сети) определяются исходя из исторической информации. Однако в последнее время в Москве все чаще можно слышать предложения о том, чтобы максимально информировать участников дорожного движения с целью луч-шей маршрутизации. Такая полная информированность приводит к необходимости опре-делять, скажем, матрицы перемешивание не из (и не только из) исторической информа-ции, но и исходя из равновесных принципов, заложенных в модели Бэкмана и стабильной динамики. Причем нам представляется, что модель стабильной динамики подходит на много лучше для этих целей (мотивация имеется в работе [7], в которой на простом при-мере показывается, как возникает равновесная конфигурация модели стабильной динами-ки из внутредневной динамики водителей). Как отмечалось в работе [7], за исключением модельных примеров (рис. 2), очень сложной с вычислительной точки зрения представля-ется задача описания динамического режима функционирования модели, имеющей в сво-ей основе модель стабильной динамики (или какую-то другую равновесную модель). Бо-лее того, пока, насколько нам известно, не было предложено ни одной более менее обос-нованной модели такого типа (иногда такие модели называют моделями динамического равновесия [1]). Здесь мы лишь укажем на одно, на наш взгляд, перспективное направле-ние: объединить модель стабильной динамики с микромоделью CTM К. Даганзо [6] в со-временном ее варианте [65]. СПИСОК ЦИТИРОВАННОЙ ЛИТЕРАТУРЫ Ortúzar J . D ., Willumsen L . G . Modelling transport. JohnWilley & Sons, 2011. Beckmann M ., McGuire C . B ., Winsten C . B . Studies in the economics of transportation. RM-1488. Santa Monica: RAND Corporation, 1955. 3. Sheffi Y.
Urban transportation networks: Equilibrium analysis with mathematical program-ming methods. N.J.: Prentice–Hall Inc., Englewood Cliffs, 1985. 4.
Стенбринк П.А.
Оптимизация транспортных сетей. М.: Транспорт, 1981. 5.
Patriksson M.
The traffic assignment problem. Models and methods. Utrecht, Netherlands: VSP, 1994. 6.
Гасников А.В., Кленов С.Л., Нурминский Е.А., Холодов Я.А., Шамрай Н.Б.
Nesterov Y., de Palma A.
Stationary Dynamic Solutions in Congested Transportation Net-works: Summary and Perspectives // Networks Spatial Econ. 2003. № 3(3). P. 371–395. 8.
Sandholm W.H.
Evolutionary implementation and congestion pricing // Review of Economic Studies. 2002. V. 69. P. 81–108. 9.
Sandholm W.
Population games and Evolutionary dynamics. Economic Learning and Social Evolution. MIT Press; Cambridge, 2010. 10.
Ben-Tal A., Ghaoui L.El., Nemirovski A.
Robust optimization. Princeton University Press, 2009. 11.
Nesterov Y.
Stable traffic equilibria: properties and applications // Optimization and Engi-neering. 2000. V.1.P.29-50. 12.
Арнольд В.И., Афраймович В.С., Ильяшенко Ю.С., Шильников Л.П.
Теория бифурка-ций–1. Динамические системы–5. Современные проблемы математики. Фундаменталь-ные направления. Т. 5. М.: ВИНИТИ, 1986. С. 5–218. 13.
Нестеров Ю.Е.
Введение в выпуклую оптимизацию. М.: МЦНМО, 2010. 14.
Магарил-Ильяев Г.Г., Тихомиров В.М.
Выпуклый анализ и его приложения. М.: УРСС, 2011. 15.
Френкин Б.Р.
Теорема Неймана о минимаксе – общеизвестная и неизвестная // Матем. просв., сер. 3. № 9. М.: МЦНМО, 2005. С. 78–85. 16.
Sion M.
On general minimax theorem // Pac. J. Math. 1958. V. 8. P. 171–176. 17.
Вильсон А.Дж.
Энтропийные методы моделирования сложных систем. М.: Наука, 1978. 18.
Швецов В.И.
Математическое моделирование транспортных потоков // Автоматика и телемеханика. 2003. № 11. С. 3–46.
Попков Ю.С.
Теория макросистем: Равновесные модели. М.: УРСС, 2013. 20.
Гасников А.В ., Гасникова Е.В.
Об энтропийно-подобных функционалах, возникающих в стохастической химической кинетике при концентрации инвариантной меры и в ка-честве функций Ляпунова динамики квазисредних // Математические заметки. 2013. Т. 94. № 6. С. 816–824. arXiv:1410.3126 21.
Гасников А.В., Гасникова Е.В., Мендель М.А., Чепурченко К.В.
Эволюционные выводы энтропийной модели расчета матрицы корреспонденций // Математическое моделиро-вание. 2016. Т. 28. № 4. С. 111–124. arXiv:1508.01077 22.
Босс В . Лекции по математике. Т. 7. Оптимизация: Учебное пособие. М.: КомКнига, 2010. 23.
Sen A.
Maximum likelihood estimation of gravity model parameters //
Journal of Regional Science. 1986. V.26. № 3. P. 461–474. 24.
Боровков А.А.
Эргодичность и устойчивость случайных процессов. М.: УРСС, 1999. 25.
Jaynes E.T.
Probability theory. The logic of science. Cambridge: Cambridge University Press, 2003. 26.
International workshops on Bayesian inference and maximum entropy methods in science and engineering. AIP Conf. Proceedings (holds every year from 1980). 27.
Kapur J.N.
Maximum – entropy models in science and engineering. John Wiley & Sons, Inc., 1989. 28.
Golan A., Judge G., Miller D.
Maximum entropy econometrics: Robust estimation with li-mited data. Chichester, Wiley, 1996. 29.
Fang S.-C., Rajasekera J.R., Tsao H.-S.J.
Entropy optimization and mathematical program-ming. Kluwer’s International Series, 1997. 30.
Гасникова Е.В.
Двойственные мультипликативные алгоритмы для задач энтропийно-линейного программирования // ЖВМ и МФ. 2009. Т. 49 № 3. С. 453–464. 31.
Гасников А.В., Гасникова Е.В., Нестеров Ю.Е., Чернов А.В.
Об эффективных числен-ных методах решения задач энтропийно-линейного программирования // ЖВМ и МФ. 2016. Т. 56. № 4. С. 523–534. arXiv:1410.7719 32.
Аникин А.С., Гасников А.В., Двуреченский П.Е., Тюрин А.И., Чернов А.В.
Двойственные подходы к задачам минимизации сильно выпуклых функционалов простой структуры при аффинных ограничениях // ЖВМ и МФ. 2017. Т. 57. arXiv:1602.01686 33.
Chernov A., Dvurechensky P., Gasnikov A.
Fast Primal-Dual Gradient Method for Strongly Convex Minimization Problems with Linear Constraints // // International Conference Dis-crete Optimization and Operations Research. Vladivostok. Russian Iceland. September 19–23, 2016. arXiv:1605.02970
Баймурзина Д.Р., Гасников А.В., Гасникова Е.В.
Теория макросистем с точки зрения стохастической химической кинетики // Труды МФТИ. 2015. Т. 7. № 4. С. 95–103. https://mipt.ru/upload/medialibrary/ae2/95-103.pdf 35.
Ethier N.S., Kurtz T.G.
Markov processes. Wiley Series in Probability and Mathematical Statistics: Probability and Mathematical Statistics. John Wiley & Sons Inc., New York, 1986. 36.
Гасников А.В.
Об эффективной вычислимости конкурентных равновесий в транспорт-но-экономических моделях // Математическое моделирование. 2015. Т. 27. № 12. С. 121–136. arXiv:1410.3123 37.
Бабичева Т.С., Гасников А.В., Лагуновская А.А., Мендель М.А.
Двухстадийная модель равновесного распределения транспортных потоков // Труды МФТИ. 2015. Т. 7. № 3. С. 31–41. https://mipt.ru/upload/medialibrary/971/31-41.pdf 38.
Гасников А.В., Гасникова Е.В., Мациевский С.В., Усик И.В.
О связи моделей дискрет-ного выбора с разномасштабными по времени популяционными играми загрузок // Труды МФТИ. 2015. Т. 7. № 4. С. 129–142. arXiv:1511.02390 39.
Гурвич В.А.
Торг с богами // // Матем. просв., сер. 3. № 20. М.: МЦНМО, 2016. С. 23–56. 40.
Гасников А.В., Двуреченский П.Е., Дорн Ю.В., Максимов Ю.В . Численные методы по-иска равновесного распределения потоков в модели Бэкмана и модели стабильной ди-намики // Математическое моделирование. 2016. Т. 28. arXiv:1506.00293 41.
Andersen S.P., de Palma A., Thisse J.-F.
Discrete choice theory of product differentiation. MIT Press; Cambridge, 1992. 42.
Bar-Gera H.
Origin-based algorithms for transportation network modeling. Univ. of Illinois at Chicago, 1999. 43.
Лидбеттер М., Линдгрен Г., Ротсен Х.
Экстремумы случайных последовательностей и процессов. М.: Мир, 1989. 44.
Гасников А.В., Гасникова Е.В., Двуреченский П.Е., Ершов Е.И., Лагуновская А.А.
По-иск стохастических равновесий в транспортных моделях равновесного распределения потоков // Труды МФТИ. 2015. Т. 7. № 4. С. 114–128. arXiv:1505.07492 45.
Cressman R.
Evolutionary dynamics and extensive form games. MIT Press; Cambridge, 2003. 46.
Гасников А.В., Нестеров Ю.Е., Спокойный В.Г.
Об эффективности одного метода ран-домизации зеркального спуска в задачах онлайн оптимизации // ЖВМ и МФ. 2015. Т. 55. № 4. С. 55–71. arXiv:1410.3118 47.
Гасников А.В., Лагуновская А.А., Морозова Л.Э.
О связи имитационной логит динами-ки в популяционной теории игр и метода зеркального спуска в онлайн оптимизации на примере задачи выбора кратчайшего маршрута // Труды МФТИ. 2015. Т. 7. № 4. С. 104–113. arXiv:1511.02398
Блинкин М.Я., Гасников А.В., Омельченко С.С., Усик И.В.
Эволюционный вывод про-стейшей модели бимодального расщепления спроса на городские передвижения // Тру-ды МФТИ. 2016. Т. 8. № 1. С. 25–31. arXiv:1601.06515 50.
Yun S., Sen A.
Computation of maximum likelihood estimates of gravity model parameters // Journal of Regional Science. 1994. V. 34. № 2. P. 199–216. 51.
Spokoiny V.
Parametric estimation. Finite sample theory // The Annals of Statistics. 2012. V. 40. № 6. P. 2877–2909. arXiv:1111.3029v5 52.
Hyman G.M.
The calibration of trip distribution models // Environment and Planning. 1969. № 1. P. 105–112. 53.
Evans A.W.
The calibration of trip distribution models with exponential or similar cost func-tions // Transportation research. 1971. V.5. P. 15–38. 54.
Ahuja R.K., Magnati T.L., Orlin J.B.
Network flows: Theory, algorithms and applications. Prentice Hall, 1993. 55.
Кормен Т . Х ., Лейзерсон Ч . И ., Ривест Р . Л ., Штайн К . Алгоритмы: Построение и ана-лиз. М.: Вильямс, 2005. 56.
Werneck R.
Shortest paths and experimental evaluation algorithms. MIDAS, 2010. http://logic.pdmi.ras.ru/midas/sites/default/files/midas-werneck.pdf 57.
Аникин А.С., Гасников А.В., Горнов А.Ю., Двуреченский П.Е., Семенов В.В.
Параллели-зуемые двойственные методы поиска равновесий в смешанных моделях распределения потоков в больших транспортных сетях // 40-я международная школа конференция “Информационные технологии и системы-2016”. Санкт-Петербург, Репино. 25–30 сен-тября, 2016. arXiv:1604.08183 58.
Гасников А.В., Нестеров Ю.Е.
Универсальный метод для задач стохастической ком-позитной оптимизации // e-print, 2016. arXiv:1604.05275 59.
Гасников А.В., Двуреченский П.Е., Камзолов Д.И., Нестеров Ю.Е., Спокойный В.Г., Стецюк П.И., Суворикова А.Л., Чернов А.В.
Поиск равновесий в многостадийных транспортных моделях // Труды МФТИ. 2015. Т. 7. № 4. С. 143–155. https://mipt.ru/upload/medialibrary/ffe/143-155.pdf 60.
Гасников А.В., Двуреченский П.Е., Спокойный В.Г., Стецюк П.И., Суворикова А.Л.
Су-перпозиция метода балансировки и универсального градиентного метода для поиска энтропийно-сглаженного барицентра Вассерштейна и равновесий в многостадийных моделях транспортных потоков // Труды МФТИ. 2016. Т. 8. № 3. arXiv:1506.00292 61.
Nesterov Y . Characteristic functions of directed graphs and applications to stochastic equili-brium problems // Optim. Engineering. 2007. V. 8. P. 193–214.
Ким К., Нестеров Ю., Скоков В., Черкасский Б.
Эффективные алгоритмы для диффе-ренцирования и задачи экстремали // Экономика и математические методы. 1984. Т. 20. С. 309–318. 63.
Евтушенко Ю.Г.
Оптимизация и быстрое автоматическое дифференцирование. М.: ВЦ РАН, 2013. 64.
Chudak F., Eleuterio V., Nesterov Y.
Static Traffic Assignment Problem. A comparison be-tween Beckmann (1956) and Nesterov & de Palma (1998) models // Conference Paper STRC 2007. P. 1–23. 65.