Searching of equilibriums in hierarchical congestion population games
Alexander Gasnikov, Evgenia Gasnikova, Sergey Matsievsky, Inna Usik
ТТруды МФТИ. 2015. Т. 7. № 4 О связи моделей дискретного выбора с разномасштабными по времени популяционными играми загрузок
Гасников А.В., Гасникова Е.В., Мациевский С.В., Усик И.В. (Центр исследований транспортной политики, Институт экономики транспорта и транспортной политики, НИУ ВШЭ; Балтийский федеральный университет им. И. Канта; ПреМоЛаб ФУПМ МФТИ)
Аннотация
В работе предложен универсальный прямо-двойственный способ описания равновесия в иерархических популяционных играх загрузок. В основе подхода лежит иерархия вложенных друг в друга транспортных сетей и соответствующие этим сетям разномасштабные (по времени) логит динамики, отражающие ограниченную рациональность агентов. Поиск равновесия сводится к решению мгногоуровневой задачи выпуклой оптимизации. Описанные в статье результаты могут быть использованы при описании и численном поиске равновесий (стохастических равновесий) во всех известных многостадийных моделях транспортных потоков.
Ключевые слова: логит динамика, многостадийная модель транспортных потоков, энтропия, равновесное распределение потоков. Введение
В работах [1 – 4] было анонсировано, что в последующем цикле публикаций будет приведен общий способ вариационного описания равновесий (стохастических равновесий) в популярных моделях распределения транспортных потоков. Также отмечалось, что планируется предложить эффективные численные методы поиска таких равновесий. В данной работе предпринята попытка погрузить известные нам подходы к многостадийному моделированию потоков на иерархических сетях (реальных транспортных сетях или сетях принятия решение – не важно) в одну общую схему, сводящую поиск равновесия к решению многоуровневой задачи выпуклой оптимизации. В основе схемы получения вариационного принципа для описания равновесия лежит популяционная игра загрузки с соответствующими логит динамиками (отвечающими моделям дискретного выбора [5]) пользователей на каждом уровне иерархии [6] (см. п. 2). Для решения описанной задачи выпуклой оптимизации в статье изучается двойственная задача, представляющая самостоятельный интерес (см. п. 3). Основным инструментом изучения двойственной задачи является аппарат характеристических функций на графе [1, 7, 8] и ускоренные прямо-двойственные методы в композитном варианте [9, 10]. Отметим, что общность результатов статьи достигается за счет введения большого числа параметров, которые можно вырождать, стремя их к нулю или бесконечности. Игра на выборе этих параметров позволяет, например, получать различные многостадийные модели транспортных потоков [2 – 4, 11, 12]. Приводимые далее результаты можно обобщать и на потоки товаров, в случае, когда имеется более одного наименования товара [12]. Однако в данной статье мы не будем касаться этого обобщения. Мы также не планируем приводить конкретные примеры получения многостадийных транспортных руды МФТИ. 2015. Т. 7. № 4 моделей согласно изложенной в статье общей схеме. Всему этому планируется посвятить отдельные публикации. Постановка задачи
Рассмотрим транспортную сеть, заданную ориентированным графом , V E . Часть его вершин
O V является источниками, часть стоками D V . Множество пар источник-сток, обозначим OD O D . Пусть каждой паре w OD соответствует своя корреспонденция: : w w d d M ( M ) пользователей, которые хотят в единицу времени перемещаться из источника в сток, соответствующих заданной корреспонденции w . Пусть ребра разделены на два типа E E E . Ребра типа E характеризуются неубывающими функциями затрат : e e e e f f M . Затраты e e f несут те пользователи, которые используют в своем пути ребро e E , в предположении, что поток пользователей по этому ребру равен e f . Пары вершин, задающие ребра типа E , являются, в свою очередь, парами источник-сток OD (с корреспонденциями w e d f , w e E ) в транспортной сети следующего уровня, , V E , ребра которой, в свою очередь, разделены на два типа
E E E . Ребра типа E характеризуются неубывающими функциями затрат : e e e e f f M . Затраты e e f несут те пользователи, которые используют в своем пути ребро e E , в предположении, что поток пользователей по этому ребру равен e f . Пары вершин, задающие ребра типа E , являются, в свою очередь, парами источник-сток OD (с корреспонденциями w e d f , w e E ) в транспортной сети более высокого уровня, , V E , … и т.д. Будем считать, что всего имеется m уровней: m m E E . Обычно в приложениях число m небольшое [1 – 5]: 2 – 10. Каждый пользователь в графе выбирает путь w w p P (последовательный набор проходимых пользователем ребер), соответствующий его корреспонденции w OD ( w P – множество всех путей, отвечающих в корреспонденции w ). Задав w p можно однозначно восстановить ребра типа E , входящие в этот путь. На каждом из этих ребер w E пользователь может выбирать свои пути w w p P ( w P – множество всех путей, отвечающих в корреспонденции w ), … и т.д. Пусть каждый пользователь сделал свой выбор. Обозначим через p x величину потока пользователей по пути
11 1 ww OD p P P , p x – величина потока пользователей по пути
22 2 ww OD p P P , … и т.д. Заметим, что kkw kp x , k k k kw w p P , k kkwk kk kw w k kp wp P x d , k k w OD , k m , что для компактности мы будем далее записывать руды МФТИ. 2015. Т. 7. № 4 k kkk k k kw wk kw w kp wPp P x S d . Отметим, что здесь и везде в дальнейшем k k k k w e OD E , k k k kw e d f , k m . Введем для графа k и множества путей k P матрицу (Кирхгофа) , k k k k k k k e p e E p P ,
1, 0, k k k ke p k k e pe p , k m . Тогда вектора потоков на ребрах k f на графе k однозначно определяются векторами потоков на путях k k k k kp p P x x : k k k f x , k m . Обозначим через mk k x x , mk k f f , diag mk k , k k k k kw w OD d d , kkkk k w k k kwPw OD X d S d , m k kk X X d , а через , ,... k k k k k kkw k k kw w w w p E p p p , k m полное описание возможного пути (в графе k и графах следующих уровней), соответствующего корреспонденции k k w OD . Множество всех таких путей будем обозначать k kw P . Введем также множество путей kk k k kww OD P P и соответствующий вектор распределения потоков по этим путям k P x . Определим функции затрат пользователей на пути k kw p по индукции: m m m m m mmw m m m m mp P e p e ee E G x f , k k k k k k k kk k kw w wk k k k k k k kp P e p e e p Pe E w E G x f G x , k m . Опишем марковскую логит динамику (также говорят гиббсовскую динамику) в повторяющейся игре загрузки графа транспортной сети [6, 8]. Пусть имеется TN шагов ( N ). Каждый пользователь транспортной сети, использовавший на шаге t путь w p , независимо от остальных, на шаге t (все введенные новые параметры положительны) с вероятностью ,1 11 ,1 1 expexp w tp tpp P GN G . пытается изменить свой путь w p на w p P , где ,1 1 t tp p P G G x – затраты на пути p на шаге t ( p G ); руды МФТИ. 2015. Т. 7. № 4 равновероятно выбирает w w p E и затем с вероятностью expexp w tpw tpp P p E GN G пытается изменить в своем пути , w w w w w p E p p p участок пути w p , выбирая путь w p P , где ,2 2 t tp p P G G x – затраты на пути p на шаге t ( p G ); ... и т.д.; с вероятностью m kk N решает не менять тот путь, который использовал на шаге t . Такая динамика отражает ограниченную рациональность агентов (см. замечание 5 п. 3), и часто используется в теории дискретного выбора [5] и популяционной теории игр [6]. В основном нас будет интересовать поведение такой системы в предположении , , …, m m , m N . (1) Эта марковская динамика в пределе N превращается в марковскую динамику в непрерывном времени [13]. Далее мы, как правило, будем считать, что такой предельный переход был осуществлен. В пределе M эта динамика (концентраций) описывается зацепляющейся системой обыкновенных дифференциальных уравнений ( СОДУ ) expexp ww ww p Pp w pp Pp P G xdx d xdt G x , w w p P , w OD , expexp ww ww p Pp w pp Pp P G xdx d xdt G x , w w p P , w OD E , ………………………………………………………………………… Применяя по индукции (в виду условия (1)) теорему Тихонова к этой СОДУ [14, 15], можно получить описание аттрактора СОДУ – глобально устойчивой (при T ) неподвижной точки. Для того чтобы это сделать, введем обозначение kkek k k fk k ke e e f z dz , k m . Рассмотрим задачу , : ln min w e e p p w f x x Xe E w OD p P x f x f x x x d , (2) ln w e e p p we E w E p P x f x x x d , w w d f , руды МФТИ. 2015. Т. 7. № 4 …………………………………………………………………………………….. ln k k k k kk k k k k kkw k k k k k k k ke e p p we E w E p P x f x x x d , k k k kw w d f , …………………………………………………………………………………….. ln m m m m mm m m m m mmw m m m m m m me e p p we E w E p P x f x x d , m m m mw w d f . Эта задача эквивалентна следующей цепочке зацепляющихся задач выпуклой (многоуровневой [16]) оптимизации min ln we e e e p p wf x x X d e E w OD p Pd f e E d f d x x d , (3) min ln we e e e p p wf x x X d e E w E p Pd f e E d f d x x d , …………………………………………………………………………………….. min ln k k k k kk k k k k k k k k k k kkwk k k kk ke e k k k k k k k k k ke e p p wf x x X d e E w E p Pd f e E d f d x x d , …………………………………………………………………………………….. , min ln m m m m mm m m m m m m m m m m mmw m m m m m m m me e p p wf x x X d e E w E p P d f x x d . То, что эти задачи выпуклые, сразу может быть не очевидно. Чтобы это понять, заметим, что ограничения k k k x X d с помощью метода множителей Лагранжа можно убрать, добавив в функционал слагаемые max , k k kkk k k kkw kw k k kw p ww E p P x d , k m . Каждое такое слагаемое – есть выпуклая функция по совокупности параметров k x , k d (см., например, формулу (3.1.8) стр. 96 [17]). Следовательно (см., например, теорему 3.1.2 стр. 92 и формулу (3.1.9) стр. 96 [17]), m m d – выпуклая функция, но тогда и k k d – выпуклая функция, поскольку (по индукции) k k d выпуклая функция ( k m ). Теорема 1. Задачи (2) и (3) являются эквивалентными задачами выпуклой оптимизации, имеющими единственное решение. Введенная марковская логит динамика при N – эргодическая. Ее финальное распределение (возникающее в пределе T ) совпадает со стационарным. В предположении (1) стационарное распределение экспоненциально сконцентрировано в окрестности решения задачи (3) (в пределе M стационарное распределение полностью сосредотачивается на решении задачи (3)). руды МФТИ. 2015. Т. 7. № 4 Введенная марковская логит динамика при пределах N , M описывается СОДУ. В предположении (1) любая допустимая траектория СОДУ (соответствующая вектору корреспонденций d ) сходится при T к решению задачи (3). Замечание 1.
Утверждения 1, 2 теоремы 1 (кроме единственности решения) остаются верными и в предположении, что по части параметров k сделаны предельные переходы (от стохастических равновесий к равновесиям Нэша) k (важно, что эти переходы осуществляются после предельных переходов, указанных в соответствующих пунктах теоремы 1). К этому же результату (с точки зрения того, к какой задаче оптимизации в итоге сводится поиск равновесий) приводит рассмотрение на соответствующих уровнях вместо логит динамик имитационных логит динамик [6, 18]. Замечание 2.
Утверждения теоремы 1 и замечания 1 остаются верными, если на части ребер (любого уровня) сделать предельные переходы (важно, что эти переходы осуществляются после предельных переходов, указанных в соответствующих пунктах теоремы) вида (предел стабильной динамики [2, 12]) , ,, , e e ee e e e e t f ff t f f
0, 0 , e e e e e d f df f f с дополнительной оговоркой, что существует такой x X , что условие f x совместно с e e e f f . При этом ,lim , e f e e e ee e e e e f t f ff z dz f f . Величину lim e e e e t f t можно понимать как затраты на проезд по ребру e (см. также п. 3), а lim e e e f t – как дополнительные затраты, приобретенные из-за наличия “пробки” на ребре e [2, 19], возникшей из-за функционирования ребра на пределе пропускной способности e f . Эти дополнительные затраты в точности совпадают с множителем Лагранжа к ограничению e e f f [2, 19]. Их также можно понимать как оптимальные платы за проезд (для обычных ребер эти платы равны e e e e d df f f [3, 20, 21]), взимаемые согласно механизму Викри–Кларка–Гроуса [21]. Если для некоторых p q m имеют место равенства ... p q , то можно свернуть p , …, q в один граф q kk p . Это следует из свойств энтропии (см. свойство 3 § 4 главы 2 [22]). Далее мы отдельно рассмотрим специальный случай ... m . В этом случае мы имеем граф , m mk kk k V E E , который имеет всего один уровень, а задача (1) может быть переписана следующим образом руды МФТИ. 2015. Т. 7. № 4
11 1 11 ln min w e e p p w f x x Xe E w OD p P x f x x d . (4) Теорема 2.
При ... m задачи (2) и (4) являются эквивалентными задачами выпуклой оптимизации, имеющими единственное решение; введенная марковская логит динамика при N – эргодическая. Ее финальное распределение (возникающее в пределе T ) совпадает со стационарным, которое представимо в виде (представление Санова) exp 1 M x o , M . Как следствие, получаем, что стационарное распределение экспоненциально сконцентрировано в окрестности решения задачи (4) (в пределе M стационарное распределение полностью сосредотачивается на решении задачи (4)); введенная марковская логит динамика при пределах N , M описывается СОДУ. Функция x является функцией Ляпунова этой СОДУ (принцип Больцмана). То есть убывает на траекториях СОДУ. Как следствие, любая допустимая траектория СОДУ (соответствующая вектору корреспонденций d ) сходится при T к решению задачи (4). Замечание 3.
К теореме 2 можно сделать замечания аналогичные замечаниям 1, 2 к теореме 1. Двойственная задача
Рассмотрим граф , m mk kk k V E E . Обозначим через e e e t f (здесь специально упрощаем обозначения, поскольку в виду предыдущего раздела контекст должен восстанавливаться однозначным образом). Запишем в пространстве e e E t t двойственную задачу к (3) [1, 2, 8] (далее мы используем обозначение * dom – область определения сопряженной к функции) , min , : , f x x f f x x X * min e et e E t t , (5) где * 0 max ee fe e e e ef t f t z dz , * 0 max ee fe e e e e efe e d t d f t z dz fdt dt : e e e t f , e E ; руды МФТИ. 2015. Т. 7. № 4 m m m m m m mm m m m mp e p e e p ee E e E g t t t , k k k k k k kk k k k k k k kp e p e e p ee E e E g t t t , k m , ln exp k kk kkw k kw pp P t g t , k m , w ww OD t d t . Теорема 3.
Имеет место сильная двойственность (5). Решение задачи выпуклой оптимизации (5) t существует и единственно. По этому решению однозначно можно восстановить решение исходной задачи (3) (если какой-то из k , то однозначность восстановления x может потеряться) f x t , expexp kk k kk kkw k kpk kp w k kpp P g tx d g t , k k kw p P , k k w OD , k m . (6) Верен и обратный результат. Пусть f x – решение задачи (3), тогда e e e E t f – единственное решение задачи (3) (если какой-то из k , то решение x может быть не единственно, однако это никак не сказывается на возможности однозначного восстановления t ). Замечание 4.
К теореме 3 можно сделать замечания аналогичные замечаниям 1, 2 к теореме 1. При этом оговорки, возникающие при k , частично уже были сделаны в формулировке самой теоремы. Дополним их следующим наблюдением. Слагаемое t в двойственной задаче (5) имеет равномерно ограниченную константу Липшица градиента в 2-норме:
21 12 1,..., w w k w wp Pw ODk m
L d p , где w p – число ребер в пути w p . Эта гладкость теряется при k : lim min k kk k kkw k k k kw pp P t g t – длина кратчайшего пути в графе k , отвечающего корреспонденции k k w OD , ребра k k e E , которого взвешены величинами k k k ke t , которые можно понимать как “средние” затраты на k k e E (см. замечание 5). Заметим также, что в пределе (стабильной динамики) (см. замечание 2) получаем: * 0 0 ,lim max , ee f e e e e ee e e e ef e e f t t t tt f t z dz t t . При этом e e f f в точности совпадает с множителем Лагранжа к ограничению e e t t [2, 19]. руды МФТИ. 2015. Т. 7. № 4 Замечание 5.
Формулу (6) можно получить и из других соображений. Предположим, что каждый пользователь l транспортной сети, использующий корреспонденцию k k w OD на уровне k (ребро k k k e w E на уровне k ), выбирает маршрут следования k k kw p P на уровне k , если , arg max k kk kkw k k k lq qq P p g t , где независимые случайные величины , k k lq , имеют одинаковое двойное экспоненциальное распределение, также называемое распределением Гумбеля [5, 6, 8]: , exp kk k l Eq P e . Отметим также, что если взять E – константа Эйлера, то , k k lq M ,
2, 2 k k l kq D . Распределение Гиббса (логит распределение) (6) получается в пределе, когда число агентов на каждой корреспонденции k k w OD , k m стремится к бесконечности (случайность исчезает и описание переходит на средние величины). Полезно также в этой связи иметь в виду, что [5, 9] max k k kk k kk kk kp wp P kw k k k k kw p pp P t M g t . Таким образом, если каждый пользователь сориентирован на вектор затрат t на ребрах E (одинаковый для всех пользователей) и на каждом уровне (принятия решения) пытается выбрать кратчайший путь исходя из зашумленной информации и исходя из усреднения деталей более высоких уровней (такое усреднение можно обосновывать, если, например, как в п. 2, ввести разный масштаб времени (частот принятия решений) на разных уровнях, а можно просто постулировать, что пользователь так действует, как это принято в моделях типа Nested Logit [5]), то такое поведение пользователей (в пределе, когда их число стремится к бесконечности) приводит к описанию распределения пользователей по путям/ребрам (6). Равновесная конфигурация характеризуется тем, что вектор t породил согласно формуле (6) такой вектор f , что имеет место соотношение e e e E t f . Поиск такого t (неподвижной точки) приводит к задаче (5). Замечание 6.
Сопоставить формуле (4), теореме 2 и замечанию 3 (отвечающих случаю ... m ) вариант двойственной задачи (5) чрезвычайно просто (мы здесь опускаем соответствующие выкладки). Собственно, понять формулу (4) как раз проще не из свойств энтропии (как это было описано в п. 2), а с помощью обратного перехода от двойственного описания (5). Теорема 3 и замечание 5 в случае ... m наглядно демонстрируют отсутствие какой бы то ни было иерархии, и возможность работать на одном графе с естественной интерпретацией функций затрат на путях p g t (без всяких “средних” оговорок). Перейдем к конспективному обсуждению численных аспектов решения задачи (5). Как правило, выгоднее решать именно задачу (5), а не (3) [8]. На эту задачу удобно смотреть, как на гладкую (с Липшицевым градиентом) задачу композитной оптимизации [9, 10] c евклидовой прокс-структурой (задаваемой 2-нормой). При этом, даже если по руды МФТИ. 2015. Т. 7. № 4 ряду параметров k требуется сделать предельный переход k , то, как правило, лучше считать, что численно мы все равно решаем задачу со всеми k [8]. Этого можно добиться обратным процессом: энтропийной регуляризацией прямой задачи = сглаживанием двойственной. Некоторые детали того, как именно и в каких случаях полезно сглаживать задачу (5) описаны в работе [8] (см. также [23]). Композитный быстрый градиентный метод (и различные его вариации с адаптивным подбором константы Липшица градиента, универсальный метод и др. [9, 10, 24]) обладает прямо-двойственной структурой [2, 8, 25 – 28]. Это означает, что генерируемые этим методом последовательности i t и i t обладают следующим свойством N Ne ee E t t *
21 1 1 1 1 * 2 2dom 0
N i i ii e et i e EN N
CL Ra t t t t tA A , (7) где константа C зависит от метода, N a N , NN ii
A a , N A N , ˆmax , R R R ,
22 *2 2 R t t ,
22 *2
1ˆ 2
Ne e ee E
R f t , N f определяется в теореме 4, метод стартует с t t , * t – решение задачи (5). Теорема 4.
Пусть задача (5) решается прямо-двойственным методом, генерирующим последовательности i t и i t , с оценкой скорости сходимости (7), тогда
21 1 1 * 2 2
N N N Ne ee E N
CL Rt t x f A , где i i i f x t , k k k k kkw k mi k ip p P w OD x x , , expexp kk k kk kkw k i kpk i kp w k i kpp P g tx d g t , k k kw p P , k k w OD , k m , NN iiiN f a fA , NN iiiN x a xA . Замечание 7.
В общем случае описанный выше подход, представляется наиболее предпочтительным. Однако для различных специальных случаев приведенные оценки, по-видимому, можно немного улучшить [4, 28]. Приведенная теорема 4 оценивает число необходимых итераций. Но на каждой итерации необходимо считать t , а для ряда методов и t (например, для руды МФТИ. 2015. Т. 7. № 4 всех адаптивных методов, настраивающихся на параметры гладкости задачи [9, 10, 24]) . Подобно [1, 7, 8] можно показать (с помощью сглаженного варианта метода Форда–Беллмана), что для этого достаточно сделать max p P
O E p арифметических операций. Однако необходимо обговорить один нюанс. Для возможности использовать сглаженный вариант метода Форда–Беллмана [1, 7, 8] необходимо предположить, что любые движения по ребрам графа с учетом их ориентации являются допустимыми, т.е. множество путей, соединяющих заданные две вершины (источник и сток), – это множество всевозможных способов добраться из источника в сток по ребрам имеющегося графа с учетом их ориентации. Сделанная оговорка не сильно обременительная, поскольку нужного свойства всегда можно добиться раздутием исходного графа в несколько раз за счет введения дополнительных вершин и ребер. В целом, хотелось бы отметить, что прием, связанный с искусственным раздутием исходного графа путем добавления новых вершин, ребер, источников, стоков является весьма полезным для ряда приложений [2 – 4, 12]. В частности, достаточно популярным является введение фиктивных (с нулевыми затратами) путей-ребер, которые дают возможность ничего не делать пользователям (не перемещаться [3], не торговать [12] и т.п.), что, в свою очередь, позволяет рассматривать ситуации с нефиксированными корреспонденциями d [3, 12]. Также популярным приемом является перенесение затрат на преодоление вершин (узлов) графа (перекрестков [3], сортировочных станций [12]) в затраты на прохождение дополнительных ребер, появившиеся при “распутывании” узлов. Но, пожалуй, наиболее важным для большинства приложений является введение фиктивного общего источника и общего стока, соединенных дополнительными ребрами с уже имеющимися вершинами графа [3, 4, 12]. Исследование выполнено при поддержке грантов РФФИ 15-31-70001 мол_а_мос, 15-31-20571-мол_а_вед, 14-01-00722-а, 13-01-12007-офи_м. Исследование первого автора в части 3 выполнено в ИППИ РАН за счет гранта Российского научного фонда (проект №14-50-00150). Данная статья представляет собой запись нескольких лекций, прочитанных первым автором в рамках курса “Математическое моделирование транспортных потоков” https://mipt.ru/dcam/science/seminars/matematicheskoe-modelirovanie-transportnykh-potokov-2015.php студентам МФТИ и БФУ им. Канта в осеннем семестре 2015/2016 учебного года. Литература руды МФТИ. 2015. Т. 7. № 4 Гасников А.В., Дорн Ю.В., Нестеров Ю.Е, Шпирко С.В.
О трехстадийной версии модели стационарной динамики транспортных потоков // Математическое моделирование. 2014. Т. 26:6. C. 34–70. arXiv:1405.7630 3.
Гасников А.В.
Об эффективной вычислимости конкурентных равновесий в транспортно-экономических моделях // Математическое моделирование. 2015. Т. 27. № 12. С. 121–136. arXiv:1410.3123 4.
Бабичева Т.С., Гасников А.В., Лагуновская А.А., Мендель М.А.
Двухстадийная модель равновесного распределения транспортных потоков // Труды МФТИ. 2015. Т. 7. № 3. С. 31–41. https://mipt.ru/upload/medialibrary/971/31-41.pdf 5.
Andersen S.P., de Palma A., Thisse J.-F.
Discrete choice theory of product differentiation. MIT Press; Cambridge, 1992. 6.
Sandholm W.
Population games and Evolutionary dynamics. Economic Learning and Social Evolution. MIT Press; Cambridge, 2010. 7.
Nesterov Y . Characteristic functions of directed graphs and applications to stochastic equilibrium problems // Optim. Engineering. 2007. V. 8. P. 193–214. 8.
Гасников А.В., Гасникова Е.В., Двуреченский П.Е., Ершов Е.И., Лагуновская А.А.
Поиск стохастических равновесий в транспортных моделях равновесного распределения потоков // Труды МФТИ. 2015. Т. 7. № 4. С. 114–128. arXiv:1505.07492 9.
Nesterov Yu.
Nesterov Yu., Nemirovski A.
On first order algorithms for l / nuclear norm minimization // Acta Numerica. 2013. V. 22. P. 509–575. 11. Ortúzar J . D ., Willumsen L . G . Modelling transport. JohnWilley & Sons, 2011. 12. Ващенко М.П., Гасников А.В., Молчанов Е.Г., Поспелова Л.Я., Шананин А.А.
Вычислимые модели и численные методы для анализа тарифной политики железнодорожных грузоперевозок. М.: ВЦ РАН, 2014. 52 стр. arXiv:1501.02205 13.
Ethier N.S., Kurtz T.G.
Markov processes. Wiley Series in Probability and Mathematical Statistics: Probability and Math. Statistics. John Wiley & Sons Inc., New York, 1986. 14.
Тер-Крикоров А.М.
Нелинейный анализ и асимптотические методы малого параметра. Учебное пособие. М.: МФТИ, 2007. 15.
Разжевайкин В.Н.
Анализ моделей динамики популяций. Учебное пособие. М.: МФТИ, 2010. руды МФТИ. 2015. Т. 7. № 4 Multilevel optimization: algorithms and applications. Nonconvex optimization and its applications. Edited by Athanasios Migdalas, Panos M. Pardalos, Peter Värbrand. Dordrecht; Boston: Kluwer Academic Publishers, 1998. 17.
Жадан В.Г.
Методы оптимизации. Часть 1. Введение в выпуклый анализ и теорию оптимизации. Учебное пособие. М.: МФТИ, 2014. 18.
Гасников А.В., Лагуновская А.А., Морозова Л.Э.
О связи имитационной логит динамики в популяционной теории игр и метода зеркального спуска в онлайн оптимизации на примере задачи выбора кратчайшего маршрута // Труды МФТИ. 2015. Т. 7. № 4. С. 104–113. arXiv:1511.02398 19.
Nesterov Y.
Stable traffic equilibria: properties and applications // Optimization and Engineering. 2000. V.1.P.29–50. 20.
Sandholm W.H.
Evolutionary implementation and congestion pricing // Review of Economic Studies. 2002. V. 69. P. 81–108. 21.
Яглом А.М., Яглом И.М.
Вероятность и информация. М.: КомКнига, 2006. 23.
Nesterov Y.
Smooth minimization of non-smooth function // Math. Program. Ser. A. 2005. V. 103. № 1. P. 127–152. 24.
Nesterov Yu.
Nesterov Y.
Primal-dual subgradient methods for convex problems // Math. Program. Ser. B. 2009. V. 120(1). P. 261–283. 26.
Nemirovski A., Onn S., Rothblum U.G.
Accuracy certificates for computational problems with convex structure // Mathematics of Operation Research. 2010. V. 35. № 1. P. 52–78. 27.
Гасников А.В., Двуреченский П.Е., Нестеров Ю.Е.
Стохастические градиентные методы с неточным оракулом // e-print, 2014. arxiv:1411.4218 28.
Гасников А.В., Двуреченский П.Е., Камзолов Д.И., Нестеров Ю.Е., Спокойный В.Г., Стецюк П.И., Суворикова А.Л., Чернов А.В.
Поиск равновесий в многостадийных транспортных моделях // Труды МФТИ. 2015. Т. 7. № 4. С. 143–155. arXiv:1506.00292 ; https://mipt.ru/upload/medialibrary/ffe/143-155.pdfarXiv:1506.00292 ; https://mipt.ru/upload/medialibrary/ffe/143-155.pdf