ERGEBNISSE DER MATHEMATIK
UND IHRER GRENZGEBIETE

Neue Folge · Heft 30

 Э. БЕККЕНБАХ, Р. БЕЛЛМАН

INEQUALITIES

by

Edwin F. Beckenbach and Richard Bellman
  НЕРАВЕНСТВА 
 Перевод с английского
Г. И. Басса,   В. И. Левина
Г. А. Шадрина

Под редакцией
В. И. Левина




SPRINGER-VERLAG
BERLIN · GÖTTINGEN · HEIDELBERG
1 9 6 1
 ИЗДАТЕЛЬСТВО «МИР»
Москва   1 9 6 5
 



ОГЛАВЛЕНИЕ
Предисловие к русскому изданию5
Предисловие7
Глава I.Основные неравенства и родственные вопросы9
§1.Введение
§2.Неравенство Коши
§3.Тождество Лагранжа
§4.Неравенство между арифметическим и геометрическим средними
§5.Индукция вверх и вниз
§6.Анализ и множители Лагранжа
§7.Функциональные уравнения
§8.Вогнутость
§9.Мажоризация – доказательство Бора
§10.Доказательство Гурвица
§11.Доказательство Элерса
§12.Арифметико-геометрическое среднее Гаусса. Элементарные симметрические функции
§13.Доказательство Якобсталя
§14.Одно фундаментальное соотношение
§15.Неравенство Юнга
§16.Средние Mt(x, α) и суммы St(x)
§17.Неравенства Гёльдера и Минковского
. . .
Глава II.Положительно определенные матрицы, характеристические числа и положительные матрицы84
Глава III.Пространства моментов и резонансные теоремы141
Глава IV.Положительные операторы184
Глава V.Неравенства для дифференциальных операторов228



ПРЕДИСЛОВИЕ К РУССКОМУ ИЗДАНИЮ

Более тридцати лет назад, когда Харди, Литлвуд и Пойа писали свою известную монографию о неравенствах, систематическое изложение оказалось возможным только благодаря очень тщательному отбору материала. Уже тогда обилие результатов, непосредственно относящихся к тематике монографии, было таким, что многие интересные и перспективные неравенства не нашли в ней места. В качестве эпиграфа к своей книге авторы избрали строфу Р. Браунинга (Saul. st. 39)

Oh, the little more, and how much it is!
And the little less, and what worlds away!

О, чуть больше – и как много добавляется,
А чуть меньше – и какие миры исчезают!

ярко характеризующую те трудности отбора, с которыми им пришлось столкнуться.

За истекшие тридцать лет объём исследований по неравенствам возрос во много раз и неравенства завоевали много новых областей, в которых они играют главенствующую роль. Тем более трудной была задача отбора и расположения материала, вставшая перед авторами. Они решили эту задачу, разбив, во-первых, книгу на два тома (второй том ещё не вышел), и используя, во-вторых, возможность не доказывать многие из приводимых результатов, которая предоставлена тем, что книга вышла в известной серии «Ergebnisse der Mathematik und ihrer Grenzgebiete» (Neue Folge, № 30), состоящей в основном из обзоров отдельных областей математики. Классификация неравенств в настоящей книге производится не по методам доказательств (один из принципов классификации Харди, Литлвуда и Пойа), а в основном по общности тематики и приложений.

Следует ещё отметить, что написана книга «широкими мазками», изложение во многих местах не затрагивает более тонких исследований, связанных с трудными и интересными вопросами. Так, авторы далеко не всегда приводят наилучшие неравенства (с точными константами), ограничиваясь лишь фактом существования неравенства и не устанавливая точных оценок. Это нельзя, однако, поставить авторам в вину, так как детальная разработка отдельных типов неравенств, какой бы интерес она ни представляла для специалистов, действительно невозможна в рамках такого издания, которое всё же имеет ознакомительно-справочный характер.

Книга Беккенбаха и Беллмана не является поэтому монографией, по которой можно изучать неравенства (как их можно изучать по книге Харди, Литлвуда и Пойа). Но она содержит такое богатство фактов (в большинстве новых и новейших), притом умело систематизированных, и столь обширную библиографию, что она без сомнения окажется очень полезной для широкого круга читателей. По ней можно навести справку, возможно ли неравенство определённого типа, нужное как аппарат для того или иного исследования, она может дать и много стимулов для интересных исследований в области самих неравенств.

В. И. Левин



 Г. Г. Харди, Дж. И. Литлвуду и Д. Пойа от двух последователей (на почтительном расстоянии)



ПРЕДИСЛОВИЕ

Со времени выхода в свет классического труда Харди, Литлвуда и Пойа в 1934 г. математики приложили колоссальные усилия к уточнению и обобщению классических неравенств, открытию новых типов неравенств и приложениям неравенств во многих разделах анализа. В качестве примеров приведём теорию дифференциальных уравнений, обыкновенных и с частными производными, в которых доминирующую роль играют неравенства и вариационные принципы, относящиеся к функциям и их производным, многие приложения линейных неравенств в теории игр и математической экономике, возродившие интерес к вопросам выпуклости и пространствам моментов, а также всё новые и новые применения цифровых машин, которые требуют систематического изучения оценок погрешностей, опирающегося на сложные разделы теории матриц и операторов.

Результаты, изложенные в настоящей книге, до некоторой степени отражают все эти разветвления теории неравенств в пограничные области анализа, но нашей основной задачей было изучение неравенств как таковых. Поскольку ясно, что невозможно дать связный отчёт о том взрыве аналитической активности, свидетелями которого мы являлись на протяжении последних 25 лет, нам пришлось ограничиться теми вопросами, которые нас особенно интересовали, и в изучение которых нам удалось внести некоторый вклад.

Мы приводим достаточное число литературных ссылок как для того, чтобы заинтересованный читатель мог проследить историю вопроса, так и для того, чтобы он мог ознакомиться с более сложными аспектами излагаемых результатов. Однако мы не стремились ни к энциклопедичности в подборе тем, ни к полноте библиографических указаний по каждой из избранных тем.

Как и большинство авторов, мы эксплуатировали наших друзей. Мы выражаем нашу сердечную благодарность Фань Цзы за многократное чтение рукописи и за подробнейшим образом разработанные предложения по тексту. За многие ценные замечания и за чтение отдельных глав мы выражаем нашу благодарность Р. П. Боасу, П. Лаксу, Л. Ниренбергу, И. Олкину и О. Тауски.

Мы надеемся, что чтение этой книги доставит столько же удовольствия другим, сколько получили мы, когда её писали.

Лос-Анджелес
и Санта Моника, 1961
  Эдвин Ф. Беккенбах
Ричард Беллман



Глава I
ОСНОВНЫЕ НЕРАВЕНСТВА И РОДСТВЕННЫЕ ВОПРОСЫ


§ 1. Введение

В этой вступительной главе мы изложим ряд основных результатов теории неравенств и их доказательства. Некоторые из этих результатов важны сами по себе, другие понадобятся нам в следующих главах. Наконец, некоторые теоремы, так же как и разные варианты доказательств, включены просто потому, что они очень красивы и занимательны [1].

Мы начнём с неравенства Коши и тождества Лагранжа, которые будут значительно обобщены в настоящей и следующей за ней главах. Затем мы обратимся к вопросу, который один заслуживает целой монографии, а именно к знаменитому неравенству об арифметическом и геометрическом средних n неотрицательных чисел. Мы приведём двенадцать доказательств этого фундаментального неравенства, конечно, не из-за недоверия к каждому из них в отдельности, а для того, чтобы продемонстрировать многообразие методов вывода неравенств, которыми располагают алгебра и анализ. Особенно интересны доказательства Коши, Гурвица и Бора.

Не без сожаления оставляя этот вопрос, мы займёмся установлением неравенств Гёльдера и Минковского – этих «рабочих лошадок» анализа – как в дискретном, так и в континуальном вариантах.

Далее мы докажем некоторые родственные, но более сложные результаты Беккенбаха и Дрешера. Здесь мы используем важный приём квазилинеаризации, впервые применённый Минковским, а затем разработанный Малером. Этим приёмом с успехом пользовались Юнг, Зигмунд и Беллман.

Отсюда мы сделаем скачок к преобразованиям Шура двояко стохастических матриц и к некоторым результатам Карамата, Островского и Харди, Литлвуда и Пойа, относящимся к мажорирующим последовательностям. Мы упомянем также о континуальных аналогах, принадлежащих Фаню и Лоренцу.

Следующей нашей темой является область элементарных симметрических функций. Здесь имеются результаты Маркуса и Лопеса, доказательства которых оказываются гораздо более трудными, чем можно было думать. Самым изящным доказательством этих неравенств является, вероятно, то, которое опирается на теорию смешанных объёмов Минковского; эту теорию мы предполагаем изложить во втором томе «Неравенств». Мы расскажем также о результатах, принадлежащих Уайтли.

После этого мы перейдём к очень интересным вопросам обращения и уточнения классических неравенств. Вместо того чтобы следовать методам Бляшке и Пика или Бюкнера, мы применим здесь (оставляя до гл. 3 и метод моментов) метод Беллмана получения обратных неравенств, основанный на дифференциальных уравнениях. Что касается уточнения неравенств, то мы ограничимся только упоминанием некоторых результатов, отсылая читателя к соответствующим источникам.

Последняя часть главы посвящена некоторым неравенствам, относящимся к суммам с знакочередующимися членами, рассмотренным Вейнбергером, Сегё, Олкином, Беллманом и другими. Все эти неравенства оказались частными случаями нового неравенства Стеффенсена.


§ 2. Неравенство Коши

Самым фундаментальным неравенством является то, которое выражает неотрицательность квадрата любого действительного числа. Чтобы эффективно использовать это утверждение, применим его к разности y1 y2, где y1 и y2 – действительные числа. Тогда неравенство (y1 y2)2 ≥ 0 приведёт к утверждению

y12 + y22 ≥ 2y1 y2 . (1)

Равенство имеет место тогда и только тогда, когда y1 = y2. Это – простейший вид неравенства, связывающего арифметическое и геометрическое средние. Следуя Коши, мы будем в дальнейшем доказывать общий результат, основываясь на этом частном случае.

Ещё более эффективно можно применить неотрицательность квадратов, образуя сумму
 n  n  n  n
(xi u + yi v)2 = u2  xi2 + 2uv  xi yi + v2  yi2,
i=1 i=1 i=1 i=1
(2)

в которой все входящие величины действительны.

Так как полученная квадратичная форма относительно u и v неотрицательна для всех действительных значений u и v, её дискриминант должен быть неотрицателен, что и даёт неравенство Коши [2]:
 n  n  n
(  xi yi ) 2  ≤  (  xi2 )(  yi2 ) .
i=1 i=1 i=1
(3)

Это неравенство можно рассматривать как выражение того факта, что в евклидовом пространстве любого числа измерений косинус угла по абсолютной величине не превосходит единицы. Равенство имеет место тогда и только тогда, когда системы чисел (xi) и (yi) пропорциональны, т.е. тогда и только тогда, когда существуют числа λ и μ, не равные оба нулю, такие, что

λxi + μyi = 0,     i = 1, 2, ..., n.

Ещё более общие результаты можно получить, применяя предыдущее рассуждение не просто к n-мерному евклидову пространству, а к общему линейному пространству S, в котором для любых двух элементов x и y определено скалярное произведение (x, y) со следующими свойствами:

(а)(x, x) ≥ 0   xÎS,ü
(б)(x, y) = ( y, x),ý
(в) (x, uy + vw) = u(x, y) + v(x, w) для любых вещ.скаляров u и v.þ
(4)

Эти свойства позволяют заключить, что квадратичная форма относительно u и v

(ux + vy, ux + vy) = u2(x, x) + 2uv(x, y) + v2( y, y) (5)

неотрицательна для всех действительных u и v.

Отсюда, как и выше, мы получаем неравенство

(x, y)2 ≤ (x, x)( y, y), (6)

которое в свою очередь является частным случаем более общих неравенств, рассматриваемых в гл. II.

Мы можем теперь вывести отсюда большое число неравенств, выбирая S и скалярное произведение (x, y). Так, мы можем положить
b
(x, y) =   x(t) y(t) dG(t),
a
(7)

где интеграл понимается в смысле Стилтьеса и G(t) не убывает для atb, или
 n
(x, y) =  aij xi yj ,
i, j=1
(8)

где A = (aij) – положительно определённая матрица и т.д.


§ 3. Тождество Лагранжа

Весьма интересной и трудной задачей со многими неожиданными разветвлениями является доказательство любого данного известного неравенства при помощи тождества, которое делает это неравенство очевидным. Неравенство (2.3) вытекает непосредственно из тождества
 n  n  n  n
(  xi2 )(  yi2 )  –  (  xi yi ) 2  =   (xi yjxj yi)2;
i=1 i=1 i=1 i, j=1
i < j
(1)
 

последнее представляет собой также частный случай более общего тождества, рассматриваемого в § 6 гл. II.


§ 4. Неравенство между арифметическим и геометрическим средними

Мы начнём рассмотрение несколько более глубоких результатов с одного неравенства – вероятно, самого важного и, несомненно, являющегося одним из столпов теории неравенств, – именно с неравенства между арифметическим и геометрическим средними. Это исключительно красивое неравенство может быть сформулировано следующим образом.

Теорема 1. Пусть x1, x2, ..., xnнеотрицательные числа и n ≥ 1. Тогда

 x1 + x2 + ... + xn

n

 ≥ (x1 x2 ... xn )1/n.
(1)

Здесь имеет место строгое неравенство, если только не все xi равны между собой.

В §§ 5–16 мы изложим двенадцать доказательств этого фундаментального неравенства, основанных на разных принципах, или по крайней мере использующих разные приёмы. Существуют обобщения неравенства (1), относящиеся к взвешенным средним. Интересно отметить, что фактически они являются частными случаями этого неравенства и его предельных случаев. См. § 14 ниже; подробное изложение этих вопросов можно найти также в [1].


§ 5. Индукция вверх и вниз

Следующее классическое доказательство теоремы 1 принадлежит Коши [2]. Как уже отмечено в (2.1), для любых y1 и y2 мы имеем

y12 + y22 ≥ 2y1 y2 . (1)

Полагая y12 = x1, y22 = x2, мы получаем из (1), что

 x1 + x2

2

  ≥ Ö

 x1 x2

 .
(2)

где x1 и x2 – любые неотрицательные числа. Из (2.1) мы уже знаем, что в (2) равенство имеет место тогда и только тогда, когда x1 = x2.

Заменим теперь x1 новой переменной ½(x1 + x2) и x2 – новой переменной ½(x3 + x4). Тогда из неравенства (2), применённого дважды, мы найдём, что

 x1 + x2 + x3 + x4

4

  ≥      x1 + x2

2

   x3 + x4

2

  1/2   ≥
(3)

≥ [(x1 x2 )1/2 (x3 x4 )1/2 ]1/2 = (x1 x2 x3 x4 )1/4.

Продолжая таким же образом, мы легко убеждаемся в том, что неравенство (4.1) справедливо для n = 1, 2, 4, ..., и вообще для любого n, являющегося степенью 2. Это – индукция вверх.

Применим теперь индукцию вниз. Покажем, что если неравенство справедливо для n, то оно справедливо и для n – 1. Заменим в (4.1) xn на

 x1 + x2 + ... + xn–1

n – 1

 ,
(4)

где n ≥ 2, и оставим другие xi неизменными. Тогда по (4.1) мы получим неравенство

 x1 + x2 + ... + xn–1 +    x1 + x2 + ... + xn–1

n – 1 


 ≥
n
(5)
  ≥ (x1 x2 ... xn–1)1/n (  x1 + x2 + ... + xn–1

n – 1

) 1/n ,

или
 x1 + x2 + ... + xn–1

n – 1

  ≥ (x1 x2 ... xn–1)1/n (  x1 + x2 + ... + xn–1

n – 1

) 1/n .
(6)

Упростив, найдём искомое неравенство

 x1 + x2 + ... + xn–1

n – 1

  ≥ (x1 x2 ... xn–1)1/(n–1).
(7)

В сочетании с результатом, полученным для степеней 2, мы имеем теперь индуктивное доказательство теоремы.

Другим интересным неравенством, которое также может быть доказано индукцией вверх и вниз, является следующее неопубликованное неравенство Фань Цзы: если 0 < xi ≤ ½ для i = 1, 2, ..., n, то
 n
 xi
i=1
 ≤ 
 n
 (1 – xi )
i=1
 ,
   n    n
 xi
i=1
   n    n
 (1 – xi )
i=1
(8)

причём равенство имеет место только в том случае, когда все xi равны между собой.


§ 6. Анализ и множители Лагранжа

Подойдём теперь к неравенству между арифметическим и геометрическим средними как к задаче из анализа. Мы хотим найти наименьшее значение функции x1 + x2 + ... + xn в области неотрицательных xi удовлетворяющих условию нормировки

x1x2 ... xn = 1. (1)

Так как ясно, что искомое наименьшее значение не может приниматься в граничной точке, то мы можем применить метод множителей Лагранжа для определения локального минимума. Для функции

f (x1, x2, ..., xn) = x1x2 ... xn – λ(x1 + x2 + ... + xn) (2)

необходимые условия экстремума имеют вид

f 

xi

 =   x1x2 ... xn

xi

 – λ = 0,     i = 1, 2, ..., n,
(3)

так что должно быть x1 = x2 = ... = xn. Отсюда мы заключаем, что имеется единственная точка локального минимума xi = 1, i = 1, 2, ..., n и, следовательно, x1 + x2 + ... + xnn, что равносильно неравенству (4.1).


§ 7. Функциональные уравнения

Теорема 1 может быть также доказана методом функциональных уравнений динамического программирования [3]. Мы начнём с задачи отыскания наибольшего значения x1x2 ... xn при условиях

x1 + x2 + ... + xn = a,     xi ≥ 0.

Обозначим это наибольшее значение через fn(a), n = 1, 2, ..., a ≥ 0. Чтобы получить рекуррентное соотношение между fn(a) и fn–1(a), заметим, что при фиксированном выборе xn остаётся задача такого выбора x1, x2, ..., xn–1, подчинённых условиям

x1 + x2 + ... + xn–1 = axn ,     xi ≥ 0, (1)

чтобы произведение x1x2 ... xn было наибольшим.

Отсюда следует, что

 fn(a) =max[xn fn–1(axn )],     n = 2, 3, ...,
0 ≤ xna
(2)

при f1(a) = a.

Произведя замену переменных хi = ayi ,   i = 1, 2, ..., n, мы будем иметь

 fn (a) = anfn (1). (3)

Подставляя это представление в (2), найдём, что

 fn(1) = fn–1(1)[ max  y(1 – y)n–1] =   fn–1(1)(n – 1)n–1

nn

 .
0 ≤ y ≤ 1
(4)

Так как f1(1) = 1, то fn (1) = 1/nn, что равносильно (4.1).


§ 8. Вогнутость

Предложим теперь доказательство теоремы 1, основанное на геометрических рассуждениях [4, 5, 6, 7]. На рис. 1 изображена кривая y = ln x. Дифференцирование показывает, что эта кривая вогнута, так что хорда, соединяющая две любые её точки, лежит под кривой. Следовательно, для x1, x2 > 0,

ln  (  x1 + x2

2

)  ≥   ln x1 + ln x2 

2

 ,
(1)

причём равенство имеет место только при x1 = x2.


Рис. 1

Этот результат равносилен неравенству
 x1 + x2

2

  ≥ Ö

 x1 x2

 .
(2)

Аналогичное рассуждение показывает, что

ln  (  x1 + x2 + ... + xn

n

)  ≥   ln x1 + ln x2 + ... + ln xn 

n

(3)

для x1, x2, ..., xn > 0 и, вообще, что

ln  (  λ1x1 + λ2x2 + ... + λn xn

λ1 + λ2 + ... λn

)  ≥   λ1 ln x1 + λ2 ln x2 + ... + λn ln xn 

λ1 + λ2 + ... λn

(4)

для любых xi ≥ 0 и λi > 0.

Это неравенство кажется более сильным, чем теорема 1, но, как уже было замечено в § 4, оно в действительности может быть получено из (4.1) специальным выбором значений xi и предельным переходом; см. § 14 и 16 ниже.


§ 9. Мажоризация – доказательство Бора

Замечательное доказательство теоремы 1 принадлежит Г. Бору [8].

Сначала введём понятие мажоризации. Пусть (y) и g(y) – два формальных степенных ряда:
 f (y) =  an yn,     g(y) =  bn yn,
n=0n=0
(1)

где an, bn ≥ 0 для n ≥ 0.

Если anbn для n ≥ 0, то мы пишем

 f (y) ññ g(y). (2)

Если f1(y) ññ g1(y) и f2(y) ññ g2(y), то, очевидно, и f1(y)f2(y) ññ g1(y)g2(y).

Начиная с простой мажоризации

 exy ññ   xNyN

N!

(3)

для N = 1, 2, ... и x ≥ 0, y ≥ 0, мы находим, что
 n
 exp (  y  xi )  ññ    (x1 x2 ...xn )NynN

(N!)n

 .
i=1
(4)

Отсюда, сравнивая коэффициенты при ynN, получаем неравенство
( n

 i=1
 xi ) nN
 
 ≥   (x1 x2 ...xn )N

(N!)n

 ,
(nN)!


(5)

или
( n

 i=1
 xi ) n
 
 ≥    (nN)!

(N!)n

   1/N ,
x1 x2 ...xn


(6)

для всех положительных целых N.

Так как по формуле Стирлинга при k → ∞

 k! ~ kke–k k , (7)

то
lim   (nN)!

(N!)n

   1/N = nn.
N → ∞ 
(8)

Из (6) и (8) следует теорема 1. Это – единственное из приводимых нами доказательств, не позволяющее усмотреть условия, при которых имеет место знак равенства.


§ 10. Доказательство Гурвица

Перейдём теперь к изложению интересного доказательства Гурвица [9]. Оно было опубликовано в 1891 году, за шесть лет до его знаменитой работы о получении инвариантов интегрированием по группам [10], но в нём уже заложены некоторые идеи, получившие развитие в его более поздних работах.

Пусть дана функция n действительных переменных (x1, x2, ..., xn ). Обозначим через Pf (x1, x2, ..., xn ) сумму f по всем n! перестановкам аргументов xi. Так, например,
Px1n = (n – 1)!·(x1n + x2n + ... + xnn), ü
ý
Px1 x2 ... xn = nx1 x2 ... xn . þ
(1)

Рассмотрим функции φk, k = 1, 2, ..., n – 1, получаемые следующим образом:

φ1  = P[(x1n–1x2n–1)(x1x2)], ü
φ2  = P[(x1n–2x2n–2)(x1x2) x3], ï
φ3  = P[(x1n–3x2n–3)(x1x2) x3x4], ý
· · · · · · · · · · · · · · · · · · ï
φn–1  = P[(x1x2)(x1x2) x3x4...xn], þ
(2)

Мы видим, что

φ1 = Px1n + Px2nPx1n–1 x2Px2n–1 x1 = 2Px1n – 2Px1n–1 x2. (3)

Аналогично
φ2  = 2Px1n–1 x2 – 2Px1n–2 x2x3, ü
φ3  = 2Px1n–2 x2x3 – 2Px1n–3 x2x3x4, ï
ý
· · · · · · · · · · · · · · · · · · ï
φn–1  = 2Px12 x2x3 ... xn–1 – 2Px1x2 ... xn . þ
(4)

Суммируя, получаем, что

φ1 + φ2 + ... + φn–1 = 2Px1n – 2Px1x2 ... xn. (5)

Но в силу (1) это означает, что

 x1n + x2n + ... + xnn

n

 x1x1 ... xn 1

2 n!

 (φ1 + φ2 + ... + φn–1).
(6)

Легко видеть, что каждая из функций φk(x) неотрицательна для xi ≥ 0, так как

φk  = P[(x1nkx2nk)(x1x2) x3x4 ... xk+1] =
= P[(x1x2)2 (x1nk–1 + ... + x2nk–1) x3x4 ... xk+1].
(7)

Таким образом, разность в левой части тождества (6) неотрицательна, что и доказывает теорему 1. Это единственное из приводимых нами доказательств, которое сводит неравенство (4.1) к тождеству.


§ 11. Доказательство Элерса

Мы докажем теорему 1, установив, что из

x1x2 ... xn = 1,     xi ≥ 0,

вытекает неравенство [11]

x1 + x2 + ... + xnn.

Допустим, что это справедливо для n и что

x1x2 ... xnxn+1 = 1.

Пусть x1 и x2 – два из чисел xi, такие, что x1 ≥ 1, а x2 ≤ 1. Тогда (x1 – 1)(x2 – 1) ≤ 0, или

x1x2 + 1 ≤ x1 + x2. (1)

Отсюда вытекает, что

x1 + x2 + x3 + ... + xn+1 ≥ 1 + x1x2 + x3 + ... + xn+1 ≥ 1 + n (2)

в силу неравенства для n чисел x1x2, x3, ..., xn, xn+1. Далее, результат тривиален для n = 1, и теорема 1 доказана. См. [12].


§ 12. Арифметико-геометрическое среднее Гаусса. Элементарные симметрические функции

Пусть a0, b0 – положительные числа и a0b0. Определим дальнейшие члены последовательностей {an}, {bn}, соотношениями

 an+1  an + bn

2 

 ,     bn+1 = (anbn )1/2;.
(1)

Легко видеть, что

a0a1 ≥ ... ≥ an ≥ ... ≥ bn ≥ ... ≥ b1b0 , (2)

и можно доказать, что последовательности {an} и {bn} имеют общий предел M(a0, b0). Эта функция M(a0, b0) была впервые исследована Гауссом [13]. Она играет важную роль в теории эллиптических функций; более того, Гаусс показал, как вся эта теория может быть основана на этой функции.

Сделанное выше утверждение относительно сходимости последовательностей {an} и {bn} допускает далеко идущие обобщения. Например, если a0b0c0 > 0 и

 an+1  an + bn + cn

3 

 ,     bn+1 (  an bn + bn cn + cn an

3 

) 1/2 ,     cn+1 = (anbn cn )1/3.
(3)

то легко показать, что

lim  an = lim  bn = lim  cn = M(a0, b0, c0);
n → ∞n → ∞n → ∞
(4)

см. Шапира [14], Шлезингер [15] и Беллман [16], где устанавливается много других результатов относительно симметрических средних.

Один из способов доказательства результатов о симметрических средних состоит в применении некоторых интересных неравенств между элементарными симметрическими функциями n действительных переменных. Оказывается, что неравенство между арифметическим и геометрическим средними является лишь одним из звеньев цепочки аналогичных неравенств.

Следуя изложению в [1], мы применим метод доказательства, основанный на теореме Ролля. Этот метод показывает, что полезные следствия можно извлекать (как мы это сделали в § 2) не только из того факта, что данный многочлен не имеет действительных корней, но и из предположения, что все корни многочлена действительны.

Необходимый нам результат является непосредственным следствием из теоремы Ролля; он состоит в следующем.

Лемма. Если все корни x/y уравнения

f (x, y) ≡ c0xm + c1xm–1y + ... + cmym = 0 (5)

действительны, то действительными будут также все корни уравнений, полученных из (5) частными дифференцированиями по х и по у.

Применим эту лемму к многочлену

f (x, y) ≡ (x + r1 y)(x + r2 y) ... (x + rn y),

где ri действительны. Полагая
 f (x, y) ≡ xn + p1 (  n
1
)  xn–1y + p2 (  n
2
)  xn–2y2 + ... + pn yn,

где

(  n
 k
)  =  n!

k! (nk)!

 ,

p0 = 1 и (для k = 1, 2, ..., n) pk является k симметрической функцией с соответствующим весом чисел ri , мы видим, что уравнение

pk–1 x2 + 2pk xy + pk+1 y2 =0     (k = 1, 2, ..., n – 1),

которое может быть получено из (x, y) = 0 повторным дифференцированием, имеет два действительных корня. Таким образом,

pk–1 pk+1pk2,     k = 1, 2, ..., n – 1. (6)

Заметим, что это неравенство имеет место для любых ri , положительных, отрицательных или равных нулю.

Выведем теперь из неравенства (6) один результат, принадлежащий Маклорену [17]. Для этого предположим, что все ri положительны. Тогда в силу (6) имеет место неравенство

(p0 p2 )(p1 p3 )2 (p2 p4 )3 ... (pk–1 pk+1 )kp12 p24 ... pk2k, (7)

или

pk1/kpk+11/(k+1),     k = 1, 2, ..., n – 1. (8)

Из (8) мы, в частности, получаем, что

p1pn1/n,

т. е. неравенство между арифметическим и геометрическим средними.


§ 13. Доказательство Якобсталя

Существует ряд доказательств неравенства между арифметическим и геометрическим средними, основанных на алгебраических соотношениях между этими средними. Интересным примером таких доказательств является следующее [18].

Начнём с тождества

 An  Gn–1

n 

    (n – 1)   An–1

 Gn–1

 +  ì  Gn

 Gn–1

ü n    ,
î þ
(1)

где

 An 1

 n

   n

 i=1
 xi ,     Gn (  n

 i=1
 xi ) 1/n
 
.

Далее применим неравенство

zn + n – 1 ≥ nz, (2)

справедливое для z ≥ 0 и n ≥ 1. Для целых значений n соотношение (2) вытекает из тождества

znnz + n – 1 ≡ (z – 1)(zn–1 + zn–2 + ... + zn + 1).

Если мы положим

 z  Gn

 Gn–1

 ,

то получим из (1) неравенство

 An ≥   Gn–1

n 

    (n – 1)   An–1

 Gn–1

 – (n – 1) +   nGn

 Gn–1

   ,
(3)

или

 AnGn ≥   n – 1

n

 (An–1Gn–1). 
(4)

По индукции мы находим отсюда искомый общий результат:

AnGn ≥ 0.


§ 14. Одно фундаментальное соотношение

Замечательные неравенства [ср. (13.2)]

 xα – αx + α – 1 ≥ 0,     α > 1 или α < 0,
(1)
 xα – αx + α – 1 ≤ 0,     0 < α < 1,
(2)

справедливые для x > 0, являются фундаментальными для всей теории, ибо из них непосредственно вытекает неравенство между арифметическим и геометрическим средними, а также основные неравенства Гёльдера и Минковского.

Неравенства (1) и (2) легко доказываются простым применением дифференциального исчисления. Равенство имеет в них место только для x = 1.

Более длинное, но зато и более элементарное доказательство этих неравенств состоит в следующем [1]: для y > 0 и n = 1, 2, ... тождество

 yn+1 – 1

n + 1

 –   yn – 1

n

   y – 1

n(n + 1)

 (nynyn–1 – ... – y – 1)

показывает, что

 yn+1 – 1

n + 1

 –   yn – 1

n

  ≥ 0.

причём равенство имеет место только при y = 1. Следовательно, для любого целого m > n

 ym – 1

m

 –   yn – 1

n

  ≥ 0,

откуда при y = x1/n, x > 0, вытекает неравенство

 xm/n – 1 –   m

n

 (x – 1) ≥ 0,

которое совпадает с неравенством (1) при рациональных значениях α > 1, а именно

 xm/n –   m

n

 x  m

n

 – 1 ≥ 0,        m

n

 > 1,
(3)

причём равенство имеет место только при x = 1.

Неравенство (1) для иррациональных α > 1 вытекает из (3) при m/n → α, но при предельном переходе строгое неравенство для x ≠ 1 теряется. Чтобы его восстановить, положим α = rβ, где r > 1 и β > 1, но r рационально. Тогда

xα – αx + α – 1 = (xβ)rrβx + rβ – 1 > rxβrβx + rβ – r ≥ 0,

и это завершает доказательство неравенства (1) при α > 1.

Подстановка

xα = x1–β = yβ–1,     α > 1,

в (1) приводит к неравенству

y–1 (yβ – βy + β – 1) ≥ 0,     β < 0,

так что (1) действительно имеет место и при α < 0. Аналогичная подстановка

xα = x1/β = y,     α > 1,

показывает, что (2) имеет место при 0 < α < 1. Как и прежде, равенство имеет место в (1) при α < 0 и в (2) при 0 < α < 1 только при x = 1. В предельных случаях α = 0 и α = 1 равенство тривиально для всех x > 0:

xα – αx + α – 1 ≡ 0,   если α = 0   или   α = 1.

Чтобы теперь вывести неравенство между арифметическим и геометрическим средними, заметим, что для x1, x2 > 0 подстановка

 x =  x1

x2


в (2) приводит к неравенству

(  x1

x2

) α – α   x1

x2

 + α – 1 ≤ 0,

из которого вытекает, что

x1α x21–α ≤ αx1 + (1 – α)x2,     0 < α < 1,

а это и есть искомое неравенство для двух произвольных чисел x1, x2 ≥ 0 и произвольных положительных весов α и 1 – α. Равенство в нём имеет место только при x1 = x2.

Общий результат
 n

 i=1
 xi αi
 
≤   n

 i=1
αi xi
(4)

при
 xi ≥ 0,     αi > 0,      n

 i=1
αi = 1
(5)

легко получается по индукции. В этот результат входит также утверждение, что равенство в (4) имеет место только при xi = xj для всех i, j = 1, 2, ..., n. В самом деле, если (4) справедливо для n, то для

 xi ≥ 0,     αi > 0,     n+1

 i=1
αi = 1

положим

yi = xi ,     βi = αi ,     i = 1, 2, ..., n – 1,

и
     αn n    αn+1 n  
 yn =  xn  xn+1 ,     βn = αn + αn+1.

Очевидно, что

 yi ≥ 0,     βi > 0,      n

 i=1
βi = 1,

и, следовательно, по индуктивному предположению

n+1

 i=1
 xi αi
 
 n

 i=1
 yi βi
 
≤   n

 i=1
βi yi =
 n    αn n    αn+1 n n+1
αi xi + (αn + αn+1)(  xn  xn+1 ) ≤  αi xi ,
 i=1    i=1  

причём равенство всюду имеет место только в том случае, когда все xi равны между собой.

Таким образом, мы вновь (ср. с § 8) доказали неравенство (4) для произвольных xi, αi удовлетворяющих условиям (5); но на этот раз наше доказательство для произвольных действительных (необязательно рациональных) αi является предельно элементарным.

Неравенства (1) и (2) могут быть записаны в симметричной форме, если положить x = a/b (a > 0, b > 0) и

 α =  1 

 p

,     1 – α =  1 

 q

      (p, q ≠ 0 и ≠ 1).

Тогда
 1 

 p

 +   1 

 q

= 1,    q =  p 

 p – 1

,    p =  q 

 q – 1

,
ü
ý
 p – 1 =  p 

 q

,    q – 1 =  q 

 p

,    (p – 1)(q – 1) = 1.
þ
(6)

Сами же неравенства (1) и (2) примут вид

a1/p b1/q ≤   a 

 p

 +   b 

 q

    или    a1/p b1/q ≥   a 

 p

 +   b 

 q

 ,
(7)

в зависимости от того, является ли p > 1 или p < 1 (p ≠ 0). Равенство в неравенствах (7) имеет место только при a = b. Легко проверить, что для p > 0 второе неравенство (7) имеет место при несколько более общих предположениях a ≥ 0, b ≥ 0.


§ 15. Неравенство Юнга

Пусть y = φ(x) – непрерывная строго возрастающая функция от x, x ≥ 0 и φ(0) = 0 (см. рис. 2). Рассматривая площади, представленные соответствующими интегралами, мы убеждаемся в том, что
 a  b
 ab φ(x)dx + φ–1(y)dy, 
0 0
(1)

где φ–1(y) – функция, обратная к φ(x). Легко видеть, что равенство здесь имеет место только при b = φ(a). Это неравенство называется неравенством Юнга [19].

Выбирая в качестве φ различные функции, мы получаем ряд интересных результатов.

При y = x p–1, p > 1, (1) принимает вид

ab ≤   a p

p 

 +   bq

q 

.
(2)

Это – первое из неравенств (14.7). Из него могут быть легко получены другие результаты, приведённые в § 14.


Рис. 2

Выбирая y = φ(x) = ln(x + 1) в неравенстве Юнга (1) и заменяя a на a – 1, мы получаем другой интересный результат, а именно неравенство

aba ln aa + eb.

Это неравенство часто применяется в теории рядов Фурье.


§ 16. Средние Mt (x,α) и суммы St (x)

В § 12 мы видели, что неравенство между арифметическим и геометрическим средними является лишь одним из цепочки неравенств, которым удовлетворяют элементарные симметрические функции. Покажем теперь, что эти средние включаются в целую непрерывную иерархию средних значений. Хотя для рассматриваемых здесь неравенств существуют элементарные доказательства, мы будем в основном применять дифференциальное исчисление. Нашим главным орудием будет теория выпуклых функций; в частности, мы здесь изложим аналитическую основу тех геометрических рассуждений, которые были приведены в § 8. Общая теория выпуклых функций и их приложений рассматривается в работах Беккенбаха [6] и Грина [7].

Для любых положительных значений

(x) ≡ (x1, x2, ..., xn )

и положительных весов

(α) ≡ (α1, α2, ..., αn ),      n

 i=1
αi = 1,

и любого действительного t ≠ 0 мы определяем среднее порядка t, или t-норму, значений (x) с весами (α) как

 n
 Mt (x, α) ≡  ( αi xit ) 1/t .
i=1

В частности, средние порядков  –1, 1 и 2 суть соответственно гармоническое, арифметическое и квадратическое средние.

При помощи правила Лопиталя легко устанавливается, что

 n    αi
lim  Mt (x, α) =   xi ,
t → 0 i=1
(1)

т. е. геометрическому среднему. Далее, если xk = max(x), то очевидно, что для t > 0

αk1/t xkMt (x, α) ≤ xk ,

откуда вытекает, что

lim  Mt (x, α) = max(x).
t → ∞
(2)

Но из соотношения

 M–t (x, α) =  1

Mt (1/x, α)


теперь следует, что

lim  Mt (x, α) = min(x).
t → –∞
(3)

В силу этого мы полагаем
 n    αi
 M0 (x, α) =   xi ,
i=1

M(x, α) = max(x),
M–∞ (x, α) = min(x).

Если относительно xi предполагается только, что они неотрицательны и что по крайней мере одно из них равно нулю, то для t ≤ 0 среднее Mt (x, α) полагается равным нулю. Однако мы будем рассматривать только положительные xi.

Покажем теперь, что для положительных xi среднее Mt (x, α) является неубывающей функцией от t для –∞ ≤ t ≤ ∞, причём если только не все xi равны между собой, то Mt (x, α) даже строго возрастает. Неравенство между арифметическим и геометрическим средними является частным случаем этого утверждения.

Для обоснования этого общего факта сделаем сначала одно замечание относительно выпуклых функций. Если функция (x) имеет вторую производную, удовлетворяющую неравенству

d2f

dx2

 > 0
(4)

для a < x < b, то график   y = (x) представляет собой выпуклую дугу в этом интервале. Если значения

(x) ≡ (x1, x2, ..., xn )

лежат в интервале (a, b), a

 x  n

 i=1
αi xi ,

то х также лежит в (a, b), и по формуле Тейлора

 f (xi) = f (x) + (xix) f ' (x) +  (xix)2

2!

 f '' i ).

Умножая на αi и складывая эти неравенства, мы получаем

 n

 i=1
αi f (xi ) = f (x) +   n

 i=1
(xix)2

2!

 f '' i ),

а отсюда в силу (4) следует, что

 n

 i=1
αi f (xi ) ≥ f (  n

 i=1
αi xi ) ,
(5)

причём равенство имеет место только тогда, когда все xi равны между собой; см. § 8.

В частности, для функции

f (x) = x ln x,     x > 0,

мы имеем

d2f

dx2

 =   1 

 x

 > 0

так что в силу неравенства (5) для положительных значений (x) справедливо неравенство

 n

 i=1
αi xi ln xi (  n

 i=1
αi xi ) ln (  n

 i=1
αi xi ) ;
(6)

равенство имеет место только в том случае, когда все xi равны между собой.

Нетрудно проверить, что

t2

Mt (x, α)

 n

 i=1
αi xit  dMt (x, α)

dt

 =  n

 i=1
αi xit ln xit –  (  n

 i=1
αi xit ) ln  (  n

 i=1
αi xit ) ,

и неравенство (6), применённое к значениям (xt ), показывает, что

dMt (x, α)

dt

 ≥ 0;

равенство имеет место только в том случае, когда все xi равны между собой.

Таким образом, если не все xi равны между собой, то Mt является строго возрастающей функцией от t и её график имеет две горизонтальные асимптоты. Можно было бы в связи с этим предполагать, что график Mt имеет только одну точку перегиба, т. е. состоит из одной вогнутой и одной выпуклой части. Оказывается, что это не всегда так [20], однако легко показать, что t ln Mt (x, α) – выпуклая функция от t (для этого надо после дифференцирования применить неравенство Коши). Следовательно, в силу (5) функция Mt (x, α) удовлетворяет неравенству

T  n αi ti
M  ≤   M
T i=1 ti
(7)

для произвольных ti и

 T  n

 i=1
αi ti ,    αi > 0,      n

 i=1
αi = 1.
(8)

Сумма порядка t,
 n
 St (x) =  ( xit ) 1/t ,
i=1

ведёт себя как функция от t совсем по-другому. При t, возрастающем от –∞ до 0–, она монотонно убывает от min(x) до 0, а при t, возрастающем от 0+ до +∞, она монотонно убывает от ∞ до max(x).

Неравенство

S (x) ≤ S (x),     0 < t1 < t2, 
t2 t1

иногда называют неравенством Иенсена [21, 22], хотя так же называют неравенство (5), которое справедливо для любых непрерывных выпуклых функций, а не только для функций с положительной второй производной.

Из того факта, что t ln Mt (x, α) является выпуклой функцией от t, легко следует, что t ln St (x) также является выпуклой функций от t. Поэтому неравенство (7) имеет место и для S вместо M.

Функция St (x) не обязательно вогнута для t < 0 [24]; но она всегда выпукла для t > 0 [23, 24]. Соответственно St удовлетворяет неравенству
 n
 ST ≤  αi S
i=1 ti

для произвольных ti > 0 и T и αi , подчинённых условиям (8). В действительности имеет место более сильное утверждение, что ln St является выпуклой функцией от t для t > 0, так что в силу (5) даже
 n αi
 ST ≤   S .
i=1 ti


БИБЛИОГРАФИЯ
[1]

G.H.Hardy, J.E.Littlewood, G.Polya. Inequalities, London, Cambridge University Press, 1951. Русский перевод издания 1934 г.: Харди, Литлвуд, Пойа. Неравенства, М., ИЛ, 1948. назад к тексту

[2]

A.L.Cauchy. Cours d'Analyse de l'Ecole Royale Polytechnique, Ire partie. Analyse algébrique, Paris, Debure, 1821, Oeuvres complètes, IIe série. III. назад к тексту

[3]

R.Bellman. Dynamic programming, Princeton, N.J., Princeton University Press, 1957. Русский перевод: Р.Беллман. Динамическое программирование, М., ИЛ, 1960. назад к тексту

[4]

T.Bonnesen, W.Fenchel. Theorie der konvexen Körper, Berlin, Springer 1951. назад к тексту

[5]

E.R.Lorch. Differential inequalities and the theory of convex bodies, Trans. Am. Math. Soc., 71 (1951), 243–256. назад к тексту

[6]

E.F.Beckenbach. Convex functions, Bull. Am. Math. Soc., 54 (1948), 439–460. назад к тексту

[7]

J.W.Green. Recent applications of convex functions, Am. Math. Monthly, 61 (1954), 449–454. назад к тексту

[8]

H.Bohr. The arithmetic and geometric means, J. London Math. Soc., 10 (1935), 114. назад к тексту

[9]

A.Hurwitz. Über den Vergleich der arithmetischen und des geometrischen Mittels, Math. Werke, 505–507, Basel, Birkhäuser, 1933. назад к тексту

[10]

A.Hurwitz. Über die Erzeugung der Invarianten druch Integration, Math. Werke, 546–564, Basel, Birkhäuser, 1933. назад к тексту

[11]

G.Ehlers в книге: W.D.Hayes (ed.), Colloquium on linear equations, Office of Naval Research Technical Report ONRL-35-54, 1954. назад к тексту

[12]

P.H.Diananda. A simple proof of the arithmetic mean – geometric mean inequality, Am. Math. Monthly, 67 (1960), 1007. назад к тексту

[13]

C.F.Gauss. Werke, 10, 1, 172–292. Leipzig, Teubner, 1917. назад к тексту

[14]

H.Schapira. Bemerkungen zu der Grenzfunktion algebraischer Iteration, Schlömilch Z., 32 (1887), 310–314. назад к тексту

[15]

L.Schlesinger. Über Gauss'Jugendarbeiten zum arithmetisch-geometrischen Mittel, Deutsche Math. Ver., 20 (1911), 396–403. назад к тексту

[16]

R.Bellman. The symmetric mean, Math. Mirror, Brooklyn College, 9 (1941), 5–6. назад к тексту

[17]

C.Maclaurin. A second letter to Martin Folges, Esq.; concerning the roots of equations with the demonstration of other rules in algebra, Phil. Trans., 36 (1729), 59–96. назад к тексту

[18]

E.Jacobsthal. Über das arithmetische und geometrische Mittel, Norske Vid. Selsk. Forh. (Trondheim), 23 (1951), 122. назад к тексту

[19]

W.H.Young. On classes of summable functions and their Fourier series, Proc. Roy. Soc. (A), 87 (1912), 225–229. назад к тексту

[20]

H.Shniad. On the convexity of mean value functions. Bull. Am. Math. Soc., 54 (1948), 770–776. назад к тексту

[21]

J.L.W.V.Jensen. Sur les fonctions convexes et les inéqualites entre les valeurs moyennes, Acta Math., 30 (1906), 175–193. назад к тексту

[22]

A.Pringsheim. Zur Theorie der ganzen transzendenten Funktionen (Nachträge), Münch. S.-B., 32 (1902), 295–304. назад к тексту

[23]

T.Bonnesen. En bemaerkning om konvekse funktioner, Mathem. Tidsskr. (В), 1928, 18–20. назад к тексту

[24]

E.F.Beckenbach. An inequality оf Jensen, Am. Math. Monthly, 53 (1946), 501–505. назад к тексту

Hosted by uCoz