Неравенства


ERGEBNISSE DER MATHEMATIK UND IHRER GRENZGEBIETE Neue Folge · Heft 30		Э. БЕККЕНБАХ, Р. БЕЛЛМАН
INEQUALITIES by Edwin F. Beckenbach and Richard Bellman		НЕРАВЕНСТВА
		Перевод с английского Г. И. Басса, В. И. Левина Г. А. Шадрина Под редакцией В. И. Левина
SPRINGER-VERLAG BERLIN · GÖTTINGEN · HEIDELBERG 1 9 6 1		ИЗДАТЕЛЬСТВО «МИР» Москва 1 9 6 5

ОГЛАВЛЕНИЕ
Предисловие к русскому изданию		5
Предисловие		7
Глава I.	Основные неравенства и родственные вопросы	9
§1.	Введение
§2.	Неравенство Коши
§3.	Тождество Лагранжа
§4.	Неравенство между арифметическим и геометрическим средними
§5.	Индукция вверх и вниз
§6.	Анализ и множители Лагранжа
§7.	Функциональные уравнения
§8.	Вогнутость
§9.	Мажоризация – доказательство Бора
§10.	Доказательство Гурвица
§11.	Доказательство Элерса
§12.	Арифметико-геометрическое среднее Гаусса. Элементарные симметрические функции
§13.	Доказательство Якобсталя
§14.	Одно фундаментальное соотношение
§15.	Неравенство Юнга
§16.	Средние M_t(x, α) и суммы S_t(x)
§17.	Неравенства Гёльдера и Минковского
	. . .
Глава II.	Положительно определенные матрицы, характеристические числа и положительные матрицы	84
Глава III.	Пространства моментов и резонансные теоремы	141
Глава IV.	Положительные операторы	184
Глава V.	Неравенства для дифференциальных операторов	228

ПРЕДИСЛОВИЕ К РУССКОМУ ИЗДАНИЮ

Более тридцати лет назад, когда Харди, Литлвуд и Пойа писали свою известную монографию о неравенствах, систематическое изложение оказалось возможным только благодаря очень тщательному отбору материала. Уже тогда обилие результатов, непосредственно относящихся к тематике монографии, было таким, что многие интересные и перспективные неравенства не нашли в ней места. В качестве эпиграфа к своей книге авторы избрали строфу Р. Браунинга (Saul. st. 39)

Oh, the little more, and how much it is!
And the little less, and what worlds away!

О, чуть больше – и как много добавляется,
А чуть меньше – и какие миры исчезают!

ярко характеризующую те трудности отбора, с которыми им пришлось столкнуться.

За истекшие тридцать лет объём исследований по неравенствам возрос во много раз и неравенства завоевали много новых областей, в которых они играют главенствующую роль. Тем более трудной была задача отбора и расположения материала, вставшая перед авторами. Они решили эту задачу, разбив, во-первых, книгу на два тома (второй том ещё не вышел), и используя, во-вторых, возможность не доказывать многие из приводимых результатов, которая предоставлена тем, что книга вышла в известной серии «Ergebnisse der Mathematik und ihrer Grenzgebiete» (Neue Folge, № 30), состоящей в основном из обзоров отдельных областей математики. Классификация неравенств в настоящей книге производится не по методам доказательств (один из принципов классификации Харди, Литлвуда и Пойа), а в основном по общности тематики и приложений.

Следует ещё отметить, что написана книга «широкими мазками», изложение во многих местах не затрагивает более тонких исследований, связанных с трудными и интересными вопросами. Так, авторы далеко не всегда приводят наилучшие неравенства (с точными константами), ограничиваясь лишь фактом существования неравенства и не устанавливая точных оценок. Это нельзя, однако, поставить авторам в вину, так как детальная разработка отдельных типов неравенств, какой бы интерес она ни представляла для специалистов, действительно невозможна в рамках такого издания, которое всё же имеет ознакомительно-справочный характер.

Книга Беккенбаха и Беллмана не является поэтому монографией, по которой можно изучать неравенства (как их можно изучать по книге Харди, Литлвуда и Пойа). Но она содержит такое богатство фактов (в большинстве новых и новейших), притом умело систематизированных, и столь обширную библиографию, что она без сомнения окажется очень полезной для широкого круга читателей. По ней можно навести справку, возможно ли неравенство определённого типа, нужное как аппарат для того или иного исследования, она может дать и много стимулов для интересных исследований в области самих неравенств.

В. И. Левин

Г. Г. Харди, Дж. И. Литлвуду и Д. Пойа от двух последователей (на почтительном расстоянии)

ПРЕДИСЛОВИЕ

Со времени выхода в свет классического труда Харди, Литлвуда и Пойа в 1934 г. математики приложили колоссальные усилия к уточнению и обобщению классических неравенств, открытию новых типов неравенств и приложениям неравенств во многих разделах анализа. В качестве примеров приведём теорию дифференциальных уравнений, обыкновенных и с частными производными, в которых доминирующую роль играют неравенства и вариационные принципы, относящиеся к функциям и их производным, многие приложения линейных неравенств в теории игр и математической экономике, возродившие интерес к вопросам выпуклости и пространствам моментов, а также всё новые и новые применения цифровых машин, которые требуют систематического изучения оценок погрешностей, опирающегося на сложные разделы теории матриц и операторов.

Результаты, изложенные в настоящей книге, до некоторой степени отражают все эти разветвления теории неравенств в пограничные области анализа, но нашей основной задачей было изучение неравенств как таковых. Поскольку ясно, что невозможно дать связный отчёт о том взрыве аналитической активности, свидетелями которого мы являлись на протяжении последних 25 лет, нам пришлось ограничиться теми вопросами, которые нас особенно интересовали, и в изучение которых нам удалось внести некоторый вклад.

Мы приводим достаточное число литературных ссылок как для того, чтобы заинтересованный читатель мог проследить историю вопроса, так и для того, чтобы он мог ознакомиться с более сложными аспектами излагаемых результатов. Однако мы не стремились ни к энциклопедичности в подборе тем, ни к полноте библиографических указаний по каждой из избранных тем.

Как и большинство авторов, мы эксплуатировали наших друзей. Мы выражаем нашу сердечную благодарность Фань Цзы за многократное чтение рукописи и за подробнейшим образом разработанные предложения по тексту. За многие ценные замечания и за чтение отдельных глав мы выражаем нашу благодарность Р. П. Боасу, П. Лаксу, Л. Ниренбергу, И. Олкину и О. Тауски.

Мы надеемся, что чтение этой книги доставит столько же удовольствия другим, сколько получили мы, когда её писали.

Лос-Анджелес
и Санта Моника, 1961

Эдвин Ф. Беккенбах
Ричард Беллман

Глава I
ОСНОВНЫЕ НЕРАВЕНСТВА И РОДСТВЕННЫЕ ВОПРОСЫ

§ 1. Введение

В этой вступительной главе мы изложим ряд основных результатов теории неравенств и их доказательства. Некоторые из этих результатов важны сами по себе, другие понадобятся нам в следующих главах. Наконец, некоторые теоремы, так же как и разные варианты доказательств, включены просто потому, что они очень красивы и занимательны [1].

Мы начнём с неравенства Коши и тождества Лагранжа, которые будут значительно обобщены в настоящей и следующей за ней главах. Затем мы обратимся к вопросу, который один заслуживает целой монографии, а именно к знаменитому неравенству об арифметическом и геометрическом средних n неотрицательных чисел. Мы приведём двенадцать доказательств этого фундаментального неравенства, конечно, не из-за недоверия к каждому из них в отдельности, а для того, чтобы продемонстрировать многообразие методов вывода неравенств, которыми располагают алгебра и анализ. Особенно интересны доказательства Коши, Гурвица и Бора.

Не без сожаления оставляя этот вопрос, мы займёмся установлением неравенств Гёльдера и Минковского – этих «рабочих лошадок» анализа – как в дискретном, так и в континуальном вариантах.

Далее мы докажем некоторые родственные, но более сложные результаты Беккенбаха и Дрешера. Здесь мы используем важный приём квазилинеаризации, впервые применённый Минковским, а затем разработанный Малером. Этим приёмом с успехом пользовались Юнг, Зигмунд и Беллман.

Отсюда мы сделаем скачок к преобразованиям Шура двояко стохастических матриц и к некоторым результатам Карамата, Островского и Харди, Литлвуда и Пойа, относящимся к мажорирующим последовательностям. Мы упомянем также о континуальных аналогах, принадлежащих Фаню и Лоренцу.

Следующей нашей темой является область элементарных симметрических функций. Здесь имеются результаты Маркуса и Лопеса, доказательства которых оказываются гораздо более трудными, чем можно было думать. Самым изящным доказательством этих неравенств является, вероятно, то, которое опирается на теорию смешанных объёмов Минковского; эту теорию мы предполагаем изложить во втором томе «Неравенств». Мы расскажем также о результатах, принадлежащих Уайтли.

После этого мы перейдём к очень интересным вопросам обращения и уточнения классических неравенств. Вместо того чтобы следовать методам Бляшке и Пика или Бюкнера, мы применим здесь (оставляя до гл. 3 и метод моментов) метод Беллмана получения обратных неравенств, основанный на дифференциальных уравнениях. Что касается уточнения неравенств, то мы ограничимся только упоминанием некоторых результатов, отсылая читателя к соответствующим источникам.

Последняя часть главы посвящена некоторым неравенствам, относящимся к суммам с знакочередующимися членами, рассмотренным Вейнбергером, Сегё, Олкином, Беллманом и другими. Все эти неравенства оказались частными случаями нового неравенства Стеффенсена.

§ 2. Неравенство Коши

Самым фундаментальным неравенством является то, которое выражает неотрицательность квадрата любого действительного числа. Чтобы эффективно использовать это утверждение, применим его к разности y₁– y₂, где y₁ и y₂ – действительные числа. Тогда неравенство (y₁– y₂)² ≥ 0 приведёт к утверждению

y₁² + y₂² ≥ 2y₁y₂.

(1)

Равенство имеет место тогда и только тогда, когда y₁= y₂. Это – простейший вид неравенства, связывающего арифметическое и геометрическое средние. Следуя Коши, мы будем в дальнейшем доказывать общий результат, основываясь на этом частном случае.

Ещё более эффективно можно применить неотрицательность квадратов, образуя сумму

n n n n

∑ (x_iu + y_iv)² = u² ∑ x_i² + 2uv ∑ x_iy_i + v² ∑ y_i²,

i=1 i=1 i=1 i=1

(2)

в которой все входящие величины действительны.

Так как полученная квадратичная форма относительно u и v неотрицательна для всех действительных значений u и v, её дискриминант должен быть неотрицателен, что и даёт неравенство Коши [2]:

n n n

( ∑ x_iy_i ) ² ≤ ( ∑ x_i² )( ∑ y_i² ) .

i=1 i=1 i=1

(3)

Это неравенство можно рассматривать как выражение того факта, что в евклидовом пространстве любого числа измерений косинус угла по абсолютной величине не превосходит единицы. Равенство имеет место тогда и только тогда, когда системы чисел (x_i) и (y_i) пропорциональны, т.е. тогда и только тогда, когда существуют числа λ и μ, не равные оба нулю, такие, что

λx_i + μy_i = 0, i = 1, 2, ..., n.

Ещё более общие результаты можно получить, применяя предыдущее рассуждение не просто к n-мерному евклидову пространству, а к общему линейному пространству S, в котором для любых двух элементов x и y определено скалярное произведение (x, y) со следующими свойствами:

(а)	(x, x) ≥ 0 xÎS,	ü
(б)	(x, y) = ( y, x),	ý
(в)	(x, uy + vw) = u(x, y) + v(x, w) для любых вещ.скаляров u и v.	þ

(4)

Эти свойства позволяют заключить, что квадратичная форма относительно u и v

(ux + vy, ux + vy) = u²(x, x) + 2uv(x, y) + v²( y, y)

(5)

неотрицательна для всех действительных u и v.

Отсюда, как и выше, мы получаем неравенство

(x, y)² ≤ (x, x)( y, y),

(6)

которое в свою очередь является частным случаем более общих неравенств, рассматриваемых в гл. II.

Мы можем теперь вывести отсюда большое число неравенств, выбирая S и скалярное произведение (x, y). Так, мы можем положить

b

(x, y) = ∫ x(t) y(t) dG(t),

a

(7)

где интеграл понимается в смысле Стилтьеса и G(t) не убывает для a ≥ t ≥ b, или

n

(x, y) = ∑ a_ijx_iy_j,

i, j=1

(8)

где A = (a_ij) – положительно определённая матрица и т.д.

§ 3. Тождество Лагранжа

Весьма интересной и трудной задачей со многими неожиданными разветвлениями является доказательство любого данного известного неравенства при помощи тождества, которое делает это неравенство очевидным. Неравенство (2.3) вытекает непосредственно из тождества

n n n n

( ∑ x_i² )( ∑ y_i² ) – ( ∑ x_iy_i ) ² = ∑ (x_iy_j – x_jy_i)²;

i=1 i=1 i=1 i, j=1

i < j

(1)

последнее представляет собой также частный случай более общего тождества, рассматриваемого в § 6 гл. II.

§ 4. Неравенство между арифметическим и геометрическим средними

Мы начнём рассмотрение несколько более глубоких результатов с одного неравенства – вероятно, самого важного и, несомненно, являющегося одним из столпов теории неравенств, – именно с неравенства между арифметическим и геометрическим средними. Это исключительно красивое неравенство может быть сформулировано следующим образом.

Теорема 1. Пусть x₁, x₂, ..., x_n – неотрицательные числа и n ≥ 1. Тогда

x₁ + x₂ + ... + x_n

≥ (x₁x₂ ... x_n)^1/n.

(1)

Здесь имеет место строгое неравенство, если только не все x_i равны между собой.

В §§ 5–16 мы изложим двенадцать доказательств этого фундаментального неравенства, основанных на разных принципах, или по крайней мере использующих разные приёмы. Существуют обобщения неравенства (1), относящиеся к взвешенным средним. Интересно отметить, что фактически они являются частными случаями этого неравенства и его предельных случаев. См. § 14 ниже; подробное изложение этих вопросов можно найти также в [1].

§ 5. Индукция вверх и вниз

Следующее классическое доказательство теоремы 1 принадлежит Коши [2]. Как уже отмечено в (2.1), для любых y₁ и y₂ мы имеем

y₁² + y₂² ≥ 2y₁y₂.

(1)

Полагая y₁² = x₁, y₂² = x₂, мы получаем из (1), что

x₁ + x₂

≥ Ö

x₁x₂

(2)

где x₁ и x₂ – любые неотрицательные числа. Из (2.1) мы уже знаем, что в (2) равенство имеет место тогда и только тогда, когда x₁ = x₂.

Заменим теперь x₁ новой переменной ½(x₁ + x₂) и x₂ – новой переменной ½(x₃ + x₄). Тогда из неравенства (2), применённого дважды, мы найдём, что

x₁ + x₂ + x₃ + x₄

≥

x₁ + x₂

x₃ + x₄

^1/2

≥

(3)

≥ [(x₁x₂)^1/2(x₃x₄)^1/2]^1/2 = (x₁x₂x₃x₄)^1/4.

Продолжая таким же образом, мы легко убеждаемся в том, что неравенство (4.1) справедливо для n = 1, 2, 4, ..., и вообще для любого n, являющегося степенью 2. Это – индукция вверх.

Применим теперь индукцию вниз. Покажем, что если неравенство справедливо для n, то оно справедливо и для n – 1. Заменим в (4.1) x_n на

x₁ + x₂ + ... + x_n–1

n – 1

(4)

где n ≥ 2, и оставим другие x_i неизменными. Тогда по (4.1) мы получим неравенство

x₁ + x₂ + ... + x_n–1 +	x₁ + x₂ + ... + x_n–1 n – 1	≥
n

(5)

≥ (x₁x₂ ... x_n–1)^1/n

(

x₁ + x₂ + ... + x_n–1

n – 1

)

^1/n

или

x₁ + x₂ + ... + x_n–1
n – 1
≥ (x₁x₂ ... x_n–1)^1/n ( x₁ + x₂ + ... + x_n–1
n – 1
) ^1/n .
(6)

Упростив, найдём искомое неравенство

x₁ + x₂ + ... + x_n–1

n – 1

≥ (x₁x₂ ... x_n–1)^1/(n–1).

(7)

В сочетании с результатом, полученным для степеней 2, мы имеем теперь индуктивное доказательство теоремы.

Другим интересным неравенством, которое также может быть доказано индукцией вверх и вниз, является следующее неопубликованное неравенство Фань Цзы: если 0 < x_i ≤ ½ для i = 1, 2, ..., n, то

n

∏ x_i

i=1

≤

n

∏ (1 – x_i)

i=1

,

n n

∑ x_i

i=1

n n

∑ (1 – x_i)

i=1

(8)

причём равенство имеет место только в том случае, когда все x_i равны между собой.

§ 6. Анализ и множители Лагранжа

Подойдём теперь к неравенству между арифметическим и геометрическим средними как к задаче из анализа. Мы хотим найти наименьшее значение функции x₁ + x₂ + ... + x_n в области неотрицательных x_i удовлетворяющих условию нормировки

x₁x₂ ... x_n = 1.

(1)

Так как ясно, что искомое наименьшее значение не может приниматься в граничной точке, то мы можем применить метод множителей Лагранжа для определения локального минимума. Для функции

f (x₁, x₂, ..., x_n) = x₁x₂ ... x_n – λ(x₁ + x₂ + ... + x_n)

(2)

необходимые условия экстремума имеют вид

∂f

∂x_i

x₁x₂ ... x_n

x_i

– λ = 0, i = 1, 2, ..., n,

(3)

так что должно быть x₁ = x₂ = ... = x_n. Отсюда мы заключаем, что имеется единственная точка локального минимума x_i = 1, i = 1, 2, ..., n и, следовательно, x₁ + x₂ + ... + x_n ≥ n, что равносильно неравенству (4.1).

§ 7. Функциональные уравнения

Теорема 1 может быть также доказана методом функциональных уравнений динамического программирования [3]. Мы начнём с задачи отыскания наибольшего значения x₁x₂ ... x_n при условиях

x₁ + x₂ + ... + x_n = a, x_i ≥ 0.

Обозначим это наибольшее значение через f_n(a), n = 1, 2, ..., a ≥ 0. Чтобы получить рекуррентное соотношение между f_n(a) и f_n–1(a), заметим, что при фиксированном выборе x_n остаётся задача такого выбора x₁, x₂, ..., x_n–1, подчинённых условиям

x₁ + x₂ + ... + x_n–1 = a – x_n, x_i ≥ 0,

(1)

чтобы произведение x₁x₂ ... x_n было наибольшим.

Отсюда следует, что

f_n(a) =	max	[x_n f_n–1(a – x_n)], n = 2, 3, ...,
	0 ≤ x_n ≤ a

(2)

при f₁(a) = a.

Произведя замену переменных х_i = ay_i, i = 1, 2, ..., n, мы будем иметь

f_n(a) = aⁿf_n(1).

(3)

Подставляя это представление в (2), найдём, что

f_n(1) = f_n–1(1)[	max	y(1 – y)^n–1] =	f_n–1(1)(n – 1)^n–1 nⁿ	.
	0 ≤ y ≤ 1

(4)

Так как f₁(1) = 1, то f_n(1) = 1/nⁿ, что равносильно (4.1).

§ 8. Вогнутость

Предложим теперь доказательство теоремы 1, основанное на геометрических рассуждениях [4, 5, 6, 7]. На рис. 1 изображена кривая y = ln x. Дифференцирование показывает, что эта кривая вогнута, так что хорда, соединяющая две любые её точки, лежит под кривой. Следовательно, для x₁, x₂ > 0,

(

x₁ + x₂

)

≥

ln x₁ + ln x₂

(1)

причём равенство имеет место только при x₁ = x₂.

Рис. 1

Этот результат равносилен неравенству

x₁ + x₂
2
≥ Ö
x₁x₂
.
(2)

Аналогичное рассуждение показывает, что

(

x₁ + x₂ + ... + x_n

)

≥

ln x₁ + ln x₂ + ... + ln x_n

(3)

для x₁, x₂, ..., x_n > 0 и, вообще, что

(

λ₁x₁ + λ₂x₂ + ... + λ_nx_n

λ₁ + λ₂ + ... λ_n

)

≥

λ₁ln x₁ + λ₂ln x₂ + ... + λ_nln x_n

λ₁ + λ₂ + ... λ_n

(4)

для любых x_i ≥ 0 и λ_i > 0.

Это неравенство кажется более сильным, чем теорема 1, но, как уже было замечено в § 4, оно в действительности может быть получено из (4.1) специальным выбором значений x_i и предельным переходом; см. § 14 и 16 ниже.

§ 9. Мажоризация – доказательство Бора

Замечательное доказательство теоремы 1 принадлежит Г. Бору [8].

Сначала введём понятие мажоризации. Пусть f (y) и g(y) – два формальных степенных ряда:

∞ ∞

f (y) = ∑ a_nyⁿ, g(y) = ∑ b_nyⁿ,

n=0 n=0

(1)

где a_n, b_n ≥ 0 для n ≥ 0.

Если a_n ≥ b_n для n ≥ 0, то мы пишем

f (y) ññ g(y).

(2)

Если f₁(y) ññ g₁(y) и f₂(y) ññ g₂(y), то, очевидно, и f₁(y)f₂(y) ññ g₁(y)g₂(y).

Начиная с простой мажоризации

e^xy ññ

x^Ny^N

(3)

для N = 1, 2, ... и x ≥ 0, y ≥ 0, мы находим, что

n

exp ( y ∑ x_i ) ññ (x₁x₂...x_n)^Ny^nN
(N!)ⁿ
.

i=1

(4)

Отсюда, сравнивая коэффициенты при y^nN, получаем неравенство

( n
∑
i=1 x_i ) ^nN

≥ (x₁x₂...x_n)^N
(N!)ⁿ
,

(nN)!

(5)

или

( n
∑
i=1 x_i ) ⁿ

≥ (nN)!
(N!)ⁿ
^1/N ,

x₁x₂...x_n

(6)

для всех положительных целых N.

Так как по формуле Стирлинга при k → ∞

k! ~ k^ke^–k√2πk ,

(7)

то

lim (nN)!
(N!)ⁿ
^1/N = nⁿ.

N → ∞

(8)

Из (6) и (8) следует теорема 1. Это – единственное из приводимых нами доказательств, не позволяющее усмотреть условия, при которых имеет место знак равенства.

§ 10. Доказательство Гурвица

Перейдём теперь к изложению интересного доказательства Гурвица [9]. Оно было опубликовано в 1891 году, за шесть лет до его знаменитой работы о получении инвариантов интегрированием по группам [10], но в нём уже заложены некоторые идеи, получившие развитие в его более поздних работах.

Пусть дана функция n действительных переменных f (x₁, x₂, ..., x_n). Обозначим через Pf (x₁, x₂, ..., x_n) сумму f по всем n! перестановкам аргументов x_i. Так, например,

Px₁ⁿ = (n – 1)!·(x₁ⁿ + x₂ⁿ + ... + x_nⁿ), ü

ý

Px₁x₂... x_n = n!·x₁x₂... x_n. þ

(1)

Рассмотрим функции φ_k, k = 1, 2, ..., n – 1, получаемые следующим образом:

φ₁	= P[(x₁^n–1 – x₂^n–1)(x₁ – x₂)],	ü
φ₂	= P[(x₁^n–2 – x₂^n–2)(x₁ – x₂)x₃],	ï
φ₃	= P[(x₁^n–3 – x₂^n–3)(x₁ – x₂)x₃x₄],	ý
· · · · · · · · · · · · · · · · · ·		ï
φ_n–1	= P[(x₁ – x₂)(x₁ – x₂)x₃x₄...x_n],	þ

(2)

Мы видим, что

φ₁ = Px₁ⁿ + Px₂ⁿ – Px₁^n–1x₂ – Px₂^n–1x₁ = 2Px₁ⁿ – 2Px₁^n–1x₂.

(3)

Аналогично

φ₂ = 2Px₁^n–1x₂ – 2Px₁^n–2x₂x₃, ü

φ₃ = 2Px₁^n–2x₂x₃ – 2Px₁^n–3x₂x₃x₄, ï

ý

· · · · · · · · · · · · · · · · · · ï

φ_n–1 = 2Px₁²x₂x₃ ... x_n–1 – 2Px₁x₂ ... x_n. þ

(4)

Суммируя, получаем, что

φ₁ + φ₂ + ... + φ_n–1 = 2Px₁ⁿ – 2Px₁x₂ ... x_n.

(5)

Но в силу (1) это означает, что

x₁ⁿ + x₂ⁿ + ... + x_nⁿ

– x₁x₁ ... x_n =

2 n!

(φ₁ + φ₂ + ... + φ_n–1).

(6)

Легко видеть, что каждая из функций φ_k(x) неотрицательна для x_i ≥ 0, так как

φ_k	= P[(x₁^n–k – x₂^n–k)(x₁ – x₂) x₃x₄ ... x_k+1] =
	= P[(x₁ – x₂)²(x₁^n–k–1 + ... + x₂^n–k–1) x₃x₄ ... x_k+1].

(7)

Таким образом, разность в левой части тождества (6) неотрицательна, что и доказывает теорему 1. Это единственное из приводимых нами доказательств, которое сводит неравенство (4.1) к тождеству.

§ 11. Доказательство Элерса

Мы докажем теорему 1, установив, что из

x₁x₂ ... x_n = 1, x_i ≥ 0,

вытекает неравенство [11]

x₁ + x₂ + ... + x_n ≥ n.

Допустим, что это справедливо для n и что

x₁x₂ ... x_nx_n+1 = 1.

Пусть x₁ и x₂ – два из чисел x_i, такие, что x₁ ≥ 1, а x₂ ≤ 1. Тогда (x₁ – 1)(x₂ – 1) ≤ 0, или

x₁x₂ + 1 ≤ x₁ + x₂.

(1)

Отсюда вытекает, что

x₁ + x₂ + x₃ + ... + x_n+1 ≥ 1 + x₁x₂ + x₃ + ... + x_n+1 ≥ 1 + n

(2)

в силу неравенства для n чисел x₁x₂, x₃, ..., x_n, x_n+1. Далее, результат тривиален для n = 1, и теорема 1 доказана. См. [12].

§ 12. Арифметико-геометрическое среднее Гаусса. Элементарные симметрические функции

Пусть a₀, b₀ – положительные числа и a₀ ≥ b₀. Определим дальнейшие члены последовательностей {a_n}, {b_n}, соотношениями

a_n+1 =

a_n + b_n

, b_n+1 = (a_nb_n)^1/2;.

(1)

Легко видеть, что

a₀ ≥ a₁ ≥ ... ≥ a_n ≥ ... ≥ b_n ≥ ... ≥ b₁ ≥ b₀,

(2)

и можно доказать, что последовательности {a_n} и {b_n} имеют общий предел M(a₀, b₀). Эта функция M(a₀, b₀) была впервые исследована Гауссом [13]. Она играет важную роль в теории эллиптических функций; более того, Гаусс показал, как вся эта теория может быть основана на этой функции.

Сделанное выше утверждение относительно сходимости последовательностей {a_n} и {b_n} допускает далеко идущие обобщения. Например, если a₀ ≥ b₀ ≥ c₀ > 0 и

a_n+1 =

a_n + b_n + c_n

, b_n+1 =

(

a_nb_n + b_nc_n + c_na_n

)

^1/2

, c_n+1 = (a_nb_nc_n)^1/3.

(3)

то легко показать, что

lim	a_n =	lim	b_n =	lim	c_n = M(a₀, b₀, c₀);
n → ∞		n → ∞		n → ∞

(4)

см. Шапира [14], Шлезингер [15] и Беллман [16], где устанавливается много других результатов относительно симметрических средних.

Один из способов доказательства результатов о симметрических средних состоит в применении некоторых интересных неравенств между элементарными симметрическими функциями n действительных переменных. Оказывается, что неравенство между арифметическим и геометрическим средними является лишь одним из звеньев цепочки аналогичных неравенств.

Следуя изложению в [1], мы применим метод доказательства, основанный на теореме Ролля. Этот метод показывает, что полезные следствия можно извлекать (как мы это сделали в § 2) не только из того факта, что данный многочлен не имеет действительных корней, но и из предположения, что все корни многочлена действительны.

Необходимый нам результат является непосредственным следствием из теоремы Ролля; он состоит в следующем.

Лемма. Если все корни x/y уравнения

f (x, y) ≡ c₀x^m + c₁x^m–1y + ... + c_my^m = 0

(5)

действительны, то действительными будут также все корни уравнений, полученных из (5) частными дифференцированиями по х и по у.

Применим эту лемму к многочлену

f (x, y) ≡ (x + r₁y)(x + r₂y) ... (x + r_ny),

где r_i действительны. Полагая
f (x, y) ≡ xⁿ + p₁ ( n
1 ) x^n–1y + p₂ ( n
2 ) x^n–2y² + ... + p_nyⁿ,

где

(

n
k

)

k! (n – k)!

p₀ = 1 и (для k = 1, 2, ..., n) p_k является k-й симметрической функцией с соответствующим весом чисел r_i, мы видим, что уравнение

p_k–1x² + 2p_kxy + p_k+1y² =0 (k = 1, 2, ..., n – 1),

которое может быть получено из f (x, y) = 0 повторным дифференцированием, имеет два действительных корня. Таким образом,

p_k–1p_k+1 ≤ p_k², k = 1, 2, ..., n – 1.

(6)

Заметим, что это неравенство имеет место для любых r_i, положительных, отрицательных или равных нулю.

Выведем теперь из неравенства (6) один результат, принадлежащий Маклорену [17]. Для этого предположим, что все r_i положительны. Тогда в силу (6) имеет место неравенство

(p₀p₂)(p₁p₃)²(p₂p₄)³ ... (p_k–1p_k+1)^k ≤ p₁²p₂⁴ ... p_k^2k,

(7)

или

p_k^1/k ≥ p_k+1^1/(k+1), k = 1, 2, ..., n – 1.

(8)

Из (8) мы, в частности, получаем, что

p₁ ≥ p_n^1/n,

т. е. неравенство между арифметическим и геометрическим средними.

§ 13. Доказательство Якобсталя

Существует ряд доказательств неравенства между арифметическим и геометрическим средними, основанных на алгебраических соотношениях между этими средними. Интересным примером таких доказательств является следующее [18].

Начнём с тождества

A_n =

G_n–1

(n – 1)

A_n–1

G_n–1

G_n

G_n–1

ⁿ

(1)

где

A_n =

n
∑
i=1

x_i, G_n =

(

n
∏
i=1

x_i

)

^1/n

Далее применим неравенство

zⁿ + n – 1 ≥ nz,

(2)

справедливое для z ≥ 0 и n ≥ 1. Для целых значений n соотношение (2) вытекает из тождества

zⁿ – nz + n – 1 ≡ (z – 1)(z^n–1 + z^n–2 + ... + z – n + 1).

Если мы положим

z =

G_n

G_n–1

то получим из (1) неравенство

A_n ≥

G_n–1

(n – 1)

A_n–1

G_n–1

– (n – 1) +

nG_n

G_n–1

(3)

или

A_n – G_n ≥

n – 1

(A_n–1 – G_n–1).

(4)

По индукции мы находим отсюда искомый общий результат:

A_n – G_n ≥ 0.

§ 14. Одно фундаментальное соотношение

Замечательные неравенства [ср. (13.2)]

x^α – αx + α – 1 ≥ 0, α > 1 или α < 0,

(1)

x^α – αx + α – 1 ≤ 0, 0 < α < 1,

(2)

справедливые для x > 0, являются фундаментальными для всей теории, ибо из них непосредственно вытекает неравенство между арифметическим и геометрическим средними, а также основные неравенства Гёльдера и Минковского.

Неравенства (1) и (2) легко доказываются простым применением дифференциального исчисления. Равенство имеет в них место только для x = 1.

Более длинное, но зато и более элементарное доказательство этих неравенств состоит в следующем [1]: для y > 0 и n = 1, 2, ... тождество

yⁿ⁺¹ – 1

n + 1

–

yⁿ – 1

y – 1

n(n + 1)

(nyⁿ – y^n–1 – ... – y – 1)

показывает, что

yⁿ⁺¹ – 1

n + 1

–

yⁿ – 1

≥ 0.

причём равенство имеет место только при y = 1. Следовательно, для любого целого m > n

y^m – 1

–

yⁿ – 1

≥ 0,

откуда при y = x^1/n, x > 0, вытекает неравенство

x^m/n – 1 –

(x – 1) ≥ 0,

которое совпадает с неравенством (1) при рациональных значениях α > 1, а именно

x^m/n –

x +

– 1 ≥ 0,

> 1,

(3)

причём равенство имеет место только при x = 1.

Неравенство (1) для иррациональных α > 1 вытекает из (3) при m/n → α, но при предельном переходе строгое неравенство для x ≠ 1 теряется. Чтобы его восстановить, положим α = rβ, где r > 1 и β > 1, но r рационально. Тогда

x^α – αx + α – 1 = (x^β)^r – rβx + rβ – 1 > rx^β – rβx + rβ – r ≥ 0,

и это завершает доказательство неравенства (1) при α > 1.

Подстановка

x^α = x^1–β = y^β–1, α > 1,

в (1) приводит к неравенству

y^–1(y^β – βy + β – 1) ≥ 0, β < 0,

так что (1) действительно имеет место и при α < 0. Аналогичная подстановка

x^α = x^1/β = y, α > 1,

показывает, что (2) имеет место при 0 < α < 1. Как и прежде, равенство имеет место в (1) при α < 0 и в (2) при 0 < α < 1 только при x = 1. В предельных случаях α = 0 и α = 1 равенство тривиально для всех x > 0:

x^α – αx + α – 1 ≡ 0, если α = 0 или α = 1.

Чтобы теперь вывести неравенство между арифметическим и геометрическим средними, заметим, что для x₁, x₂ > 0 подстановка

x =

x₁

x₂

в (2) приводит к неравенству

(

x₁

x₂

)

^α

– α

x₁

x₂

+ α – 1 ≤ 0,

из которого вытекает, что

x₁^αx₂^1–α ≤ αx₁ + (1 – α)x₂, 0 < α < 1,

а это и есть искомое неравенство для двух произвольных чисел x₁, x₂ ≥ 0 и произвольных положительных весов α и 1 – α. Равенство в нём имеет место только при x₁ = x₂.

Общий результат

n
∏
i=1 x_i α_i
≤ n
∑
i=1 α_ix_i
(4)

при

x_i ≥ 0, α_i > 0, n
∑
i=1 α_i = 1
(5)

легко получается по индукции. В этот результат входит также утверждение, что равенство в (4) имеет место только при x_i = x_j для всех i, j = 1, 2, ..., n. В самом деле, если (4) справедливо для n, то для

x_i ≥ 0, α_i > 0,

n+1
∑
i=1

α_i = 1

положим

y_i = x_i, β_i = α_i, i = 1, 2, ..., n – 1,

и

α_n/β_n α_n+1/β_n

y_n = x_n x_n+1 , β_n = α_n + α_n+1.

Очевидно, что

y_i ≥ 0, β_i > 0,

n
∑
i=1

β_i = 1,

и, следовательно, по индуктивному предположению

n+1
∏
i=1

x_i

α_i

n
∏
i=1

y_i

β_i

≤

n
∑
i=1

β_iy_i =

n		α_n/β_n	α_n+1/β_n		n+1
∑	α_ix_i + (α_n + α_n+1)(	x_n	x_n+1	) ≤	∑	α_ix_i,
i=1					i=1

причём равенство всюду имеет место только в том случае, когда все x_i равны между собой.

Таким образом, мы вновь (ср. с § 8) доказали неравенство (4) для произвольных x_i, α_i удовлетворяющих условиям (5); но на этот раз наше доказательство для произвольных действительных (необязательно рациональных) α_i является предельно элементарным.

Неравенства (1) и (2) могут быть записаны в симметричной форме, если положить x = a/b (a > 0, b > 0) и

α =

, 1 – α =

(p, q ≠ 0 и ≠ 1).

Тогда

1
p
+ 1
q
= 1, q = p
p – 1
, p = q
q – 1
,
ü

ý

p – 1 = p
q
, q – 1 = q
p
, (p – 1)(q – 1) = 1.
þ

(6)

Сами же неравенства (1) и (2) примут вид

a^1/pb^1/q ≤

или a^1/pb^1/q ≥

(7)

в зависимости от того, является ли p > 1 или p < 1 (p ≠ 0). Равенство в неравенствах (7) имеет место только при a = b. Легко проверить, что для p > 0 второе неравенство (7) имеет место при несколько более общих предположениях a ≥ 0, b ≥ 0.

§ 15. Неравенство Юнга

Пусть y = φ(x) – непрерывная строго возрастающая функция от x, x ≥ 0 и φ(0) = 0 (см. рис. 2). Рассматривая площади, представленные соответствующими интегралами, мы убеждаемся в том, что

a b

ab ≤ ∫ φ(x)dx + ∫ φ^–1(y)dy,

0 0

(1)

где φ^–1(y) – функция, обратная к φ(x). Легко видеть, что равенство здесь имеет место только при b = φ(a). Это неравенство называется неравенством Юнга [19].

Выбирая в качестве φ различные функции, мы получаем ряд интересных результатов.

При y = x^p–1, p > 1, (1) принимает вид

ab ≤

a^p

b^q

(2)

Это – первое из неравенств (14.7). Из него могут быть легко получены другие результаты, приведённые в § 14.

Рис. 2

Выбирая y = φ(x) = ln(x + 1) в неравенстве Юнга (1) и заменяя a на a – 1, мы получаем другой интересный результат, а именно неравенство

ab ≤ a ln a – a + e^b.

Это неравенство часто применяется в теории рядов Фурье.

§ 16. Средние M_t(x,α) и суммы S_t(x)

В § 12 мы видели, что неравенство между арифметическим и геометрическим средними является лишь одним из цепочки неравенств, которым удовлетворяют элементарные симметрические функции. Покажем теперь, что эти средние включаются в целую непрерывную иерархию средних значений. Хотя для рассматриваемых здесь неравенств существуют элементарные доказательства, мы будем в основном применять дифференциальное исчисление. Нашим главным орудием будет теория выпуклых функций; в частности, мы здесь изложим аналитическую основу тех геометрических рассуждений, которые были приведены в § 8. Общая теория выпуклых функций и их приложений рассматривается в работах Беккенбаха [6] и Грина [7].

Для любых положительных значений

(x) ≡ (x₁, x₂, ..., x_n)

и положительных весов

(α) ≡ (α₁, α₂, ..., α_n),

n
∑
i=1

α_i = 1,

и любого действительного t ≠ 0 мы определяем среднее порядка t, или t-норму, значений (x) с весами (α) как

		n
M_t(x, α) ≡	(	∑	α_ix_i^t	)	1/t	.
		i=1

В частности, средние порядков –1, 1 и 2 суть соответственно гармоническое, арифметическое и квадратическое средние.

При помощи правила Лопиталя легко устанавливается, что

		n	α_i
lim	M_t(x, α) =	∏	x_i	,
t → 0		i=1

(1)

т. е. геометрическому среднему. Далее, если x_k = max(x), то очевидно, что для t > 0

α_k^1/tx_k ≤ M_t(x, α) ≤ x_k,

откуда вытекает, что

lim	M_t(x, α) = max(x).
t → ∞

(2)

Но из соотношения

M_–t(x, α) =

M_t(1/x, α)

теперь следует, что

lim	M_t(x, α) = min(x).
t → –∞

(3)

В силу этого мы полагаем

n α_i

M₀(x, α) = ∏ x_i ,

i=1

M_∞(x, α) = max(x),
M_–∞(x, α) = min(x).

Если относительно x_i предполагается только, что они неотрицательны и что по крайней мере одно из них равно нулю, то для t ≤ 0 среднее M_t(x, α) полагается равным нулю. Однако мы будем рассматривать только положительные x_i.

Покажем теперь, что для положительных x_i среднее M_t(x, α) является неубывающей функцией от t для –∞ ≤ t ≤ ∞, причём если только не все x_i равны между собой, то M_t(x, α) даже строго возрастает. Неравенство между арифметическим и геометрическим средними является частным случаем этого утверждения.

Для обоснования этого общего факта сделаем сначала одно замечание относительно выпуклых функций. Если функция f (x) имеет вторую производную, удовлетворяющую неравенству

d²f

dx²

> 0

(4)

для a < x < b, то график y = f (x) представляет собой выпуклую дугу в этом интервале. Если значения

(x) ≡ (x₁, x₂, ..., x_n)

лежат в интервале (a, b), a

x =

n
∑
i=1

α_ix_i,

то х также лежит в (a, b), и по формуле Тейлора

f (x_i) = f (x) + (x_i – x) f ' (x) +

(x_i – x)²

f '' (ξ_i).

Умножая на α_i и складывая эти неравенства, мы получаем

n
∑
i=1

α_if (x_i) = f (x) +

n
∑
i=1

(x_i – x)²

f '' (ξ_i),

а отсюда в силу (4) следует, что

n
∑
i=1

α_if (x_i) ≥ f

(

n
∑
i=1

α_ix_i

)

(5)

причём равенство имеет место только тогда, когда все x_i равны между собой; см. § 8.

В частности, для функции

f (x) = x ln x, x > 0,

мы имеем

d²f

dx²

> 0

так что в силу неравенства (5) для положительных значений (x) справедливо неравенство

n
∑
i=1

α_ix_i ln x_i ≥

(

n
∑
i=1

α_ix_i

)

(

n
∑
i=1

α_ix_i

)

;

(6)

равенство имеет место только в том случае, когда все x_i равны между собой.

Нетрудно проверить, что

t²

M_t(x, α)

n
∑
i=1

α_ix_i^t

dM_t(x, α)

n
∑
i=1

α_ix_i^t ln x_i^t –

(

n
∑
i=1

α_ix_i^t

)

(

n
∑
i=1

α_ix_i^t

)

и неравенство (6), применённое к значениям (x^t), показывает, что

dM_t(x, α)

≥ 0;

равенство имеет место только в том случае, когда все x_i равны между собой.

Таким образом, если не все x_i равны между собой, то M_t является строго возрастающей функцией от t и её график имеет две горизонтальные асимптоты. Можно было бы в связи с этим предполагать, что график M_t имеет только одну точку перегиба, т. е. состоит из одной вогнутой и одной выпуклой части. Оказывается, что это не всегда так [20], однако легко показать, что t ln M_t(x, α) – выпуклая функция от t (для этого надо после дифференцирования применить неравенство Коши). Следовательно, в силу (5) функция M_t(x, α) удовлетворяет неравенству

	T		n		α_it_i
M		≤	∏	M
	T		i=1		t_i

(7)

для произвольных t_i и

T =

n
∑
i=1

α_it_i, α_i > 0,

n
∑
i=1

α_i = 1.

(8)

Сумма порядка t,

n

S_t(x) = ( ∑ x_i^t ) 1/t ,

i=1

ведёт себя как функция от t совсем по-другому. При t, возрастающем от –∞ до 0–, она монотонно убывает от min(x) до 0, а при t, возрастающем от 0+ до +∞, она монотонно убывает от ∞ до max(x).

Неравенство

S		(x) ≤ S		(x), 0 < t₁ < t₂,
	t₂		t₁

иногда называют неравенством Иенсена [21, 22], хотя так же называют неравенство (5), которое справедливо для любых непрерывных выпуклых функций, а не только для функций с положительной второй производной.

Из того факта, что t ln M_t(x, α) является выпуклой функцией от t, легко следует, что t ln S_t(x) также является выпуклой функций от t. Поэтому неравенство (7) имеет место и для S вместо M.

Функция S_t(x) не обязательно вогнута для t < 0 [24]; но она всегда выпукла для t > 0 [23, 24]. Соответственно S_t удовлетворяет неравенству

n

S_T ≤ ∑ α_iS

i=1 t_i

для произвольных t_i > 0 и T и α_i, подчинённых условиям (8). В действительности имеет место более сильное утверждение, что ln S_t является выпуклой функцией от t для t > 0, так что в силу (5) даже

n α_i

S_T ≤ ∏ S .

i=1 t_i

БИБЛИОГРАФИЯ

[1]	G.H.Hardy, J.E.Littlewood, G.Polya. Inequalities, London, Cambridge University Press, 1951. Русский перевод издания 1934 г.: Харди, Литлвуд, Пойа. Неравенства, М., ИЛ, 1948. назад к тексту
[2]	A.L.Cauchy. Cours d'Analyse de l'Ecole Royale Polytechnique, I^re partie. Analyse algébrique, Paris, Debure, 1821, Oeuvres complètes, II^e série. III. назад к тексту
[3]	R.Bellman. Dynamic programming, Princeton, N.J., Princeton University Press, 1957. Русский перевод: Р.Беллман. Динамическое программирование, М., ИЛ, 1960. назад к тексту
[4]	T.Bonnesen, W.Fenchel. Theorie der konvexen Körper, Berlin, Springer 1951. назад к тексту
[5]	E.R.Lorch. Differential inequalities and the theory of convex bodies, Trans. Am. Math. Soc., 71 (1951), 243–256. назад к тексту
[6]	E.F.Beckenbach. Convex functions, Bull. Am. Math. Soc., 54 (1948), 439–460. назад к тексту
[7]	J.W.Green. Recent applications of convex functions, Am. Math. Monthly, 61 (1954), 449–454. назад к тексту
[8]	H.Bohr. The arithmetic and geometric means, J. London Math. Soc., 10 (1935), 114. назад к тексту
[9]	A.Hurwitz. Über den Vergleich der arithmetischen und des geometrischen Mittels, Math. Werke, 505–507, Basel, Birkhäuser, 1933. назад к тексту
[10]	A.Hurwitz. Über die Erzeugung der Invarianten druch Integration, Math. Werke, 546–564, Basel, Birkhäuser, 1933. назад к тексту
[11]	G.Ehlers в книге: W.D.Hayes (ed.), Colloquium on linear equations, Office of Naval Research Technical Report ONRL-35-54, 1954. назад к тексту
[12]	P.H.Diananda. A simple proof of the arithmetic mean – geometric mean inequality, Am. Math. Monthly, 67 (1960), 1007. назад к тексту
[13]	C.F.Gauss. Werke, 10, 1, 172–292. Leipzig, Teubner, 1917. назад к тексту
[14]	H.Schapira. Bemerkungen zu der Grenzfunktion algebraischer Iteration, Schlömilch Z., 32 (1887), 310–314. назад к тексту
[15]	L.Schlesinger. Über Gauss'Jugendarbeiten zum arithmetisch-geometrischen Mittel, Deutsche Math. Ver., 20 (1911), 396–403. назад к тексту
[16]	R.Bellman. The symmetric mean, Math. Mirror, Brooklyn College, 9 (1941), 5–6. назад к тексту
[17]	C.Maclaurin. A second letter to Martin Folges, Esq.; concerning the roots of equations with the demonstration of other rules in algebra, Phil. Trans., 36 (1729), 59–96. назад к тексту
[18]	E.Jacobsthal. Über das arithmetische und geometrische Mittel, Norske Vid. Selsk. Forh. (Trondheim), 23 (1951), 122. назад к тексту
[19]	W.H.Young. On classes of summable functions and their Fourier series, Proc. Roy. Soc. (A), 87 (1912), 225–229. назад к тексту
[20]	H.Shniad. On the convexity of mean value functions. Bull. Am. Math. Soc., 54 (1948), 770–776. назад к тексту
[21]	J.L.W.V.Jensen. Sur les fonctions convexes et les inéqualites entre les valeurs moyennes, Acta Math., 30 (1906), 175–193. назад к тексту
[22]	A.Pringsheim. Zur Theorie der ganzen transzendenten Funktionen (Nachträge), Münch. S.-B., 32 (1902), 295–304. назад к тексту
[23]	T.Bonnesen. En bemaerkning om konvekse funktioner, Mathem. Tidsskr. (В), 1928, 18–20. назад к тексту
[24]	E.F.Beckenbach. An inequality оf Jensen, Am. Math. Monthly, 53 (1946), 501–505. назад к тексту

	α_n/β_n	α_n+1/β_n
y_n =	x_n	x_n+1	, β_n = α_n + α_n+1.