Вычисление многочленов

В необозримом царстве функций многочлены занимают, на первый взгляд, очень скромное место. Однако это первое впечатление обманчиво.

Многочлены, действительно, предельно просты: алгебраическая запись

является одновременно и формулой для вычисления значений многочлена ¹. Хотя выражения типа cos x, ⁵√ x , 10^x, log₂x намного лаконичнее, с вычислительной точки зрения они бессодержательны: для вычисления, скажем чисел cos 17°, ⁵√ 2 , 10^0,13 или log₂7 нужны специальные приближённые формулы (или таблицы, составленные с помощью тех же формул). Как правило, в таких формулах появляются многочлены: например,

(ошибка в интервале 0≤x≤π/4 меньше одной десятимиллионной!).

А ведь тригонометрические, степенные и т.п. (элементарные) функции — это самые простые из функций анализа, изучаемых и используемых математиками, физиками, инженерами. Известный математик-вычислитель Р. В. Хемминг в своей книге «Численные методы» (М., «Наука», 1972) пишет: «Поскольку с многочленами легко обращаться, большая часть классического численного анализа основывается на приближении многочленами».

Так как вычислять многочлены приходится часто, то важно научиться делать это как можно проще. Мы расскажем об эволюции методов вычисления значений многочленов с момента зарождения (XVII век). Впрочем, слово «эволюция» здесь не вполне уместно: история этих методов — скорее очень длинный роман с интересной, но краткой завязкой, однообразным действием и неожиданной развязкой.

Общепринятый сейчас способ вычисления многочленов восходит к Ньютону и называется схемой Горнера. Эта универсальная (то есть применимая к любому многочлену) схема предельно проста и изящна. Она получается из формулы (1) вынесением за скобки x всюду, где это возможно:

Порядок действии при вычислении f (x) определяется скобками в (2): сначала сложение внутри самой внутренней пары скобок (его результат обозначим через p₁), затем умножение и сложение внутри следующей пары скобок (результат p₂) и т.д.:

ì	p₁ = x + a₁;
ï	p₂ = p₁x + a₂;
í	p₃ = p₂x + a₃;
ï	· · · · · · · · · · · · · · · · · ·
î	p_n = p_n–1x + a_n, f (x) = p_n;

(3)

Схема Горнера настолько совершенна, что вопрос о возможности её улучшения не возникал два с половиной века и был задан «вслух» впервые лишь в 1954 году! Постановка этого вопроса (ответ на него предполагался отрицательным) имела важные и неожиданные последствия.

Уже в курсе школьной алгебры мы встречаемся с примерами многочленов, для которых существуют необычайно экономные схемы; единственный их недостаток — они не универсальны.

Сравнивая разные схемы по числу операций, мы будем объединять операции сложения и вычитания в группу «(+, –)-операций», а гораздо более трудоёмкие операции умножения и деления — в группу «(×, :)-операций». ³

(а) Многочлен f (x) = x^{2^k} можно вычислить за k умножений (а не за 2^k по Горнеру):

(б) Многочлен f (x) = x¹⁵ можно вычислить за пять (×, :)-операций, так как f (x) = x¹⁵ = x¹⁶ : x = x^{2^4} : x.

(в) Многочлен f (x) = xⁿ + x^n–1 + ... + x + 1 вычисляется по формуле геометрической прогрессии: f (x) = (xⁿ⁺¹ – 1) : (x – 1).

1. Докажите, что многочлены (а) и (б) не могут быть вычислены быстрее.

2. В «Задачнике «Кванта» № 12 за 1973 год была помещена задача (М240): доказать, что многочлен f (x) = xⁿ может быть вычислен не более чем за ³/2 log₂n + 1 (×, :)-операций (n — натуральное число).

Пользуясь результатом этой задачи, оцените число операций для вычисления многочленов (в) и (г).
Решение

3. Постройте экономные схемы для многочленов:

(I)

f (x) = x⁸ + x⁶ – x⁵ + 2x⁴ – x³ + x² – x + 1;

(II)

f (x) = xⁿ + 2x^n–1 + 3x^n–2 + ... + nx + n + 1;

(III)

f (x) = x²ⁿ +

(

2n
2

)

x^2n–2 +

(

2n
4

)

x^2n–4 + ... +

(

2n
2n–2

)

x² + 1;

(IV)

f (x) = 1 –

x²

x⁴

–

x⁶

x⁸

Решение

А что если для каждого многочлена существует своя схема, гораздо более экономная, чем схема Горнера?

Такие схемы можно было бы искать либо исходя из особенностей отдельного многочлена (искусно комбинируя его коэффициенты), либо сконструировав универсальный метод построения схем, намного более экономных, чем схема Горнера, но, возможно, для некоторых многочленов не наилучших. Недостаток первого подхода в том, что для каждого многочлена придется придумывать свои приёмы, и нет никакой гарантии, что нам это всегда удастся; позже (в §10) мы увидим, что второй путь надёжнее во всех отношениях.

Само собой разумеется, что оба эти метода уместны лишь в тех случаях, когда конкретный многочлен приходится вычислять так часто, что стоит потратить и время, и усилия, чтобы построить для него хорошую схему. Многочлены же «разового пользования» проще вычислять, скажем, по схеме Горнера.

Возможно, подобные рассуждения и привели в 1955 году к открытию универсальной схемы совершенно нового типа для многочлена шестой степени. Мы проиллюстрируем основную идею этой схемы на примере более простой схемы — для многочленов степени 4. Пусть

приравняв коэффициенты f (x) и p₂(x), выразим параметры, входящие в формулу (5), через коэффициенты (4):

Из этих формул ясно, что схема (5) универсальна.

Операции (6) мы будем называть предварительной обработкой коэффициентов многочлена; разумеется, они не включаются в число операций схемы: ведь для каждого данного многочлена они выполняются лишь однажды, а наша задача — научиться быстро считать значения произвольного, но фиксированного многочлена при разных x.

В 1958 году была найдена общая универсальная схема с предварительной обработкой коэффициентов. Структура этой схемы для многочлена чётной степени (n=2k) напоминает пирамиду — в основании лежит схема (5) (в её «прочности» мы уже убедились), содержащаяся в схеме степени 6, которая содержится в схеме степени 8 и т.д.:

ì	p₁ = x(x + b₁),
ï	p₂ = (p₁ + b₂)(p₁ + x + b₃) + b₄,
í	p₃ = p₂(p₁ + b₅) + b₆,
ï	· · · · · · · · · · · · · · · · · ·
î	p_k = p_k–1(p₁ + b_2k–1) + b_2k, f (x) = p_k, k≥2.

(7.k)

схема (7.2) — это и есть схема (5). Результат схемы (7.k) — многочлен p_k(x) степени n = 2k; многочлен же нечётной степени n = 2k + 1 можно представить в таком виде:

многочлен в круглых скобках вычисляется по схеме (7.k). В итоге схема содержит k умножений и 2k+1 сложений для многочлена чётной степени n = 2k и k+1 умножений и 2k+2 сложений для многочлена нечётной степени n = 2k + 1 (с учётом (7.k) и (8) ).

4. Найдите формулы предварительной обработки коэффициентов, аналогичные формулам (6), для схемы (7.3) вычисления многочленов шестой степени.

5. Докажите индукцией по k≥2 универсальность схемы (7.k).
Решение

Пусть f(x) = x^2k + a₁x^2k–1 + ... + a_2k.

Нам нужно по коэффициентам a₁, ..., a_2k многочлена f (x) найти параметры b₁, ..., b_2k, превращающие последнюю строку схемы (7.k) в тождество.

Параметр b₁ — единственный, для которого существует формула, причём простая.

Лемма 1. Справедливо соотношение

a₁ = kb₁ + 1.

(I)

Доказательство проводится индукцией по k≥2.

Если k=2, то a₁ = kb₁ + 1 согласно (6) (роль b₁ играет в (6) параметр A).

Пусть k≥3, и пусть в схеме (7.k)

p_k–1(x) = x^2k–2 + αx^2k–3 + ... ;

тогда

p_k = p_k–1(p₁ + b_2k–1) + b_2k =
= (x^2k–2 + αx^2k–3 + ...)(x² + b₁x + b_2k–1) + b_2k =
= x^2k + (α + b₁)x^2k–1 + ... ,

так что, если по предположению индукции α = (k – 1)b₁ + 1, то a₁ = α + b₁ = kb₁ + 1.

Возможность вычисления значении остальных параметров по значениям коэффициентов также доказывается индукцией по k≥2.

База индукции. k=2, n=4. Схема (5), формулы (6).

Посылка индукции. Пусть при некотором j=k–1≥2 схема (7.k–1) универсальна, то есть любому набору чисел A₁, A₂, ..., A_2k–2 соответствуют значения b₁, b₂, ..., b_2k–2 параметров, подставив которые в схему (7.k–1), мы получим многочлен

p_k–1(x) = x^2k–2 + A₁x^2k–3 + ... + A_2k–2.

(II)

Шаг индукции. Тогда схема (7.k) также универсальна. Выпишем предпоследнюю строку этой схемы:

p_k(x) = p_k–1(x)·(x² + b₁x + b_2k–1) + b_2k.

(III)

Согласно нашему предположению (посылка индукции), для нахождения значений параметров b₁, b₂, ..., b_2k, превращающих многочлен p_k(x) из (7.k) в многочлен f (x) с данными коэффициентами a₁, a₂, ..., a_2k нам достаточно найти такой многочлен p_k–1(x) (точнее, его коэффициенты A₁, A₂, ..., A_2k–2 — см. (II)) и такие значения параметров b_2k–1, b_2k, чтобы после их подстановки в (III) выполнялось тождество p_k(x) = f (x). Перемножив многочлены в правой части равенства (III) и приравняв коэффициенты полученного многочлена и многочлена f (x) = x^k + a₁x^k–1 + ... + a_2k, мы сможем выписать систему 2k уравнений с неизвестными A₁, A₂, ..., A_2k–2, b_2k–1, b_2k, (a₁, ..., a_2k заданы, b₁ находится из равенства (I)); чтобы сократить запись формул, заменим параметр b_2k–1 символом b:

a₁ = A₁ + b₁,
a₂ = A₂ + b₁·A₁ + b,
a₃ = A₃ + b₁·A₂ + b·A₁,
. . . . . . . . . .
a_2k–2 = A_2k–2 + b₁·A_2k–3 + b·A_2k–4,
a_2k–1 = b₁·A_2k–2 + b·A_2k–3,
a_2k = b₁·A_2k–2 + b_2k.

(IV)

Условимся обозначать уравнение системы (IV) с номером j (1≤j≤2k) через (IV)-j. Тогда процесс решения системы (IV) можно описать в нескольких словах: A₁ выражается через a₁ из (IV)-1 и (I), A₂ выражается через a₁, a₂ и b из (IV)-2, A₃ выражается через a₁, a₂, a₃ и b из (IV)-3 и т.д. Последним из уравнения (IV)-(2k–2) мы выразим неизвестное A_2k–2; затем, подставив в уравнение (IV)-(2k–1) найденные выражения для A_2k–2 и A_2k–3, мы получим уравнение относительно b.

Лемма 2. Неизвестные A_2j–1 и A_2j выражаются из системы (IV) через параметр b и коэффициенты a₁, a₂, ..., a_2k–2; согласно формулам (b₁ выражается через a₁ согласно (I))

A_2j–1 = (–1)^j–1[(k – j)b₁ + 1]b^j–1 +
+ S_1, j(a₁, a₂, a₃)b^j–2 + ... + S_j–1, j(a₁, a₂, ..., a_2j–1),

(V)

A_2j = (–1)^jb^j + T_1, j(a₁, a₂)b^j–1 + ... + T_j, j(a₁, a₂, ..., a_2j).

(VI)

Доказательство. База индукции: j=1, A₁ = a₁ – b₁ = [(k – 1)b₁ + 1]b, A₂ = –b + T_1,1(a₁, a₂).

Посылка индукции — формулы (V), (VI) при 1≤j<k–1.

Шаг индукции:

(a)	A_2j+1 = –bA_2j–1 – b₁A_2j + a_2j+1 = = (–1)^j[(k – j)b₁ + 1]b^j – S_1, j(a₁, a₂, a₃)b^j–1 – ... – – b₁(–1)^jb^j – b₁T_1, j(a₁, a₂)b^j–1 – ... + a_2j+1 = = (–1)^j[(k – j – 1)b₁ + 1]b^j + S_1, j+1(a₁, a₂, a₃)b^j–1 + ... ;

(b)	A_2j+2 = –bA_2j – b₁A_2j+1 + a_2j+2 = (–1)^j+1b^j+1 + T_1, j+1(a₁, a₂)b^j + ...

Лемма 3. Полученное после всех подстановок уравнение относительно b = b_2k–1 имеет степень k–1 и единичный коэффициент при старшем члене (то есть при b^k–1).

Доказательство. Предположим, что в правой части уравнения (IV)-(2k–1) на левом крайнем месте (там, где сейчас пробел) стоит неизвестное A_2k–1, и выразим его через b, a₁, ..., a_2k–1 по формуле (V) (она по-прежнему применима здесь):

A_2k–1 = (–1)^k[(k – k) + 1]b^k–1 + ... = (–1)^kb^k–1 + ....

(VII)

Вспомним, что на самом деле A_2k–1 ≡ 0; умножив правую и левую части (VII) на (–1)^k, получим требуемое уравнение относительно b.

Решив это уравнение ^*), мы найдём значение параметра b = b_2k–1, а затем по формулам (V), (VI) вычислим неизвестные A₂, A₃, ..., A_2k–2; параметр b_2k находится из уравнения [IV]-(2k).

^*) Так называемая «основная теорема алгебры», открытая великим К. Ф. Гауссом, утверждает, что многочлен степени n>0 всегда имеет хотя бы один корень. Несмотря на то, что при n≥5 формул для нахождения этого корня и не существует, разработаны методы нахождения всех корней многочлена с любой точностью.

Начиная с третьей строки, схема (7.k) очень напоминает схему Горнера (3); разница лишь в том, что теперь после каждого умножения степень увеличивается не на единицу, а на два.

Итак, нам удалось уменьшить число умножений по сравнению со схемой Горнера вдвое. Какой ценой? Из решения упражнения 5 видно, что процесс вычисления параметров b₁, b₂, ..., b_2n по коэффициентам a₁, a₂, ..., a_2n очень сложен, — он включает в себя решение серии уравнений с одним неизвестным степени k–1, k–2, ... Это означает, в частности, что при k≥6 (n≥12) формул вычисления параметров нет ⁴, хотя, разумеется, их значения могут быть найдены приближёнными методами с любой степенью точности.

Здесь возникает ещё одно затруднение, оказавшееся, правда, преодолимым. До сих пор мы не уточняли, значения каких — действительных или комплексных — многочленов мы вычисляем. Схема Горнера применима и в том, и в другом случае, схема же (7.k) преимущественно «комплексная» — действительным коэффициентам могут соответствовать комплексные параметры. Появление комплексных чисел при вычислении действительных многочленов намного увеличивает число арифметических операций ⁵. К счастью, в 1960 году схему (7.k) небольшим усложнением удалось превратить в действительную; однако полные доказательства в этом случае уже очень непросты.

Пришло время спросить, нет ли схем, более экономных, чем схема (7.k)? Но тогда неизбежен и вопрос — что такое схема?

Определение. (I). Схема с предварительной обработкой коэффициентов — это последовательность арифметических операций, в которых участвуют переменная x, параметры b₁, b₂, ..., b_m и результаты предшествующих операций. Результат последней операции назовем результатом схемы. (II). Если при некотором наборе значений параметров b₁, ..., b_m результат схемы есть данный многочлен степени n, то мы скажем, что схема представляет этот многочлен. (III). Если схема представляет многочлен, то процесс вычисления по его коэффициентам соответствующего набора значений параметров назовем предварительной обработкой коэффициентов. (IV). Схема называется универсальной степени n, если она представляет любой многочлен степени n вида (1).

Примеры. 1. Схема (7.k) — универсальная (степени n=2k); то же верно и для схемы Горнера (параметры — сами коэффициенты).

2. Схема p(x) = (xⁿ⁺¹ – b₁)/(x – b₂) представляет многочлен (в) §3 при b₁ = b₂ = 1.

6. Докажите, что общее число S_N схем (всех степеней), содержащих не более N операций, конечно и не превосходит числа ⁶ [(3N – 1)!/(2N – 1)!]².
Решение

Теперь наш вопрос о наилучших схемах степени n приобрёл точный смысл, и можно дать на него точный ответ: схема из §5 почти наилучшая — любая универсальная схема степени n содержит не менее ½(n–1) (×, :)-операций и не менее n–1 (+, –)-операций.

Справедливость этого утверждения можно вывести из двух важных свойств схем:

Второе свойство стоит сформулировать более строго: если схема содержит r (×, :)-операций (или s (+, –)-операций), то число m параметров либо сразу не больше 2r+1 (соответственно s+1), либо без ущерба для свойств схемы может быть уменьшено до 2r+1 (соответственно, s+1), то есть m ≤ 2r + 1 и m ≤ s + 1.

Итак, n ≤ m ≤ 2r + 1 и n ≤ m ≤ s + 1, отсюда ½(n – 1) ≤ r и n – 1 ≤ s.

А теперь займёмся двумя сформулированными выше свойствами схем, сначала вторым.

Наше определение схемы не накладывало никаких ограничений на форму её записи. Мы назовём элементарной запись схемы типа «одна строка — одна операция», когда запоминается (и обозначается своим символом) результат каждой операции схемы; примеры: эпиграф (хотя это и не схема, а скорее багажная квитанция), схема для многочлена x^{2^k} (§3) — в ней каждый результат используется больше одного раза и потому нуждается в запоминании.

Не для всех схем элементарная форма записи является единственной: если результат какой-то операции используется лишь однажды, то эту операцию можно сразу включить в ту строку, в которой участвует её результат. (Примеры: каждая строка схемы (3), начиная со второй, включает две операции, а схемы (7.k) — не менее трёх.) Интересно, что схема (7.k) не допускает записи меньше, чем в две строки, так как результат первого умножения используется многократно, а схема (3) — допускает (формула (2) ).

«Причина» справедливости неравенства m≥n для универсальных схем очень проста: если схема степени n универсальна, то есть представляет все многочлены степени n, то каждому такому многочлену должен соответствовать свой набор параметров; поэтому «число» различных наборов параметров должно быть не меньше «числа» разных многочленов.

Однако, пожелай мы придать этому объяснению точный смысл, нам не хватило бы этого номера «Кванта». Удовлетворимся же тем, что разберём иллюстративный пример. Пусть n=2, f (x) = x² + a₁x + a₂. Каждый конкретный многочлен можно изобразить точкой на плоскости с координатами a₁, a₂. Если для схемы m<n=2, то она либо совсем не содержит параметров (m=0), либо содержит один параметр (m=1). В первом случае схема представляет единственный многочлен (точка на плоскости), во втором — семейство многочленов, которое изобразится на «плоскости многочленов» в виде некоторой «хорошей» кривой.

Итак, мы доказали (§§7–9), что достоинства универсальных схем почти исчерпаны схемой §5. Но остаётся ещё возможность искать для каждого многочлена свою схему, намного более экономную, чем та, которую можно для него получить, используя (7.k)–(8) или какую-нибудь другую универсальную схему. Правда, девочка из эпиграфа, убеждённая в силе универсальных методов, предостерегает нас от увлечения поисками всё новых и новых сверхэкономных индивидуальных схем для отдельных многочленов (вроде схем §3); сейчас мы покажем бесполезность таких поисков.

Итак, многочлены, которые могут быть вычислены быстрее, чем за ½(n–1) (×, :)-операций или n–1 (+, –)-операций, — исключение из общего правила. Тем не менее, при построении схемы для конкретного многочлена стóит использовать его особенности, если они бросаются в глаза.

1.	Чтобы упростить выкладки, мы ограничимся многочленами с единичным коэффициентом при старшем члене (a₀ = 1); там, где это будет необходимо, мы поясним, как поступать в общем случае (a₀ ≠ 1). назад к тексту
2.	Если a₀ ≠ 1, то мы положим p₁ = a₀x + a₁ (число умножений при этом возрастает на единицу). назад к тексту
3.	Читается: «плюс-минус-операции», «умножить-разделить-операции». назад к тексту
4.	Под формулой обычно понимают набор арифметических операций, корней, степеней. Вы, наверное, знаете, что Э.Галуа и Н.Абель, гениальные (и оба очень рано умершие) математики XIX века, доказали, что для нахождения корней многочленов пятой и более высоких степеней таких общих формул не существует (см. «Квант», 1973, № 10, с. 3—12). назад к тексту
5.	Одно «комплексное» сложение — это два «действительных», одно «комплексное» умножение — четыре (!) умножения и два сложения. назад к тексту
6.	Чтобы иметь возможность сравнивать схемы, разумно для обозначения их параметров использовать буквы, например, из последовательности b₁, b₂, ..., b_k, ...; понятно, что тогда схемы, отличающиеся лишь названиями параметров, считаются одинаковыми. назад к тексту