книги / Метод продолжения решения по параметру и наилучшая параметризация в прикладной математике и механике
..pdf1.5. Геометрические представления шаговых процессов |
41 |
обычно возникает задача определения множества решений этого урав нения в зависимости от значения параметра. Если выполнены условия теоремы о неявных функциях, то решения ж представляются непрерыв ными и дифференцируемыми функциями р, т.е. х = ж(р).
Простейшей формой представления этой зависимости было бы отыс кание решений Х(к) = х(рк) для некоторого множества значений пара
метра р : Ро < Pi < • • • < Рк < • • • < РдгПроцесс М. Лаэя (1.5) демон стрирует, как на основе идеи продолжения решения можно экономично организовать процесс построения множества решений. Его предложе ние, по существу, свелось к использованию решения для предыдущего значения параметра задачи р в качестве начального приближения для те кущего значения параметра. Для р = р* этот процесс можно записать в виде
(0) |
*(*-!)> |
|
х (к) ~ |
|
|
6х® = |
Pi), |
(1.79) |
*(*{ ) = *(*)+ 6х\ь)’ * —°»!>2>**- ■
Этот процесс продолжается, пока норма поправочного вектора 1И*(*)Н превышает заданную точность е > 0.
Геометрическое представление этого процесса показана на рис. 1.9 для случая одного уравнения с одним неизвестным n = 1 при переходе от р*_( к рк. Искомым множеством решений этого уравнения F(x,p) = 0 является кривая К , по которой поверхность F = F(x,p) в пространстве
К : {ж, р, F} пересекается с плоскостью К : {ж, р}. Итерационный процесс Ньютона—Рафсона происходит в плоскости р = рк с начальным
приближением ж|®| = Ж(Л_,).
Этот же рисунок наглядно показывает, что трудности, возникающие
вокрестности предельной точки Г, связаны с переходом от рк к рк+\ , которой выводит процесс (1.79) из области, где существует решение. Как видно, эти трудности обусловлены тем, что решение отыскивается
вплоскости р = Pk+i, которая не имеет пересечения с кривой множества
решений К.
Таких трудностей удалось бы избежать, если для каждого к организо вать итерационный процесс Ньютона—Рафсона поиска ж^) в плоскости Мщ, которая ортогональна к кривой К при ж = ж(ку Но пока не най
дено решение ждо, плоскость |
неизвестна. Однако, можно искать |
|
решение в плоскости |
, близкой к М(ку |
42 Глава 1. Нелинейные алгебраические или трансцендентные уравнения
Рассмотрим один из способов задания плоскости |
. Введем |
вектор * = (*i, *2 = р)т и рассмотрим уравнение |
|
F(*) = 0. |
(1.80) |
Пусть t — величина шага, с которым мы стремимся двигаться вдоль кривой К. Тогда при достаточно малом шаге t близкой к плоскости Мдо
будет плоскость |
, проходящая через точку (*(*_i)+£d*(*_i)/dA)€lRn+I |
так, чтобы она была ортогональна единичному вектору dx^k_^/dX, каса тельному к кривой К в предыдущей точке *(*_i) (рис. 1.10). Уравйение
плоскости |
поэтому будет следующим |
Вектор, заключенный здесь в круглых скобках, соответствует точке С на рис. 1.10. А вектор, заключенный в фигурную скобку, соединяет точку С с произвольной точкой х плоскости К2 : (®i, 2:2}. Если он
1.5. Геометрические представления шаговых процессов |
43 |
будет ортогонален вектору dx^k_ ^ /d \, как этого требует уравнение (1.81), то он будет лежать на прямой АВ.
Таким образом, определение решения х ^ сводится к нахождению решения уравнения (1.80) в плоскости , т. е. к совместному решению
уравнений (1.80), (1.81). Если второе уравнение упростить с учетом того, что вектор dx(fc_])/dA — единичный, то эта система примет вид
|
F (*) = °» |
|
|
~ g(t-l)) = *• |
<182) |
|
Для этой системы итерационный процесс метода Ньютона—Рафсона |
||||||
имеет вид |
|
|
|
|
|
|
|
|
(0) |
|
. * |
dx(k_ |
|
|
|
|
(k -i) |
|
||
|
|
в(*) |
= |
* ( * - ! ) + * |
d \ |
|
|
|
J (x(k)) |
|
- 1 |
|
|
6х |
0) |
|
|
|
(1.83) |
|
|
|
|
|
|||
|
(*) |
dX |
J |
L |
- *<*-!)) - ‘ |
|
|
|
|
||||
|
Х(к) |
Х(к) + °Х(к)> |
* = 0,1,2,.. |
|
44 Глава 1. Нелинейные алгебраические или трансцендентные уравнения
Обратим внимание на то, что вектор |
- X(k-i) начинается в точ- |
ке *(*-1)> а конец его лежит на прямой |
АВ. Тогда его проекция |
на вектор dx^k_^/dX, т.е. скалярное произведение этих векторов, как
раз равна t. Поэтому последняя компонента вектора |
в правой части |
|||
уравнения (1.83) равна нулю и оно упрощается: |
|
|||
|
|
-l |
М?,>1 |
|
.(О |
_ |
|
(1.84) |
|
<*) |
dX(k-i) |
|
0 |
|
|
dX J |
|
|
|
Учитывая это, второе уравнение в (1.82) можно записать в виде |
||||
|
dx(k-1) |
= |
0. |
(1.85) |
|
dX |
|||
|
|
|
|
Геометрически это условие требует ортогональности поправочного
вектора к орту dx^k_^/dX (см. рис. 1.10). Такая интерпрета ция дополнительного урав нения в (1.82) подсказы вает некоторые итерацион ные процессы, от которых следует ожидать еще боль шей эффективности. Так, если ввести вектор
4<) = *(*) “ *(*-!)»
то по аналогии с услови ем (1.85) можно дополни тельное условие в (1.82) сформулировать в форме
Чк)0х(к) * а
Геометрия итерацион ного процесса с таким условием показана на рис. 1.11 в плоскос ти К2 : {xi,X2}. В этом процессе на каждой итерации корректируется положение плоскости Мк, в которой ищется решение.
Если к тому же вектор |
на каждой |
итерации нормировать |
так, чтобы он имел длину t, |
то получится |
итерационный процесс, |
1.5. Геометрические представления шаговых процессов |
|
45 |
|||||||||
проиллюстрированный |
на |
рис. |
1.12 |
в |
плоскости |
М2 |
: {zj, а^}- Его |
||||
алгоритм имеет вид |
|
|
|
|
|
|
|
||||
|
|
|
(0) _ |
, <**(*-1) |
(0) _ |
(0) |
|
|
|||
|
|
|
f' |
' — t |
d\ |
|
- |
x(k-i)+Z(k |
|
|
|
|
|
|
<(*) “ |
1 |
|
|
(*)' |
|
|||
|
|
|
|
|
|
|
, |
-1 |
|
|
|
|
|
|
Sx(i) = - |
J (x [k)) |
|
*■<*!$>' |
|
( 1.86) |
|||
|
|
|
Л0 |
|
|
||||||
|
|
|
o x (k) |
~ |
|
|
|
||||
|
|
|
|
|
|
4*) |
|
|
|
|
|
Ai+1) _ |
■ *(*)+0!C(*) |
|
.«+•) _ |
|
(>'+•) |
* = |
0, 1, 2, . . . |
||||
4(*> |
|
IK(k)+6x(k)" |
B(*) |
= *(*-!) - Ц (fe) ’ |
|||||||
|
|
|
|
|
|
|
|
||||
Заметим, |
что |
все |
рас |
|
|
|
|
|
|||
смотренные здесь |
алгорит |
|
|
|
|
|
|||||
мы допускают обычную для |
|
|
|
|
|
||||||
метода |
Ньютона—Рафсона |
|
|
|
|
|
|||||
модификацию |
с |
заменой |
|
|
|
|
|
||||
матрицы |
J(zS'l), |
которая |
|
|
|
|
|
||||
меняется от итерации к ите |
|
|
|
|
|
||||||
рации, |
на |
матрицу J(z^j) |
|
|
|
|
|
||||
первого |
приближения. Об |
|
|
|
|
|
|||||
ратим внимание, что, по су |
|
|
|
|
|
||||||
ществу, все описанные здесь |
|
|
|
|
|
||||||
итерационные процессы ре |
|
|
|
|
|
||||||
шают уравнение (1.72) сов |
|
|
|
|
|
||||||
местно с некоторым допол |
|
|
|
|
|
||||||
нительным условием. |
Так, |
|
|
|
|
|
|||||
в процессе М. Лазя (1.79) |
|
|
|
|
|
||||||
используется |
простейшее |
|
|
|
|
|
|||||
дополнительное |
условие |
|
|
|
|
|
|||||
х2 = Pi. в процессе (1.83) — |
|
|
|
|
|
||||||
условие (1.81) и т.д. Все эти |
|
|
|
|
|
дополнительные условия определяют в К2 некоторую линию пересече ния плоскости Мдо с плоскостью К2 : {x\,xi}, которая может изме
няться от итерации к итерации. Обобщая этот подход, можно сфор мулировать дополнительное условие, определяющее некоторую линию
в К2 : {®], |
и искать решение уравнения (1.80) как точку пересечения |
|
кривой множества решений К с этой линией. Если |
в качестве такой |
|
линии выбрать окружность радиуса t с центром в точке |
>то на к-м |
46 Глава 1. Нелинейные алгебраические или трансцендентные уравнения
шаге продолжения решения придем к совместному решению следующих уравнений
F{x) = 0, ( х - *(*_,))(* - *(*_,)) - 12 = 0. |
(1.87) |
Алгоритм метода Ньютона—Рафсона для такой системы уравнений имеет вид
|
(0) _ |
dx(t-\) |
|
(0) |
_ |
(0) |
|
|
|
*(•>)-* |
d \ |
’ |
*(*) ~ *(*-*)+ *(*)’ |
|
|
||
|
|
|
|
-1 |
* < • « |
> |
|
|
|
6х® — |
|
|
|
|
( 1.88) |
||
|
0х(к) ~ |
ч * ) |
Jл ( * |
W |
« y |
J |
||
|
|
|||||||
*(<+1>= *W + Sx(i) |
4 *) |
* —*(*) |
^ *(*-!)» |
* —0, 1)2, ... |
|
|||
х(к) |
х(к) + ох(к)’ |
|
Все рассмотренные выше процессы могут быть без изменения ис пользованы для решения системы п уравнений с п + 1 неизвестными
F(x) = 0, F : Rn+1 - ч Г , х € |
»п+1 |
В? |
Истолкование этих процессов как алгоритмов совместного реше ния основной системы уравнений с дополнительным уравнением по зволяет рассматривать их с обшей точки зрения на метод Ньютона— Рафсона и другие итерационные процессы, которые подробно иссле дуются во многих монографиях (см. [69, 28, 5] и др.) В них детально обсуждены вопросы сходимости итерационных методов. Мы отметим только, что для сходимости этих методов начальное приближение обыч но не должно слишком сильно отличаться от искомого решения. В по строенных выше итерационных алгоритмах по самому смыслу метода продолжения решения это требование удовлетворяется при достаточно малых величинах шага t по. параметру продолжения Л.
1.6.Продолжение решения в окрестности существенно особых точек
Вцели этой книги не входит разработка алгоритма продолжения
вокрестности существенно особых точек. Решение этого вопроса связано
спроблемой поведения решения в таких точках, которая в настоящий момент исчерпывающе решена только для некоторых классов функций. Анализ этой проблемы с точки зрения продолжения решения дан в мо нографии [17] и в главе 8 данной книги. Здесь же мы ограничимся
1.6. Продолжение решения в окрестности существенно особых точек |
47 |
рассмотрением простейшего случая — анализа особых точек плоской кривой, что позволит нам обозначить возникающие при этом проблемы.
Плоской кривой соответствует множество решений одного уравне ния с двумя неизвестными
**(*!, *2) = 0. |
(1.89) |
Здесь функция F (x\,x2) предполагается непрерывной и достаточно гладкой по обеим переменным в окрестности рассматриваемой точки х° = (х°, х®) € I 2, которая является решением уравнения (1.89), т.е.
.F(*?,*2) = 0. |
(1.90) |
Для упрощения записи производные обозначим как дР/дХ{ = Fj. Тогда матрица Якоби J функции Р(х\,хг) примет вид
J = (F>UF,2). |
(1.91) |
В окрестности точки х° решение можно продолжить, если хотя бы одна из производных 2^ отлична от нуля. Так, если в качестве параметра принять Х2, то точки, где F i ф 0, будут регулярными, а точки, где Ft\ —0, Ft2 ф 0, будут предельными. Но для всех этих точек rank(J) = 1.
Если же в точке х°
F,(x?,x§) = 0, F 2(X?,X°2) = 0, |
(1.92) |
то в этой точке rank(J) = 0, т.е. матрица J вырождается, и эта точка является существенно особой.
В окрестности такой точки представление функции по формуле Тейлора в силу равенств (1.90), (1.92) имеет вид
•F(xi,x2) = — (F J J AXJ + 2F j2A* lA*2 + ^ ,22^ 2) + 0(р3). (1.93)
Здесь обозначено Дх< = х(-х®, р = \ j Ах\ 4- AXj, F$j = Fy(x°, x°),
U = 1,2.
По смыслу представления (1.93) сумма членов второй степени это го представления в окрестности точки х° должна обращаться в нуль
на касательной к кривой множества решений К, т.е. |
|
F j j Дх2 + 2 ^|2ДХ|дх2 + Р^)2Дх2 = 0. |
(1.94) |
Если, например, |2 ф 0, то касательную к кривой К можно задать |
|
выражением |
|
Дх2 = £ДХ|. |
(1.95) |
48 Глава 1. Нелинейные алгебраические или трансцендентные уравнения
Тогда из (1.94) следует уравнение
* jl + 2F°n t + F%t2 = 0. |
(1.96) |
Касательная существует, если это уравнение имеет действительные корни. Число корней определяется дискриминантом
Л = |
(1.97) |
Если D < 0, то уравнение имеет два различных действительных корня t\ и <2, которые в соответствии с (1.95) дают два различных
значения производной в точке х°
dx2 dx2
dx 1 ~*ь dx, ~ h ‘
Таким образом, через точку хо про ходят две кривые, к которым в этой точке касательные определяются выра жениями (1.95) при t = t, и < = <2. Та кая точка хо является точкой ветвления. В ней имеет место картина, показанная на рис. 1.13.
При D > 0 уравнение (1.96) не име ет действительных корней. Это означает, что касательная к кривой, да и сама кривая, в этой точке не существуют,
а сама точка является изолированной особой точкой, т. е. в нее нельзя прийти путем продолжения решения.
И, наконец, при D = 0 уравнение (1.96) имеет два равных действи
тельных корня t. В этом случае истинное поведение кривой в точке х° может быть установлено только на основании анализа членов представ ления по формуле Тейлора третьего и более высокого порядка. Здесь уже
*2
Рис. 1.14. |
Рис. 1.15. |
1.6. Продолжение решения в окрестности существенно особых точек |
49 |
возможно, что особая точка является обшей точкой двух соприкасаю щихся кривых (рис. 1.14) или точкой возврата (рис. 1.15).
Общий случай ветвления кривых в Rn+1 в настоящее время до кон ца не исследован. Результаты для аналитических функций F(, начало которым положили исследования А. М. Ляпунова [39] и Е. Шмидта [111], приводятся в монографиях [9, 28, 3, 26].
Интересный для механики случай, когда существует такая функ ция F, что Fi = dF/dXi, был рассмотрен А. Пуанкаре [109]. Для упругих систем с конечным числом степеней свободы наиболее полные резуль таты изложены в монографии Дж. Томпсона и Г. Ханта [115]. Более подробный обзор дан в книге [17].
Общий случай ветвления, определенный слагаемыми второй степени в формуле Тейлора, рассмотрен в главе 8.
Глава 2
Задача Коши лля обыкновенных дифференциальных уравнений
В этой главе мы рассмотрим задачу Коши для системы обыкно венных дифференциальных уравнений (ОДУ). При определенных огра ничениях решением этой задачи является гладкая интегральная кривая в пространстве неизвестных и параметра, т. е. такое же однопараметри ческое множество, какие были рассмотрены в предыдущей главе. Это обстоятельство позволяет нам посмотреть на задачу Коши с точки зрения метода продолжения решения по параметру. А такой взгляд приводит к постановке задачи о наилучшем параметре продолжения, которая и решается ниже.
2.1. Задача Коши как задача продолжения решения по параметру
Рассмотрим задачу Коши для нормальной системы обыкновенных дифференциальных уравнений (ОДУ):
dyf |
У«(*о) = У,0> |
___ |
(2.1) |
-^- = Л(|/1,У2, •••,!/»., О, |
*= 1 ,п . |
||
Полагаем, что выполняются условия теоремы |
о существовании |
||
и единственности решения этой задачи. |
|
|
|
Пусть интеграл этой задачи задается соотношениями |
|
||
ОДг1.---1Йн 0 = 0. J = V «. |
ОДгю.---.1Ы>. *о) = 0, |
(2.2) |
которые определяют интегральную кривую задачи (2.1) в (n + 1)-мерном
евклидовом пространстве Rn+1: {у ь .. •, у», t}.
Процесс построения этой кривой можно рассматривать как задачу построения множества решений системы уравнений (2.2), содержащих параметр-аргумент t, для различных значений t. Будем решать эту си стему методом продолжения по параметру. Тогда задача (2.1) может быть рассмотрена как задача Коши для уравнений продолжения решения си стемы (2.2) по параметру t, приведенных к нормальной форме. Поэтому, так же, как и в главе 1 можно поставить вопрос о наилучшем параметре продолжения. Мы будем называть его также наилучшим аргументом.