Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Основы теории оценивания с приложениями к задачам обработки навигационной информации. Ч. 1 Введение в теорию оценивания

.pdf
Скачиваний:
37
Добавлен:
19.11.2023
Размер:
26.49 Mб
Скачать

В п е р в о й г л а в е рассматриваются элементы теории вероятностей в объеме, необходимом для понимания последующе­ го материала. Она содержит пять разделов, в которых вводятся понятия случайных величин и векторов, методов их описания в виде числовых хкрактеристик и функций плотности распределения вероятностей. Рассматриваются различные типы случайных вели­ чин и проблема их преобразования. Вводится понятие условной (апостериорной) ф.п.р.в., обсуждаются методы моделирования случайных величин с заданными свойствами и процедуры опреде­ ления их выборочных характеристик.

В т о р а я г л а в а посвящена общим принципам и подхо­ дам, используемым при решении задач оценивания. Эти вопросы рассматриваются применительно к простой, но весьма важной для навигационных приложений задаче оценивания постоянных пара­ метров. Глава состоит из шести разделов. В них приводятся при­ меры линейных и нелинейных задач обработки навигационной информации, в которых возникает необходимость отыскания век­ тора постоянных параметров, и в общем виде формулируется по­ становка задачи оценивания. Значительное внимание уделяется методу наименьших квадратов и его модификациям, применение которых для построения алгоритмов оценивания не требует введе­ ния предположений о случайном характере ошибок измерения и оцениваемых параметров. Рассматриваются основные положения небайесовского и байесовского подходов и соответствующие им постановки задач, особенность которых заключается в том, что для первой из них вводится предположение о случайном характере только ошибок измерения, а во второй случайным считается также и оцениваемый вектор. Излагаются соответствующие различным постановкам алгоритмы оценивания, анализируется их взаимо­ связь, свойства и особенности. Обсуждаются различные схемы реализации алгоритмов оценивания. При изложении акцент дела­ ется на двух важных для навигационных приложений аспектах проблемы оценивания, связанных с необходимостью получения не только процедуры нахождения оценок, т.е. решения задачи синтеза алгоритмов, но и анализа их точности, а также возможности вы­ числения текущей расчетной характеристики точности.

Т р е т ь я г л а в а посвящена обобщению методов и алго­ ритмов оценивания, полученных для постоянного вектора, приме­ нительно к задачам оценивании случайных последовательностей.

Она состоит из пяти разделов. В них излагаются основные понятия теории случайных последовательностей и методы их описания. Формулируется постановка задачи и приводятся алгоритмы нахо­ ждения оптимальных линейных и нелинейных оценок Значитель­ ное внимание уделяется рекуррентным алгоритмам решения задач фильтрации и сглаживания, основными из которых являются алго­ ритмы калмановского типа. Приводятся методы построения су­ боптимальных фильтров для решения нелинейных задач, основан­ ные на гауссовской аппроксимации апостериорной плотности. Об­ суждается возможность применения неравенства Рао-Крамера для решения задачи анализа потенциальной точности в нелинейной гауссовской задаче.

По ходу изложения предлагаемый материал иллюстрируется на примерах и задачах методического характера, а также связанных с обработкой навигационной информации, в частности, примени­ тельно к задаче оценивания коэффициентов полинома, определе­ ния сдвига между реализациями; комплексной обработке избы­ точных измерений; задаче определения координат по точечным ориентирам и спутниковым данным; задаче коррекции показаний навигационной системы с использованием внешних данных, та­ кой, например, как задача корреляционно-экстремальной навига­ ции и ряд других.

Все разделы завершаются перечнем контрольных вопросов и набором задач, для большинства из которых приведены их реше­ ния. В конце каждой главы предлагается задание по моделирова­ нию с использованием средств M atlab.

Имеется подробный предметный указатель и перечень основ­ ных англоязычных терминов.

Вторая запланированная к изданию часть книги Основы при­ кладной теории фильтрации будет посвящена методам теории оценивания в приложениях к случайным процессам и возможно­ стям их применения при решении навигационных задач.

Для изучения материала, представленного в настоящем изда­ нии, не требуется специальных знаний из области теории систем, дифференциальных уравнений и т.д., желательно лишь владеть основами матричных исчислений. В связи с чем в приложении приведены краткие сведения из этой теории. Кроме того, здесь кратко описаны используемые разделы Matlab, в частности те, ко­ торые требуются при выполнении упражнений и заданий.

Формирование содержания предлагаемой книги осуществля­ лось на основе многолетнего опыта автора, накопленного при ре­ шении задач обработки навигационной информации. Кроме того, учитывался опыт чтения лекций по основам прикладной теории оценивания для студентов трех ведущих вузов Санкт-Петербурга (ГУИТМО, ГЭТУ(ЛЭТИ), ГУАП), обучающихся по специально­ стям, связанным с проектированием навигационных систем, вклю­ чая студентов базовой кафедры «Информационно-навигационных систем» СПбГУИТМО; студентов, обучающихся по специально­ сти, связанной с обработкой гидроакустической информации; мо­ лодых специалистов и аспирантов ЦНИИ «Электроприбор»; зару­ бежных специалистов.

При отборе и изложении материала автор ставил перед собой задачу сделать его, с одной стороны, доступным для более широ­ кого круга читателей, а с другой - предоставить возможность уг­ лубленного, в том числе и самостоятельного изучения теории за­ интересованному читателю. В частности, при первоначальном оз­ накомлении можно ограничиться изучением следующих разделов:

1.1, 1.2, 1.3.3, 1.3.4, 1.5; 2.1, 2 .2,2 .4, 2.6.4; 3.1,3 .2 .2, 3.2.3, 3.5.1,3.5.2.

Автор признателен всем, кто помогал и содействовал выходу в свет настоящей книги. Ее появление в значительной степени обу­ словлено активной и доброжелательной поддержкой со стороны директора ЦНИИ «Электроприбор», президента Академии навига­ ции и управления движением, академика РАН В.Г.Пешехонова.

Автор выражает благодарность рецензентам - заслуженным деятелям науки и техники РФ С.П.Дмитриеву и И.Б.Челпанову за ценные замечания, учет которых способствовал улучшению со­ держания книги, а также коллегам, с которыми автор на разных этапах подготовки книги неоднократно обсуждал ее содержание и отдельные разделы: д.т.н. Ю.А.Лукомскому, к.т.н. А.П.Колеватову, к.т.н. Д.А.Кошаеву, к.т.н. А.В.Лопареву. Автор признате­ лен студентам и аспирантам Т.П.Тосиковой, Ю.В.Шафранюк, В.А.Васильеву, А.Б.Торопову, помогавшим вычитывать рукопись, отрабатывать рассматриваемые примеры и задачи и выполнять некоторые расчеты, оформлять графики и рисунки.

Автор с благодарностью примет все замечания и предложения.

ИНС

инерциальная навигационная система

КВО

круговая вероятная ошибка

МНК

метод наименьших квадратов

ммнк

модифицированный метод наименьших квадратов

МФП

максимум функции правдоподобия

омнк

обобщенный метод наименьших квадратов

ОФК

обобщенный фильтр Калмана

сво

сферическая вероятная ошибка

ско

среднеквадратическое отклонение

сне

спутниковая навигационная система

ФК

фильтр Калмана

С.К.О.

среднеквадратическая ошибка

с.в.

случайная величина

ф.р.в.

функция распределения вероятностей

ф.п.р.в.

функция плотности распределения вероятностей

ГЛАВА 1

ЭЛЕМЕНТЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ

Цель настоящей главы - дать краткое изложение элементов теории вероятностей в объеме, необходимом при изучении теории оценивания. Рассматриваемые примеры и задачи ориентированы на навигационные приложения.

В теории вероятностей ключевыми являются понятия случай­ ной величины и случайного вектора, а также используемые для описания их свойств функции и характеристики. Наиболее полное описание этих свойств может быть проведено с привлечением по­ нятия функции распределения вероятностей (ф. р. в.) и (или) функ­ ции плотности распределения вероятностей (ф. п. р. в.).

Вместе с тем при решении широкого круга прикладных задач нередко удается ограничиться информацией лишь о первых двух моментах в виде математического ожидания и матрицы ковариа­ ций, являющейся обобщением понятия дисперсии для векторного случая. Это обусловлено, в частности, тем, что большинство алго­ ритмов обработки носит линейный характер по отношению к входным данным. Как следствие, имеется возможность вычисле­ ния первых двух моментов для преобразованных величин и векто­ ров с использованием только первых двух моментов для входных данных.

При построении изучаемых в дальнейшем алгоритмов оценива­ ния важной является задача описания одного случайного вектора при фиксированном значении другого статистически связанного с ним вектора, так называемая задача регрессии. Приближенное ее решение, часто и достаточно эффективно применяемое на практи­ ке, также сводится к линейным преобразованиям. Таким образом, и здесь можно обойтись информацией только о первых двух мо­ ментах. Отмеченные обстоятельства в первом приближении по­ зволяют в какой-то степени «забыть» о том, что математическое ожидание вводится с использованием ф.п.р.в. Оправданием этому также может служить тот факт, что при наличии эксперименталь-

ных данных известны простые, не требующие привлечения поня­ тия ф.п.р.в. алгоритмы, по которым могут быть получены так на­ зываемые выборочные значения моментов случайных векторов и величин, в том числе и математических ожиданий и матриц кова­ риаций.

В тех же случаях, когда необходимо найти наиболее полное описание статистических свойств преобразованных величин в виде функции плотности распределения и функции распределения ве­ роятностей, очевидно, что их знание требуется и для входных дан­ ных. Более того, эти функции необходимы даже при попытке най­ ти только первые два момента для данных, полученных в резуль­ тате нелинейных преобразований. При строгом решении задачи регрессии в общем случае также необходимо располагать наиболее полной априорной статистической информацией в виде совмест­ ной ф.п.р.в. случайных векторов. И здесь весьма важным является понятие условной или апостериорной ф.п.р.в., с помощью которой полностью описываются свойства одного случайного вектора при фиксированном значении другого вектора.

Отмеченные обстоятельства и принимаются во внимание при изложении в дальнейшем последующего материала, предпола­ гающего два уровня его изучения. В одном из них акцент делается на усвоение методов описания случайных величин и векторов с помощью двух первых моментов, когда предполагается линейный характер преобразований (подразделы 1.1, 1.2, 1.3.3, 1.3.4 и 1.5). Второй уровень предназначен для более углубленного изучения, при котором используются ф.п.р.в. и нелинейные преобразования (подразделы 1.3 в полном объеме и 1.4).

1.1.Случайные величины и методы их описания

Внастоящем разделе вводятся и поясняются такие понятия, как вероятность, случайная величина, функция распределения вероят­ ностей и функция плотности распределения вероятности, анализи­ руются свойства этих функций. Даются определения числовых статистических характеристик случайных величин (с.в.), таких как математическое ожидание, дисперсия, среднеквадратическое от­ клонение, стандартное отклонение, моменты случайных величин, квантиль, медиана и мода распределения. Вводится неравенство

Чебышева. Подробно обсуждаются числовые характеристики га­ уссовских случайных величин и векторов. Вводится стандартизо­ ванная гауссовская случайная величина, функция ошибок, пре­ дельное значение, предельная ошибка, правило трех сигм, среднее абсолютное отклонение, вероятное отклонение, вероятная ошибка. Приводятся примеры, поясняющие введенные понятия и описы­ ваются «j-функции Matlab, с помощью которых могут быть по­ строены различные виды ф.п.р. и ф.п.р.в.

1.1.1. Определение случайной величины и ее описание

Случайной называется такая величина, значение которой зара­ нее неизвестно, и можно лишь указать некую числовую меру (ве­ роятность) того, что она будет принадлежать той или иной заранее определенной области значений.

Для того чтобы ввести строгое определение случайной величи­ ны, необходимо пояснить смысл таких понятий, как вероятность, выборочное пространство и событие [18, 19, 97].

Для целей предлагаемого материала достаточно считать, что выборочным пространством является множество точек п -мерного пространства. Далее пояснения проведем для простейшего случая, когда в качестве выборочного пространства выступает множество Q = {х} всех действительных чисел на числовой оси. Будем назы­

вать их элементарными событиями.

На множестве Cï = {х}

введем класс подмножеств U = {а } ,

включающий все открытые

{х : а <х < b}, закрытые {х : я < х < £>} и

полуоткрытые {x:a<x<b}, {x:a<x<b} интервалы, где a,b - заданные действительные числа, принимающие произвольные из­ вестные значения, в том числе и + со. Кроме того, считаем, что классу подмножеств U = {а } принадлежат отдельные точки, все счетные объединения и пересечения интервалов и точек. Этот класс подмножеств U = {а } будем называть возможными собы­ тиями. Важно подчеркнуть, что при выполнении над элементами этого класса операций объединения, пересечения и дополнения вновь получается элемент, принадлежащий этому подмножеству, т.е. при выполнении перечисленных операций над событиями вновь получается событие.

( 1 .1 . 1 )
( о ,х ),

Для событий А введем действительную скалярную функцию (вероятностную меру) Рг(А ), обладающую следующими свойст­

вами:

. Рг(А)> О для всех А;

Рг(П) = 1 ;

для любой последовательности из т попарно непересекаю-

щихся событий, т.е. А/ Г) A j = 0, где 0- пустое множество, спра-

т

ведпиво равенство Рг l > .

= 2 > ( а ,).

V/=i

J »=1

Эту функцию будем называть вероятностью события А или просто вероятностью.

Случайную величину будем считать заданной, если определе­ на функция, позволяющая вычислять вероятность появления лю­ бого возможного события, т.е. вычислять вероятность того, что случайная величина примет какое-либо заданное значение, будет принадлежать тому или иному интервалу или их набору и т.д.

В качестве такой функции, в полном объеме определяющей свойства случайной величины, используется функция распреде­ ления вероятностей, или интегральная функция распределе­ ния, представляющая собой скалярную функцию Fx(.Y) действи­ тельного аргумента х и определяющая вероятность того, что слу­ чайная величина х принадлежит открытому интервалу т.е. вероятность того, что х < л* Таким образом,

0 0 = Рг(х :х о с ) .

Иногда вместо функции распределения вероятностей исполь­ зуют термин распределение вероятностей или просто распреде­ ление, если из контекста ясно, о чем идет речь.

При введении понятия случайной величины в качестве Q не обязательно должно выступать все множество действительных чи­ сел. Это может быть некоторая область на числовой оси, конечный или счетный набор чисел.

Итак, статистические свойства случайной величины в полном объеме задаются с помощью функции распределения вероятно­

стей. В силу перечисленных выше свойств вероятностной меры нетрудно понять, что функция ( 1 .1 .1 ) является неотрицательной неубывающей, непрерывной слева функцией, удовлетворяющей условиям:

Fx( - 00) = Рг(х : х < -да) = 0 ;

(1.1.2)

Fx (00) = Рг(х : х < оо) = 1

(1.1.3)

Помимо функции распределения вероятности для описания свойств случайных величин используют также функцию плотно­ сти распределения вероятности, определяемую как

/.(* > =

<У,(*)

(1.1.4)

dx

 

 

 

Далее в зависимости от контекста также будем использовать термины - плотность распределения вероятностей, плотность распределения или просто плотность. Индекс снизу у функций указывает на ту случайную величину, которой он соответствует и в дальнейшем может опускаться, если это не вызывает недоразу­ мений.

В англоязычной литературе для ф.р.в. используется термин cumulative density function (c.d.f) - интегральная функция распре­ деления вероятностей, а для ф.п.р.в. - probability density function (p.d.f.).

Осуществляя интегрирование обеих частей (1.1.4) в пределах от - о о до л' с учетом (1 .1 .2 ), получаем

е д = / л ("V "-

( 1 i s )

Функция плотности распределения вероятностей является не­ отрицательной ( / х (л;)>0 ) функцией, удовлетворяющей условию нормировки

00

\ f x № ) d u = 1.

(1 .1 .6 )

Для вероятности такого события, при котором

дг, < х < х2 ,

справедливы следующие очевидные равенства:

 

 

Pr(.V! < х < л-2 ) = Рг(х : х < х2

) ~ Рг(х : х < X] ) = Fx 2

) - Fx (xj ) (1.1.7)

или

Рг(х,

< х< х2 ) =Fx 2 ) - Fx (Xj ) = J/ х{u)du

(1.1.8)

Принимая во внимание (1.1.4), можно записать

 

 

 

. , ч

.. Fx(x + dx)- Fx(x)

P r(x < x < x + dx)

 

f\ (-4 = »im — ----------------

dx -----

= lim — -------------------

dx

1 ;

 

 

rfv-*o

о

 

из этого соотношения следует, что при малых dx

 

 

 

Pr(x < x < x +dx) = Fx (x + dx) - Fx (x) « / x (x)dx.

(1.1.9)

♦ Г1р H M e p 1.1.1. Одной из часто используемых является равно­ мерно распределенная на интервале [a,Z>] случайная величина, для которой ф.р.в. и ф.п.р.в. задаются в виде:

о при х < а,

XCl

при

а<х<Ь,

(1.1.10)

^х(*) = b - а

 

x > b,

 

1

при

 

О

при

x g [a,b],

(1.1.11)

/х(*) = <

при

хе[я,£ ].

 

 

.Ь -а

В этом случае говорят, что с.в. имеет равномерное распределение (равномерную ф.р.в.) или равномерную плотность распределения (равномерную ф.п.р.в). Графики этих функций представлены на рис. 1 .1 .1 .

Соседние файлы в папке книги