лаб_3_1вар — копия
.docxМИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
федеральное государственное автономное образовательное учреждение высшего образования
«САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ АЭРОКОСМИЧЕСКОГО ПРИБОРОСТРОЕНИЯ»
ИНСТИТУТ НЕПРЕРЫВНОГО И ДИСТАНЦИОННОГО ОБРАЗОВАНИЯ
КАФЕДРА ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ И ПРОГРАММИРОВАНИЯ
|
ОЦЕНКА
ПРЕПОДАВАТЕЛЬ
ассистент |
|
|
|
Е.К.Григорьев |
должность, уч. степень, звание |
|
подпись, дата |
|
инициалы, фамилия |
ОТЧЕТ О ЛАБОРАТОРНОЙ РАБОТЕ №3
|
СТАТИСТИЧЕСКАЯ ОБРАБОТКА ОДНОМЕРНОЙ ВЫБОРКИ
|
по дисциплине: МОДЕЛИРОВАНИЕ
|
РАБОТУ ВЫПОЛНИЛА
СТУДЕНТКА ГР. № |
|
|
|
|
|
|
номер группы |
|
подпись, дата |
|
инициалы, фамилия |
Санкт-Петербург
2021
Цель работы - получение основных навыков обработки одномерной выборки в пакете MATLAB.
Номер варианта: 1.
Запись заданной по варианту выборки в вариационный ряд:
-1.256344149 -1.248301942 -1.178509592 -1.149294349 -0.943175564 -0.837962943 -0.826607902 -0.782827101 -0.766406174 -0.716261184 -0.596016889 -0.595650818 -0.430839009 -0.424385007 -0.406787422 -0.346665274 -0.315552597 -0.251831125 -0.24654355 -0.195584562 -0.146364982 -0.122357733 -0.082136467 -0.023525217 -0.003633431 0.001873559 0.05775064 0.082289944 0.16494937 0.196207566 0.281158918 0.306640686 0.316115347 0.335719506 0.349427864 0.40396344 0.442366854 0.466116035 0.572605359 0.597295866 0.756999725 0.810671281 0.894860932 0.922607342 1.027449343 1.04155788 1.09474513 1.413404789 1.461773991 2.634624252
Определение количества интервалов z по формуле Стерджесса, для этого определим объем выборки, в нашем случае он равен 50:
z = 1 + [3.322 lg n] = 1 + [3.322 * lg 50] = 6.64 7
Вычисление размаха выборки и длины одного интервала. Построение статистического ряда.
Размах выборки:
xmax – xmin = 2,634624252– (-1,256344149) = 3,890968401
Длина одного интервала h:
h = = 3,890968401/ 7 = 0,555852629
Разбиваем на интервалы и строим статистический ряд:
Таблица 1 - Интервалы и статистический ряд
Интервал |
[-1,256344149; -0,70049152) |
[-0,70049152; -0,144638891) |
[-0,144638891; 0,411213737) |
[0,411213737; 0,967066366) |
[0,967066366; 1,522918995) |
[1,522918995; 2,078771623) |
[2,078771623; 2,634624252) |
Частота |
10 |
11 |
15 |
8 |
5 |
0 |
1 |
Подготовка таблицы для построения графиков:
Таблица 2 - Средние значения интервалов и частоты
Интервал |
Середина интервала |
Частота |
Относительная частота |
[-1,256344149; -0,70049152) |
-0,978417834 |
10 |
10/50 |
[-0,70049152; -0,144638891) |
-0,422565206 |
11 |
11/50 |
[-0,144638891; 0,411213737) |
0,133287423 |
15 |
15/50 |
[0,411213737; 0,967066366) |
0,689140052 |
8 |
8/50 |
[0,967066366; 1,522918995) |
1,24499268 |
5 |
5/50 |
[1,522918995; 2,078771623) |
1,800845309 |
0 |
0/50 |
[2,078771623; 2,634624252) |
2,356697938 |
1 |
1/50 |
Построение графиков гистограммы, полигона частот и эмпирической функции распределения по подготовленным данным:
F*= ’
Рисунок 1 - График функции распределения
Рисунок 2 - Гистограмма и полигон частот
По внешнему виду гистограммы можно предположить, что данная выборка распределена по нормальному закону.
Вычисление математического ожидания, смещенной и несмещенной дисперсии, моды, медианы, коэффициента асимметрии и эксцесса.
0,054792213
= 0,622307359
= 0,609861212
0,788864601
MО = 0
Kа = 0,069457056
m4 = 2,680841323
Eк = m4/σ4 – 3 = (1,446653185/ 0,788864601^4) -3 = 0,735549999
Решение задачи в пакете MATLAB
Построение вариационного ряда, определение количества интервалов и абсолютной частоты попадания элемента выборки в каждый из интервалов:
clear all
close all
clc
n = 50;
%выборка для варианта № 1
x = [-1.256344149 -1.248301942 -1.178509592 -1.149294349 -0.943175564 -0.837962943 -0.826607902 -0.782827101 -0.766406174 -0.716261184 -0.596016889 -0.595650818 -0.430839009 -0.424385007 -0.406787422 -0.346665274 -0.315552597 -0.251831125 -0.24654355 -0.195584562 -0.146364982 -0.122357733 -0.082136467 -0.023525217 -0.003633431 0.001873559 0.05775064 0.082289944 0.16494937 0.196207566 0.281158918 0.306640686 0.316115347 0.335719506 0.349427864 0.40396344 0.442366854 0.466116035 0.572605359 0.597295866 0.756999725 0.810671281 0.894860932 0.922607342 1.027449343 1.04155788 1.09474513 1.413404789 1.461773991 2.634624252];
%x = sort(x); % Построение вариационного ряда
% Поиск минимального и максимального
% элементов выборки
xmax = max(x);
xmin = min(x);
% Определим количество интервалов
% по формуле Стерджесса
b = 3.332;
r = ceil(1+b*log10(n));
% Длина интервала
stp = (xmax-xmin)/r;
% Определяем середины интервалов
centr = [];
centr(1) = xmin+(stp/2);
for i=2:1:r
centr(i) = centr(i-1)+stp
end
% Определяем абсолютную частоту
k1 = xmin;
i = 1;
while i<=r
k2 = 0;
for j=1:n
if (x(j)>=k1) & (x(j)<=k1+stp)
k2 = k2+1;
end
end
freqn(i) = k2
k1 = xmin+stp*i;
i = i+1;
end
Расчет числовых характеристик выборки и вывод их на экран, при помощи следующего программного кода:
% Числовые характеристики выборки:
% Выборочное среднее
m = mean(x);
% Дисперсия
D = var(x);
% Ср. кв. отклонение
SKO = std(x);
% Мода
moda = mode(x);
% Медиана
med = median(x);
% Коэффициент эксцесса
kurt = kurtosis(x);
% Коэффициент асимметрии
skew = skewness(x);
% Вывод значений
fprintf('Макс. значение = %f\n',xmax);
fprintf('Мин. значение = %f\n',xmin);
fprintf('Число интервалов = %f\n',r);
fprintf('Длина одного интервала = %f\n',r);
fprintf('Выборочное среднее = %f\n',m);
fprintf('Выборочная дисперсия = %f\n',D);
fprintf('Ср. кв. отклонение = %f\n',SKO);
fprintf('Мода = %f\n',moda);
fprintf('Медиана = %f\n',med);
fprintf('Коэф. эксцесса = %f\n',kurt);
fprintf('Коэф. асимметрии = %f\n',skew);
Макс. значение = 2.634624
Мин. значение = -1.256344
Число интервалов = 7.000000
Длина одного интервала = 0.555853
Мат. ожидание = 0.054792
Выборочная дисперсия = 0.622307
Ср. кв. отклонение = 0.788865
Мода = -1.256344
Медиана = -0.000880
Коэф. эксцесса = 3.811786
Коэф. асимметрии = 0.625837
Построение полигона частот, гистограммы и эмпирической функции распределения:
Листинг:
% Построение полигона частот
figure()
plot(centr,freqn/n,'r-o')
xlabel('Интервалы');
ylabel('Относительная частота')
grid on
% Построение гистограммы
figure()
histogram(x,r)
xlabel('Интервалы');
ylabel('Частота')
grid on
% Построение эмпирической
% функции распределения
figure()
ecdf(x)
% Подпись оси 0X
xlabel('x')
% Подпись оси 0Y
ylabel('F(x)')
% Добавление сетки на график
grid on
Рисунок 3 - Полигон частот
Рисунок 4 – Гистограмма
Рисунок 5 - Эмпирическая функция распределения
Таблица сравнения числовых характеристик для заданной выборки, полученных с помощью формул и с помощью пакета MATLAB
Таблица 3 – Сравнение числовых характеристик для заданной выборки
Характеристика |
M[X] |
D[X] |
СКО |
Коэф. асим. |
Коэф. эксцесса |
С помощью Excel |
0,054792213 |
0,622307359 |
0,788864601 |
0,069457056 |
0,735549999 |
С помощью MATLAB |
0.054792 |
0.622307 |
0.788865 |
0.625837 |
3.811786 |
Вывод:
Данная выборка записана в виде вариационного ряда.
Выборка была разбита на интервалы.
Найдена середина каждого интервала.
Произведен расчет частоты и относительной частоты.
Представлена гистограмма и полигон частот, а также сделано предположение, что выборка соответствует нормальному распределению.
Были вычислены с помощью функций среды MATLAB и Exсel математическое ожидание, смещенная и несмещенная дисперсия, мода, медиана, коэффициент асимметрии и эксцесса.
Вычисленные характеристики были сведены в таблицу 3, глядя на которую можно увидеть, что результаты при вычислении «вручную» и с помощью функций МАТЛАБ схожи.