- •Министерство образования и науки Республики Казахстан
- •1. Учебная программа дисциплины – Syllabus
- •1. 1. Данные о преподавателях:
- •1.1 Данные о дисциплине:
- •Выписка из учебного плана
- •1.5. Краткое описание дисциплины
- •1.6. Перечень и виды заданий и график их выполнения:
- •Виды заданий и сроки их выполнения
- •1.7. Список литературы
- •1.8. Контроль и оценка знаний
- •Распределение рейтинговых баллов по видам контроля
- •Календарный график сдачи всех видов контроля
- •Оценка знаний студентов
- •2. Содержание Активного раздаточного материала
- •2.1 Тематический план курса составляется в виде таблицы, где указываются наименование темы и количество академических часов, предусмотренных для каждой темы. Тематический план курса
- •2.2 Конспект лекционных занятий
- •Глава 1. Основные понятия и определения статистики
- •Тема 2. Показатели описательной статистики. Среднее, дисперсия, стандартное отклонение, эксцесс, асимметрия, интервалы. Компьютерные технологии получения дескриптивной статистики.
- •Глава 2. Выборки.
- •Тема 5. Анализ одной выборки. Анализ однородности выборки. Доверительные интервалы для среднего. Доверительные интервалы для средних выборок. Компьютерные технологии анализа.
- •Тема 6. Анализ двух выборок. Выявление достоверности различий. Параметрические и непараметрические методы анализа выборок. Компьютерные технологии анализа одной выборки.
- •Глава 3. Анализ статданных.
- •Тема 7. Дисперсионный анализ статданных. Однофакторный дисперсионный анализ статистических данных. F- тест для для дисперсий. Компьютерные технологии анализа.
- •Тема 8. Корреляционный анализ статданных. Коэффицент корреляции Пирсона. Коэффициент ранговой корреляции. Ложная и истинная корреляция Компьютерные технологии анализа.
- •Глава 4. Регрессионный анализ.
- •Тема 9. Регрессионный анализ статданных. Простая линейная регрессии. Оценивание параметров линейной регрессиии методом наименьших квадратов, коэффициент детерминации.
- •Тема 10. Оценка существенности параметров линейной регрессии. Оценка качества регрессии f-критерий Фишера, t-статистика. Проверка значимости параметров регрессии. Понятие нелинейной регрессии.
- •Тема 11. Множественная регрессия. Многомерная регрессионая модель. Фиктивные переменные. Кодирование значений качественных переменных. Мультиколлинеарность.
- •Глава 5. Анализ временных рядов.
- •Тема 12. Анализ статданных в виде временных рядов. Временные ряды и их характеристики. Аддитивная и мультипликативная модель. Декомпозиция временного ряда.
- •Тема 13. Анализ и получение тренда. Методы аналитического выравнивания. Метод скользящего среднего. Метод экспоненциального сглаживания. Оценка точности трендовой модели.
- •Тема 14. Модели временных рядов. Понятие об авторегрессионных моделях временных рядов. Коэффицент автокорреляции и автокорреляционная функция.Тест Дарбина-Уотсона.
- •Тема 15. Анализ моделей временных рядов. Решение проблемы автокорреляции. Учет сезонности. Коинтеграция временных рядов.Тест Энгла - Гренжера. Современные тенденции статанализа.
- •2.3 Планы лабораторных занятий
- •Технология построения трендов в Microsoft Excel Порядок выполнения лабораторной работы
- •Форматирование метки линии тренда.
- •Задание на выполнение лабораторной работы:
- •Задание на выполнение лабораторной работы
- •2.4 Планы занятий в рамках самостоятельной работы студентов под руководством преподаватля (срсп)
- •Тема 1. Функции распределения дискретной случайной величины. Биномиальное распределение. Применение компьютерных технологий при статистическом исследовании биномиального распределения. (2 ч.)
- •Тема 3. Функции распределения дискретной случайной величины. Распределение Пуассона. Применение компьютерных технологий при статистическом исследовании распределения Пуассона. (2 ч.)
- •Тема 4. Функции распределения непрерывной случайной величины. Гауссово распределение. Применение компьютерных технологий при статистическом исследовании Гауссово распределения. (2 ч.)
- •Тема 5. Функции распределения непрерывной случайной величины. Распределение хи-квадрат. Применение компьютерных технологий при статистическом исследовании распределения хи-квадрат. (2 ч.)
- •Тема 6. Функции распределения непрерывной случайной величины. Распределение Стьюдента. Применение компьютерных технологий при статистическом исследовании распределения Стьюдента. (2 ч.)
- •Тема 7. Функции распределения непрерывной случайной величины. Распределение Фишера. Применение компьютерных технологий при статистическом исследовании распределения Фишера. (2 ч.)
- •Тема 9. Генерация случайных чисел. Применение компьютерных технологий при генерации случайных чисел. (2 ч.)
- •Тема 10. Статистические гипотезы. Одновыборочный z-тест для средних величин. Применение компьютерных технологий при проведении одновыборочного z-теста для средних величин. (2 ч.)
- •Тема 11. Статистические гипотезы. Двухвыборочный z-тест для средних величин. Применение компьютерных технологий при проведении двухвыборочного z-теста для средних величин. (2 ч.)
- •Тема 12. Статистические гипотезы. Одновыборочный t-тест для средних величин. Применение компьютерных технологий при проведении одновыборочного t-теста для средних величин. (2 ч.)
- •Тема 15. Статистические гипотезы. Парный двухвыборочный t-тест для средних величин. Применение компьютерных технологий при проведении парного двухвыборочного t-теста для средних величин. (2 ч.)
- •2.5 Планы занятий в рамках самостоятельной работы студентов (срс)
- •Тема 1. Регрессионный анализ с применением компьютерных технологий. Интерпретация результатов.
- •Тема 2. Регрессионный анализ. Метод наименьших квадратов (мнк).Интерпретация результатов.
- •Тема 3. Регрессионный анализ. Анализ вариации зависимой переменной.
- •Тема 4. Регрессионный анализ. Условия Гаусса-Маркова по классической нормальной линейной регрессионной модели.
- •Тема 5. Регрессионный анализ. Стандартная ошибка регрессии.
- •Тема 6. Регрессионный анализ. Стандартные ошибки коэффициентов регрессии.
- •Тема 7. Регрессионный анализ. Проверка гипотез по коэффициентам регрессии.
- •Тема 8. Регрессионный анализ. Нелинейные регрессии.
- •Тема 9. Регрессионный анализ. Прогнозирование в регрессионных моделях.
- •Тема 10. Временные ряды. Анализ временных рядов с применением компьютерных технологий. Получение тренда. Интерпретация результатов.
- •Тема 11. Временные ряды. Анализ временных рядов с применением компьютерных технологий. Исследование автокорреляции данных временного ряда.
- •Тема 12. Временные ряды. Анализ временных рядов с применением компьютерных технологий. Тест Дарбина-Уотсона.
- •Тема 13. Временные ряды. Анализ временных рядов с применением компьютерных технологий. Тест на коинтеграцию на основе критерия Энгла-Грэнжера.
- •Тема 14. Статистический программный инструментарий. Обзор статистических функций ms Excel.
- •Тема 15. Статистический программный инструментарий. Обзор возможностей пакета "Анализа данных" ms Excel.
- •2.6. Тестовые задания для самоконтроля с указанием ключей правильных ответов
- •24. Имеют ли в общем случае смысловую нагрузку свободный член уравнения линейной регрессии?
- •25. Что такое корреляционные поля?
- •26. Что такое авторегрессионая модель временного ряда?
- •27. Что означает регрессионная модель с лагированными переменными?
- •28. Какой показатель определяется отношением дисперсии результативного признака регрессии к общей дисперсии результативного признака?
- •29. Какой критерий применяется для проверки гипотезы - средние двух выборок относятся к одной и той же совокупности?
- •30. Какой метод применяется для проверки гипотезы - относится та или иной вариант к данной статистической совокупности?
- •Перечень экзаменационных вопросов по пройденному курсу
- •Глоссарий
- •Выходные сведения
2.3 Планы лабораторных занятий
Лабораторная работа 1
Тема : Дескриптивная статистика. Первичный анализ статданных.
Данная работа вводная и имеет цель - отработки навыков использования сервиса Excel по работе с функциями и модулями по теме работы.
ЗАДАНИЯ (при выполнении этой работы использовать встроенные функции):
1. Найдите среднее значение и стандартное отклонение результатов бега на дистанцию 100 м у группы студентов: 12,8; 13,2; 13,0; 12,9; 13,5; 13,1.
2. Найдите выборочные среднее, медиану, моду, дисперсию и стандартное отклонение для следующей выборки 26,35,29,27,33,35,30,33,31, 29.
3. Определите верхнюю (0,75) и нижнюю (0,25) квартили для выборки результатов измерений роста группы студенток: 164,160,157,166,162,160,161,159,160, 163,170,171.
4. Определите выборочные асимметрию и эксцесс для данных измерений роста из упражнения 3.
С помощью пакета "Анализ данных"
1. Найдите наиболее популярный туристический маршрут из четырех реализуемых фирмой (моду), если за неделю последовательно были реализованы следующие маршруты (приводятся номера маршрутов): 1,3,3,2,1,1,4,4,2,4,1,3,2,4,1,4,4,3,1,2,3,4,1,1,3.
В рабочей зоне производились замеры концентрации вредного вещества. Получен ряд значений (в мг/м3): 12, 16, 15, 14, 10, 20, 16, 14, 18, 14, 15, 17, 23, 16. Необходимо определить основные выборочные характеристики.
Примеры (вид листа MS Excel).
Литература:1ocн[164-209], 6ocн[14-15], 5ocн[30-37], 6доп [172-174], 4доп [64-76]
Контрольные вопросы:
1. Какова методика вычисления показателей дескриптивной статистики в MS Excelс помощью встроенных формул?
2. По каким формулам вычисляется среднее, медиана, мода, дисперсия и стандартное отклонение в MS Excel?
3. Какова методика использования пакета "Анализ данных" для вычисления показателей дескриптивной статистики в MS Excel?
Лабораторная работа 2.
Тема: Анализ статданных. Законы распределения случайных величин.
Задание 1. Найти верхнюю и нижнюю квартили f(x) M=24,3 d=1,5.
Задание 2. Найти вероятность что x<=42 при нормальном законе распределения М=40 d=1,5.
Задание 3. Построить диаграмму плотности f(x) M=10 d=2, интервал М-+3d от 4 до 16.
Задание 4. Найти нормализованное x , если x=21 M=20 d=1,5.
Задание 5. Построить диаграмму интегральной нормальной функции М=30 d=3, интервал +-3d.
Задание 6. Найти квантиль для р=0,908789 М=40 d=1,5.
Задание 7. Найти вероятности появления значений =< 11,98 в экспоненциальном распределении со средним значением 4.
Задание 8. Найти р-квантили для Хи-квадрат с 14 степенями свободы для р=0,95 p=0,075 p=0,99.
Здесь М-среднее, d - стандартное отклонение.
По всем заданиям при необходимости построить графики и диаграммы.
Пример 1. (вид листа MS Excel).
Пример 2 (вид листа MS Excel).
Контрольные вопросы:
1. Какова методика вычисления квартилей с помощью встроенных формул MS Excel?
2. Какова методика построения диаграмм плотности нормального распределения в MS Excel с применением всроенных функций?
3. Какова методика использования пакета "Анализ данных" для вычисления диаграмм плотности нормального распределения в MS Excel?
Литература:1ocн[231-267], 5ocн[161-194], 6доп[182-197]
Лабораторная работа 3
Тема: Распределение статданных. Анализ выборок.Проверка выборок на соответствие нормальному закону распределения.
В работе следует освоить навыки исследования параметров выборок данных.
Задание 1.Построить эмпирическое распределение и найти степень соответствия нормальному закону распределения для следующей выборки весов детей: 21,21,22,22,22,22,22,22,22,22,22,23,23,23,23,23,23,24,24,24,24,24,24,24,24,24,24,24,25,25,25,25,25,25,25,25,25,25,25,25,25,25,25,25,25,26,26,26,26,26,26,26,26,26,26,26,26,26,26,27,27.
Задание 2. Определить, лежит ли значение 19 внутри границ 95% доверительного интервала по данным предыдущего задания.
Задание 3. Количество голов футбольной команды в двух сезонах:
Месяц |
март |
апрель |
Май |
июнь |
Июль |
август |
сентябрь |
октябрь |
Ноябрь |
2002 |
3 |
4 |
5 |
8 |
9 |
1 |
2 |
4 |
5 |
2003 |
6 |
19 |
3 |
2 |
14 |
4 |
5 |
17 |
1 |
Определить есть ли статистические различия результативности в разных сезонах.
Задание 4. Имеют ли выборки 6,7,9,15,21 и 20, 28, 31, 38, 40 различные уровни разнородности (отличаются ли дисперсии).
Примечание: В первом задании построить графики.
Пример.
Контрольные вопросы:
1. Какова методика определения степени соответствия нормальному закону распределения для выборок MS Excel?
2. Какова методика анализа выборок в MS Excel?
3. Как методика построения эмпирических распределений в MS Excel?
Литература: 1ocн[197-210], 3доп[200-209], 4доп[78-94], 6доп[182-197].
Лабораторная работа 4
Тема: Поиск тренда. Корреляционный анализ.
Статистический прогноз по трендам основан на их экстраполяции (продолжении). Он надежен лишь в условиях достаточно стабильного развития. Прогнозирование по тренду допустимо при сохранении основной тенденции и условий развития, и недопустимо при наступлении скачкообразных, революционных изменений. Поэтому конечный результат формального моделирования всегда должен оцениваться пользователем с точки зрения здравого смысла на основе неформального комплекса знаний об условиях развития процесса, о допустимых предельных значениях показателя и т. п.
На одном наборе исходных данных можно получить до 9 уравнений трендов. Задача исследователя состоит в отборе наилучшего тренда, по которому можно было бы построить надежный прогноз. Менеджер, имеющий опыт моделирования трендов, понимающий условия развития процесса, возможно, не станет перебирать все альтернативные варианты, хорошо зная традиционные зависимости, характерные для конкретных экономических показателей (доходов, прибыли, издержек, запасов и т. п.). В противном случае необходимо исследовать максимум альтернатив для поиска уравнения с наивысшим значением коэффициента детерминации, приближающимся к единице.
Прогноз на основе трендов охватывает все факторы в неявном и обобщенном виде (в отличие от многофакторной регрессионной модели, где каждый фактор имеет числовую характеристику меры своего собственного влияния).