- •Исходный текст
- •Задание 1. Описание закрытой информационной экосистемы
- •Дополненный текст
- •Заключение
- •Задание 2. Построение семантических сетей
- •Семантическая сеть по исходному тексту
- •Семантическая сеть по дополненному тексту
- •Заключение
- •Задание 3. Построение матрицы по семантической сети (фреймворк Захмана)
- •Матрица по семантической сети по дополненному тексту
- •Заключение
- •Задание 4. Вычисление количества информации на элементарный символ
- •Расчет для исходного текста
- •Расчет для дополненного текста
- •Заключение
- •Задание 5. Вычисление количества информации для текста и матрицы
- •Расчет для исходного текста
- •Расчет для дополненного текста
- •Заключение
- •Задание 6. Поиск кратчайшего маршрута методом Дейкстры
- •Расчет для исходного текста
- •Расчет для дополненного текста
- •Заключение
Заключение
Опираясь на предоставленные данные сказки, мы смогли определить и построить матрицу, выделив критерии и характеристики героев сказки, что показали взаимосвязь между ними.
Задание 4. Вычисление количества информации на элементарный символ
Вычислить количество информации на символ.
Для этого необходимо посчитать количество символов в тексте (без учета знаков препинания и пробелов).
Определить мощность алфавита, вычислить количество бит на каждый символ. вычислить энтропию, nср и Iср.
Расчет для исходного текста
Количество символов без учета знаков препинания 616.
Таблица 2 - Кодирование исходного текста методом Шеннона
Буква |
Вероятность |
Символы кода |
||||||||
1-й |
2-й |
3-й |
4-й |
5-й |
6-й |
7-й |
8-й |
Код |
||
- |
0,23096 |
0 |
0 |
|
|
|
|
|
|
00 |
а |
0,10237 |
1 |
0 |
010 |
||||||
к |
0,08240 |
1 |
0 |
0110 |
||||||
у |
0,07990 |
1 |
0111 |
|||||||
т |
0,05743 |
1 |
0 |
0 |
0 |
1000 |
||||
е |
0,04494 |
1 |
1001 |
|||||||
н |
0,03995 |
1 |
0 |
1010 |
||||||
д |
0,03620 |
1 |
0 |
10110 |
||||||
о |
0,03496 |
1 |
0 |
101110 |
||||||
п |
0,03371 |
1 |
101111 |
|||||||
з |
0,03121 |
1 |
0 |
0 |
|
|
1100 |
|||
б |
0,02996 |
1 |
0 |
11010 |
||||||
в |
0,02871 |
1 |
0 |
110110 |
||||||
р |
0,02622 |
1 |
110111 |
|||||||
я |
0,02497 |
1 |
0 |
0 |
|
11100 |
||||
ч |
0,01998 |
1 |
0 |
111010 |
||||||
л |
0,01623 |
1 |
111011 |
|||||||
ш |
0,01248 |
1 |
0 |
0 |
111100 |
|||||
и |
0,01124 |
1 |
0 |
1111010 |
||||||
ы |
0,01124 |
1 |
1111011 |
|||||||
ж |
0,00999 |
1 |
0 |
0 |
1111100 |
|||||
с |
0,00999 |
1 |
1111101 |
|||||||
ь |
0,00999 |
1 |
0 |
1111110 |
||||||
м |
0,00874 |
1 |
0 |
11111110 |
||||||
г |
0,00624 |
1 |
11111111 |
Энтропия на символ
Средняя длина закодированной комбинации
Среднее количество информации на элементарный символ