Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ЛР / ЛР4 / Описание вариантов для 3-4 ЛР

.pdf
Скачиваний:
9
Добавлен:
25.06.2023
Размер:
90.23 Кб
Скачать

1

1heart.csv

Содержит информацию о сердечных болезнях.

 

 

1.

возраст

 

 

 

 

 

 

 

2.

пол

 

 

 

 

 

 

 

3.

тип боли в груди (4 значения [TA: типичная

 

 

 

стенокардия, ATA: атипичная стенокардия,

 

 

 

NAP:

неангинальная

боль,

ASY:

 

 

 

бессимптомная])

 

 

 

 

 

4.

артериальное давление в покое

 

 

 

 

5.

холестерин сыворотки в мг/дл

 

 

 

 

6.

уровень сахара в крови натощак > 120 мг/дл

 

 

7.

ЭКГ в покое: результаты электрокардиограммы

 

 

 

в покое норма: нормальная, ST: аномалия ST-T

 

 

 

LVN: гипертрофия

 

 

 

 

 

8.

MaxHR: максимальная достигнутая частота

 

 

 

сердечных сокращений [Числовое значение от

 

 

 

60 до 202]

 

 

 

 

 

 

9.

стенокардия, вызванная физической нагрузкой

 

 

 

(да, нет)

 

 

 

 

 

 

10. oldpeak = депрессия ST, вызванная физической

 

 

 

нагрузкой, по сравнению с состоянием покоя

 

 

11.наклон

пикового сегмента

ST при

нагрузке

 

 

 

(Вверх: восходящий, Плоский: плоский, Вниз:

 

 

 

нисходящий)

 

 

 

 

 

 

12. HeartDisease:

выходной класс

[1:

болезнь

 

 

 

сердца, 0: нормальный]

 

 

 

2

2liver.csv

Датасет заболеваемости печенью.

 

 

 

 

 

Столбцы:

 

 

 

 

 

 

 

1.

Возраст пациента

 

 

 

 

 

2.

Пол пациента

 

 

 

 

 

 

3.

Общий билирубин

 

 

 

 

 

4.

Прямой билирубин

 

 

 

 

 

5.

Щелочная фосфатаза

 

 

 

 

 

6.

Аламиноаминотрансфераза

 

 

 

 

 

7.

Аспартатаминотрансфераза

 

 

 

 

 

8.

Всего белков

 

 

 

 

 

 

9.

Альбумин

 

 

 

 

 

 

10.Соотношение альбуминов и глобулинов

 

 

11.Цель:

поле,

используемое

для

разделения

 

 

 

данных на два набора (пациент с заболеванием

 

 

 

печени или без заболевания).

 

 

 

3

3cancer.csv

Информация об атрибутах:

 

 

 

 

 

1. id

 

 

 

 

 

 

 

 

2. Толщина скопления: 1–10

 

 

 

 

 

3. Однородность размера клеток: 1–10

 

 

 

 

4. Однородность формы клеток: 1–10

 

 

5.Краевая адгезия: 1–10

6.Размер отдельных эпителиальных клеток : 1 - 10

7.Голые ядра: 1 - 10

8.Бледный хроматин: 1 - 10

9.Нормальные ядрышки: 1 - 10

10.Митозы: 1 - 10

11.Класс: (2 для доброкачественных, 4 для злокачественных)

4

4heart2.csv

Записи о болезнях сердца

 

 

 

 

 

Столбцы

 

 

 

 

 

 

1.

возраст: возраст пациента (лет)

 

 

 

 

2.

-анемия: снижение количества эритроцитов или

 

 

 

гемоглобина (логическое значение)

 

 

 

 

3.

-высокое кровяное давление: если у пациента

 

 

 

гипертония (логическое значение)

 

 

 

 

4.

креатининфосфокиназа

(КФК):

 

уровень

 

 

 

фермента КФК в крови (мкг/л)

 

 

 

 

5.

диабет: если у пациента диабет (логическое

 

 

 

значение)

 

 

 

 

 

 

6.

фракция выброса: процент крови, покидающей

 

 

 

сердце при каждом сокращении (в процентах)

 

 

7.

тромбоциты:

тромбоциты

в

крови

 

 

 

(килотромбоциты/ мл)

 

 

 

 

 

8.

пол: женщина или мужчина (бинарный)

 

 

9.

креатинин сыворотки: уровень креатинина

 

 

 

сыворотки в крови (мг/дл)

 

 

 

 

 

10. натрий сыворотки: уровень натрия сыворотки в

 

 

 

крови (мэкв/л)

 

 

 

 

 

 

11.курение: если

пациент

курит

 

или нет

 

 

 

(логическое)

 

 

 

 

 

 

12.время: период наблюдения (дни)

 

 

 

 

13. событие смерти: если пациент умер в течение

 

 

 

периода наблюдения (логическое значение)

5

5gym_churn.csv Информация о клиентах фитнес клуба:

 

 

 

 

1.

Пол

 

 

 

 

 

 

2.

Близкое расположение

 

 

 

 

 

3.

Сотрудник компании партнера

 

 

 

 

4.

По промо друзей

 

 

 

 

 

 

5.

Указан ли телефон

 

 

 

 

 

6.

Длительность текущего абонемента

 

 

 

 

7.

Посещение групповых занятий

 

 

 

 

8.

Возраст

 

 

 

 

 

 

9.

Средние траты на доп услуги

 

 

 

 

10.Количество месяцев до окончания абонемента

11. время с момента первого обращения в фитнесцентр (в месяцах)

12.средняя частота посещений в неделю за все время с начала действия абонемента

13.средняя частота посещений в неделю за предыдущий месяц

14.Churn – факт ухода из клуба

Соседние файлы в папке ЛР4