Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

2023ВКР750301ИСАКОВ

.pdf
Скачиваний:
25
Добавлен:
04.09.2023
Размер:
3.37 Mб
Скачать

Другое исследование описывает связь динамики изменения веса и вероятности улучшения контроля гликемии в ходе неинсулиновой сахароснижающей терапии [35]. Более поздние работы, продолжая тематику ожирения и малоподвижного образа жизни, указывают на то, что умеренная физическая активность улучшает самочувствие больных СД, а также является важным фактором, снижающим ППГО и пиковые значения УСК [36, 37].

Затрагивая тему физической активности и здорового образа жизни,

обычно говорят и про качество сна. Канадские ученые проанализировав приблизительно полсотни работ и пришли к выводу, что больше половины всех больных СД страдают нарушениями сна [38]. Биологический механизм,

вызывающий метаболические нарушения, может быть связан со снижением эффективности регуляции гипоталамус-гипофиз-адреналовой оси или изменениями в циркадном паттерне секреции гормонов роста [39], но несмотря на его сложность, добавление в модель параметров, косвенно характеризующих сон, может иметь прогностическую ценность [40].

Впервые состав микрофлоры кишечника в прогностических целях предложили использовать исследователи из израильского Института Вейцмана [41]. Результаты рандомизированного исследования показали значительный рост коэффициента корреляции Пирсона (R) между прогнозируемым и реальным значением УСК после приема пищи для модели,

включавшей в себя бактериальные признаки (рост R c 0,4 до 0,59, доля объяснимой дисперсии увеличилась до ~35%) [42]. Относительно невысокие показатели R было предложено объяснить неучтенной физической нагрузкой перед приемом пищи, получением инсулина, а также высокой индивидуальной вариабельностью глюкозы. Стоит подчеркнуть, что в исследовании приняли участие больные с первым типом СД и здоровые люди, оценка вклада микробиома в точность прогнозирования ППГО для пациентов с другими возможными типами диабета не проводилась.

31

1.4.2 Выбор модели машинного обучения

Проанализировав результаты нескольких отдельных работ [43–45] и

систематических обзоров [46, 47], мы пришли к выводу, что наибольшей популярностью пользуются следующие виды моделей: метод опорных векторов (SVR – Support Vector Machine), деревья решений (Decisions Tree),

нейронные сети, рекуррентные (RNN – Recurrent Neural Network) и прямого распространения (FFN – Feed Forward Networks), а также ансамблевые методы.

Последние показали наилучшие результаты.

Метод опорных векторов прекрасно справляется с многомерными данными, к которым относятся используемые нами параметры приема пищи,

около полусотни нутриентов, и тысячи бактериальных признаков, кроме того,

он не сохраняет промежуточные вычисления и, следовательно, требует меньше памяти. К сожалению, алгоритм не учитывает возможную корреляцию между входными параметрами, поэтому лучшим вариантом будет использовать следующий за ним алгоритм деревьев решений.

Главным преимуществом деревьев решений является то, что они могут работать с плохо предобработанными данными. Это означает, что нам не потребуется применять методы импутации пропущенных значений,

нормализации или шкалирования. Кроме того, деревья решений легко интерпретируются. Тем не менее, сам по себе алгоритм применяется довольно редко, так как единственное дерево очень чувствительно к шуму и, зачастую,

объясняет лишь малую долю дисперсии целевого параметра. Чаще говорят об ансамблях моделей, в которых дерево решений играет роль «слабого» ученика.

Среди наиболее популярных ансамблевых методов можно выделить случайные леса (одна из возможных реализаций принципов бэггинга) и

градиентный бустинг.

Бэггинг вычисляет несколько моделей параллельно и независимо. Это значит, что при условии разрешенных параллельных вычислений на подключенной видеокарте (CUDA – Compute Unified Device Architecture), этот алгоритм может быть в несколько раз быстрее прочих. Модель нацелена на

32

снижение дисперсии оценки значений целевой переменной, а не ее смещения,

что может быть крайне выгодно применительно к аппроксимированию уровней гликемии, отличающихся большим разбросом.

В отличие от бэггинга, бустинг нацелен на уменьшение смещения в данных с небольшим разбросом. Каждая последующая модель учитывает ошибки предыдущей, повышая таким образом точность прогнозирования,

пока не будет достигнуто указанное количество итераций обучения или пороговое значение точности. Бустинг может быть реализован по-разному,

например, популярная библиотека CatBoost от Яндекса позволяет работать с категориальными переменными без One-Hot кодировки, что значительно упрощает и ускоряет процесс разработки и интерпретации модели.

Применительно к нашим данным, выигрыш может быть ощутим при добавлении подмножества признаков, полученных в ходе опроса пациентов об их образе жизни.

Современные тенденции привнесли нейронные сети в сферу биоинженерии, хотя их применение не всегда обосновано. Так, их использование лишено смысла в целях изучения направления вклада некоторого признака в итоговое решение. Кроме того, их архитектура значительно сложнее и ее проще испортить, получив результаты хуже, чем в среднем от применения более простых методов. Тем не менее, применяя RNN

можно получить значительный прирост точности, т.к. они учитывают внутреннее состояние переменной и используют его как входную информацию. Иными словами, зная текущее состояние уровня сахара до приема пищи, можно предположить каким будет его состояние спустя 5

минут, спустя 15 минут и так далее. Это может быть очень выгодно, если включить в обучающую выборку информацию с непрерывного монитора глюкозы.

33

1.5 Постановка цели и задач исследования

В этой главе был проведен анализ текущего состояния проблемы разработки выбранного объекта исследования. Были проанализированы телемедицинские приложения, выделены их ключевые особенности технической реализации, составлены требования к приложению удаленного мониторинга с позиции использования снимаемых параметров в качестве входных данных для встраиваемой модели прогнозирования уровня сахара в крови, разобраны актуальные технологии мобильной разработки, в том числе,

проектирования серверных прикладных интерфейсов программирования

(API – Application Programming Interface) и клиент-серверных баз данных.

Отдельно обсудили вопросы, связанные с выбором прогностически значимых параметров и регрессионных моделей.

Целью работы является разработка мобильного программного обеспечения для проведения удаленного персонализированного мониторинга пациентов, больных сахарным диабетом. Узкопрофильной целевой группой являются пациентки с гестационным сахарным диабетом.

Для разработки системы требуется решить следующие задачи:

1.Разработать структуру планируемой биотехнической системы, дать характеристику объекту исследования;

2.Описать информационное, методическое и метрологическое обеспечение системы;

3.Разработать программный код мобильного приложения;

4.Разработать клиент-серверную базу данных приложения и соответствующий ей API;

5.Реализовать программный код алгоритма прогнозирования гликемии,

оценить адекватность полученной модели поставленной задаче; 6. Провести апробацию в условиях, приближенных к реальным и

проанализировать полученные результаты.

34

2 ТЕОРЕТИЧЕСКИЕ ОСНОВЫ РАЗРАБОТКИ МОБИЛЬНОГО ПРИЛОЖЕНИЯ ДЛЯ ПЕРСОНАЛИЗИРОВАННОГО МОНИТОРИНГА СОСТОЯНИЯ БОЛЬНЫХ САХАРНЫМ ДИАБЕТОМ

2.1 Структура биотехнической системы

Сопоставим принцип работы разрабатываемого приложения со стандартизированной структурой БТС медицинского назначения,

представленной на рисунке 4.

Рисунок 4 – Структура разрабатываемой БТС-М

Врач использует несколько контуров технических средств для взаимодействия с объектом управления (ОУ). Под ОУ подразумевается пациент, протекающие в его организме биохимические процессы,

приобретенные диетические привычки и навыки контроля гликемии.

35

Первый контур – технические средства оценки состояния (ТСОС), часто дополняемые техническими средствами обработки информации (ТСОИ).

Применительно к структурному анализу m-Health систем, функции ТСОС и ТСОИ представлены программным обеспечением, установленным на мобильное устройство, и подключаемой к нему носимой электроникой, если таковая предусмотрена. В нашем случае подключаемыми Bluetooth

устройствами могут быть мониторы непрерывной регистрации уровня глюкозы в крови, электрохимические глюкометры и автономные инсулиновые помпы.

Основным источником информации для оценки состояния пациента,

являются записи, вводимые пациентом вручную и характеризующие его состояние в некотором многомерном пространстве признаков, определяемом целями исследования (см. рисунок 5).

Рисунок 5 – Контур управления и основные компоненты системы

Разработки, связанные с сахарным диабетом, чаще используют в качестве таких признаков параметры, характеризующие приемы пищи, образ жизни человека, а также хронические заболевания. Для мониторинга гестационного сахарного диабета и синдрома поликистоза яичников необходимо дополнительно учитывать изменения в состоянии гормональной системы пациентки.

36

Программное обеспечение производит первичную обработку накопленной информации, например, фильтрацию неполных или неправдоподобных дневников согласно решающим правилам, определенным экспертным составом, чтобы затем использовать полученный кадр данных для расчета диагностически значимых показателей, извлечения новых признаков,

моделирования биологических процессов и прогнозирования реакции постпрандиального гликемического ответа.

Результаты прогнозирования интерпретируются в соответствии с правилами, заложенными в базе знаний, формируя набор персональных диетических рекомендаций, следование которым наиболее вероятно приведет к снижению риска возникновения осложнений. Рекомендации предоставляются пациенту непосредственно в момент введения приема пищи и в виде отложенных пуш-уведомлений, стимулирующих принимать здоровые диетические решения в будущем. Например, информирование о недостаточном уровне потребления пищевых волокон, содержащихся в большом количестве в свежих овощах и фруктах.

Файлы конфигурации входят в контур управления и содержат опорные значения решающих правил и коэффициенты модели, настраивая которые, мы влияем на точность и адекватность прогнозирования. Работу с файлами конфигурации обеспечивает интерфейс прикладного программирования,

выполненный в виде класса с набором полей и методов.

Работа описанной рекомендательной системы является одним из, но не единственно возможным вариантом реализации конкура технических средств управления состояния пациентом (ТСОУ) или, иначе говоря, технических средств воздействия (ТСВ).

Мониторинг длится установленный врачом период, чаще всего неделю или десять дней. Накопленная в процессе работы информация, в том числе результаты работы модели прогнозирования и выданные рекомендации сохраняются и систематизируются в виде распределенной таблицы Excel (см.

контур технических средств воздействия на рисунке 6).

37

Рисунок 6 – Контур технических средств управления состояния пациентом

Это необходимо для того, чтобы синхронизировать фактические значения сахаров с ожидаемыми. Например, делается предположение о том,

что данному приему пищи должен соответствовать резкий скачок на кривой ППГО, однако фактически он отсутствует, т.к. пациент последовал выданной рекомендации и уменьшил количество углеводов во время перекусов.

Сформированная Excel таблица направляется врачу по одному из возможных каналов связи: электронная почта или мессенджер.

Предпочтительным является первый вариант, т.к. помимо электронного дневника приложение рассчитает и вставит в тело письма статистику,

характеризующую состояние пациента за период мониторинга, а также обозначит уровень опасности для здоровья в теме письма. Дубликат письма будет направлен на обезличенный почтовый ящик медицинского центра в качестве резервной копии. Оценив состояние пациента, специалист сформирует и направит назначение, обычно, защищенное электронной цифровой подписью (ЭЦП).

Консультация представляет собой развернутый PDF отчет, в котором доступным для пациента языком, объяснены возможные причины недомогания и предложена альтернативная схема питания и физических упражнений. В некоторых случаях может потребоваться сдать биохимический анализ крови для внесения корректировок в инсулинотерапию. При этом пациент будет записан в электронную очередь на сдачу анализа в ближайшем

38

к нему медицинском центре. Физически человек может находить в другом городе или регионе. Получив соответствующие уточнения, эндокринолог скорректирует рекомендации и повторно направит их пациенту.

Возможна и обратная связь, в зависимости от средства связи,

использованного для отправки электронного дневника. Предпочтительным средством связи является мессенджер с end-to-end шифрованием чата для сохранения медицинской тайны.

Помимо этого, в общей структуре БТС-М присутствуют понятия окружающей среды (ОС) и технических средств управления средой (ТСУС).

Ключевой особенностью использования телемедицинских систем является наблюдение за пациентом в естественных для него условиях, что, с одной стороны, повышает достоверность зарегистрированных значений, но, с другой стороны, делает их слишком шумными и непригодными для анализа. Поэтому необходимо использовать средства нормализации ОС и сложные системы цифровых фильтров. Одним из самых распространенных воздействий ОС можно назвать физический и эмоциональный стресс, связанный с протеканием беременности, ненормированным рабочим графиком, малоподвижным образом жизни, шумами, неоптимальным температурным режимом, и многим другим. Технические средства управления средой столь же разнообразны, как и вызовы современной жизни: психологическая поддержка беременных,

лечебно-профилактическая физкультура, системы климат-контроля и шумоизоляции.

Врачебное заключение (ВЗ), на основании которого пациент ставится на учет и получает возможность проведения удаленного мониторирования,

формируется при первом обращении с жалобами к врачу. Согласно законодательству РФ, посещение должно быть личным. Диагностика преддиабетического состояния часто проводится с использованием перорального теста на толерантность к глюкозе. Для постановки более серьезного диагноза СД или ГСД проверяется содержание гликированного гемоглобина натощак в венозной крови и исследуется наследственность.

39

2.2 Характеристика объекта исследования

Объектом исследования является мобильная система персонализированного мониторинга физического состояния пациентов с сахарным диабетом. Ключевым компонентом приложения является алгоритм прогнозирования реакции постпрандиального гликемического ответа после приема пищи (см. рисунок 7).

Рисунок 7 – Модель разрабатываемого алгоритма

Существует несколько взаимосвязанных метрик оценки постпрандиального гликемического ответа, каждая из которых по-своему описывает процессы метаболизма:

BG60: уровень глюкозы в крови спустя 1 час после начала приема пищи (ммоль/л);

BG120: уровень глюкозы в крови спустя 2 часа после начала приема пищи (ммоль/л);

BGMax: пиковое значение на кривой уровня сахара в крови после приема пищи (ммоль/л);

AUC120: площадь под гликемической кривой спустя 2 часа после начала приема пищи ([ммоль/л] * час);

iAUC120: инкрементальная площадь под гликемической кривой спустя 2 часа после начала приема пищи ([ммоль/л] * час);

Алгоритм планируется разрабатывать на основе известной зависимости постпрандиального гликемического ответа от параметров приема пищи, таких

40