23 сентября 2020

Петербургский онколог изучает большие данные, чтобы улучшить помощь больным в регионах. Он рассказывает, как анализ помогает прогнозировать смертность и что об этом думают медики

Петербургский онколог Юрий Комаров занимается организацией здравоохранения в НМИЦ имени Петрова. Он исследует заболеваемость и смертность в регионах Северо-Запада и помогает повысить качество онкологической помощи. Чтобы лучше анализировать цифры, в начале 2020 года Комаров пошел на курсы по работе с большими данными.

«Бумага» поговорила с Юрием о том, как новые технологии могут помочь онкобольным, почему некоторые медики не доверяют большим данным и как такой анализ используют в других странах.

Как петербургский онкоцентр помогает региональным медучреждениям

— Я работаю в сфере организации здравоохранения. Мы принимаем решения, влияющие в целом на систему оказания онкологической помощи.

Стать организатором здравоохранения не было моим стремлением, так сложилось. С 2014 года я работал в отделе НМИЦ имени Петрова, который сейчас называется отделом организации научно-практических мероприятий. Мы занимались связями с общественностью, развивали международное сотрудничество и, например, делали Петербургский онкологический форум. Параллельно я был практикующим онкологом.

С 2018 года я перешел в отдел, занимающийся организационно-методической работой с регионами. Тогда нашему центру дали новую функцию — реализовать федеральную программу «Развитие национальных медицинских исследовательских центров», то есть организовать методическую поддержку регионов по профилю «Онкология». А так как у меня был опыт проведения крупных мероприятий с применением проектного подхода и первичная специализация по онкологии, то руководить новым направлением предложили мне. После этого времени на клиническую практику у меня не осталось.

Сейчас у нас под курацией 11 субъектов в Северо-Западном Федеральном округе. Здесь стоит понимать, что НМИЦ имени Петрова — это одно из звеньев цепочки комплексного лечения. Наши пациенты продолжают получать лечение в других субъектах. Мы оцениваем состояние онкологической помощи там, разрабатываем мероприятия, направленные на повышение ее качества и доступности, методические рекомендации по внедрению современных методов лечения, диагностики и профилактики.

Юрий Комаров. Фото: форум «Белые ночи»

Например, наша последняя задача — оценка готовности онкологических учреждений к внедрению системы контроля качества медицинской помощи. Сначала мы анализируем, какие учреждения к этому готовы, потом оцениваем их по чек-листам, а со следующего года будем оказывать организационно-методическую поддержку по внедрению.

Или другая задача: выездная оценка онкологической службы. Мы готовим материалы: например, проводим анализ заболеваемости и смертности в динамике за несколько лет, анализ запущенности (то есть какие стадии чаще или реже встречаются), выявляем причины (например, почему увеличилась или уменьшилась смертность).

Далее пытаемся выявить закономерности: например, почему в каком-то субъекте плохо выявляют колоректальный рак. Мы видим, что пациенты вроде как идут на обследование, но выясняется, что в каком-то регионе нет врачей-эндоскопистов. Получается, люди делают обследование либо позже в областном центре, либо совсем его не делают. На основании этих данных мы думаем, как улучшить ситуацию. В данном случае мы даем рекомендации по изменению маршрутизации пациентов. Чтобы они ехали не за 600 километров в другой город этого субъекта, а, например, в ближайший город соседнего региона, где такие специалисты могут быть.

Как в медицине изучают большие данные и как это помогает обеспечить пациентов лекарствами

— Впервые я задумался, что в медицине нужен анализ данных, когда пошел в аспирантуру [по онкологии на базе НИИ онкологии им. Н. Н. Петрова]. Чтобы защитить кандидатскую, нужно собрать материал, разработать план проекта, построить гипотезу. Далее массив данных нужно обработать, выявив закономерности. Мы в аспирантуре делали всё в Excel, анализировали в программных продуктах типа «Статистики», — в общем, на базовом уровне.

Столкнувшись с работой с регионами в 2018-м, я заметил, что данных стало так много, что Excel не может их переварить, и, вероятно, стоит переходить на SQL. К тому же необходимо искать слишком много взаимосвязей, что не сделать в ручном режиме. Когда у вас 11 субъектов, несколько миллионов записей и строк о лечении пациентов, а нужно найти тех, кто, например, получает определенное лечение, — появляется необходимость совершенствовать свои подходы в сфере анализа.

С февраля 2020 года я прохожу курс по анализу данных на Python в «Яндекс.Практикуме». Сначала было тяжело, потому что нужно много программировать, а я этим ни в институте, ни на работе не занимался. Но когда получил базовые навыки и изучил статистику, всё пошло легче. Сейчас дошли до машинного обучения — это новый виток тяжести: [эти знания] подходят к глубокому математическому анализу, гуманитариям нужно полностью переформатировать свое мышление.

В медицинском вузе вообще есть направление на самообучение: нужно получать большой объем данных за короткий промежуток времени. Это помогло в обучении. Думаю, через полгода-год я доберу необходимое количество данных, чтобы проводить расчеты.

Анализ больших данных помогает нам, например, в прогнозе заболеваемости или смертности. Это нужно, чтобы оценить, как правильно организовать потоки пациентов, как планировать закупки. Мы видим, что, судя по заболеваемости и распространенности, каких-то заболеваний в следующем году будет больше, поэтому в субъекте нужно закупать больше лекарств, чтобы всех обеспечить. На основе данных можно посмотреть, например, получает ли пациент в срок свое лечение или правильно ли соблюдают порядок лечения при определенной стадии в субъекте.

В НМИЦ имени Петрова оказывается высокотехнологичная медицинская помощь: в основном хирургическое лечение и лучевая терапия, а также химиотерапия для тех, кто не может получить ее в субъекте. Мы, конечно, анализируем какие-то данные вроде нагрузки на определенное оборудование, но это сложно назвать анализом больших данных. Плюс у нас разная структура пациентов, которую сложно предсказать. А в субъекте, например, это более постоянная величина — и там обоснованнее анализ больших данных.

Вообще, данные собираются из множества источников: это формы государственной статистической отчетности, данные популяционных раковых регистров, которые полноценно ведутся с 1990-х годов, а также данные фондов ОМС, которые предоставляют информацию по применению методов лечения и диагностики. Мы собираем эти данные в базы и в зависимости от потребности забираем то, что нам необходимо для текущей задачи.

Почему некоторые российские медики не доверяют большим данным и как такие технологии используются в других странах

— Некоторые российские медики сопротивляются результатам, которые получены при анализе больших данных. Например, мы проанализировали ситуацию с заболеваемостью и смертностью, выявили, что смертность продолжает нарастать, связали это с лечением и сказали представителям региона: если лечить современными препаратами, смертность будет снижаться. Из некоторых учреждений может поступить обратная реакция с критикой расчетов, что мы неправильно считаем или что они не считают наши данные достоверными.

Когда говоришь учреждению, что у них снижено качество оказания медицинской помощи, это вызывает определенный негатив. Когда мы проводим подобные анализы, то говорим, что не пытаемся их оценивать. Просто констатируем факт, что выявили такие-то показатели. Конечно, если в учреждении нарушение с точки зрения нормативных показателей, мы говорим об этом. Если нет установленных нормами закона показателей, то можем сказать, что у других субъектов какое-то число выше или ниже, — дальше решения принимаете вы.

Те, кто понимает, что наши данные позволят им в будущем улучшить качество оказания помощи или уровень удовлетворенности пациентов, воспринимают положительно любые результаты. Они видят, как эти показатели можно измерить и что нужно предпринимать, чтобы их повысить. А те, кто не понимает, испытывают агрессию и говорят, что медицина не математика, она индивидуальна и тому подобное. С таким подходом тяжело работать.

Распространенность анализа больших данных зависит от конкретной страны. В Америке большую роль играет страховка — там нет маршрутизации, как у нас, а каждая клиника отвечает за свои закупки и то, какие пациенты туда приходят. Соответственно, данные о заболеваемости в США сильно разнятся от штата к штату, и анализ больших данных по всей стране не развит.

В маленьких странах вроде Финляндии, наоборот, хорошо развит и сбор, и анализ. Например, Скандинавский раковый регистр включает всех пациентов, которые получают лечение онкологических заболеваний, и он ведется на достаточно хорошем уровне. По этим данным делается много выводов, которые, соответственно, улучшают оказание помощи.

Какие перспективы есть у анализа больших данных в онкологии

— Сейчас во всех сферах проходит цифровая трансформация, в онкологии в том числе. У нас создается вертикально-интегрированная медицинская информационная система (ВИМИС), которая в себе объединит все медучреждения, оказывающие онкологическую помощь пациентам, а также всех пациентов, независимо от того, где они получают лечение. Там можно будет отследить все показатели: и сроки оказания медпомощи, и ее качество, и проводимые исследования.

Если у нас появится такая большая база данных, на ее основе можно будет применять различные математические методы моделирования и прогнозирования, и это будет большой прорыв. Это, конечно, улучшит качество оказания медицинской помощи и ее планирования, а также повысит ее эффективность для пациентов.

Например, в гематологии анализ больших данных используется для подбора доноров стволовых клеток, для пересадки и трансплантации. И у нас в России есть ряд центров, которые подключены к международной системе, которая по типированию клеток мозга может подобрать максимально приближенного донора.

В онкологии внедрение информационных систем и анализ больших данных может позволить более точечно и эффективно применять лекарственные препараты. Например, если мы говорим, что сейчас есть высокоэффективное лечение при меланоме (оно подбирается на основе молекулярно-генетических маркеров, которые характерны для этого заболевания), то можно и подобрать препарат, который увеличит до 80 % пятилетнюю выживаемость в этой категории пациентов. Но вручную таких пациентов тяжело найти, а анализ больших данных по стране может выделить группы, которым можно максимально эффективно помочь.

Также анализ может помочь снизить затраты на оказание медицинской помощи за счет того, что у нас не будут закупать неэффективные или малоэффективные препараты. Или найти пациентов, которых можно включить в клинические исследования, чтобы они подошли под все критерии.

Важно, чтобы сами медицинские сотрудники знали, что существуют такие методы, что можно применять различные математические формулы и что это может помогать в работе. Это позволит вести диалог с теми же программистами или дата-сайентистами на одном языке. Сейчас некоторые, к сожалению, вообще не в курсе существования таких возможностей.


«Бумага» выпускала интервью с аналитиком Артуром Хачуяном о Big Data, вычислении личности по лайкам в соцсетях и работе с государством. Читайте также разговор с исследователем новых медиа Львом Мановичем о том, что можно узнать из анализа миллионов инстаграмов и твитов. Узнать, кто в Петербурге исследует интерес к биткоинам, флешмоб MeToo и производство нефти с помощью data science, можно в партнерском материале «Бумаги» с «Газпром нефтью».

На сайте и в соцсетях «Бумаги» также можно послушать подкаст «Волосы отрастут» с историями людей, которые столкнулись с онкологическим диагнозом.

«Бумага» благодарит «Яндекс.Практикум» за помощь в подготовке материала.

Если вы нашли опечатку, пожалуйста, сообщите нам. Выделите текст с ошибкой и нажмите появившуюся кнопку.
Подписывайтесь, чтобы ничего не пропустить
Все тексты
Технологии в Петербурге
В Петербурге презентовали беспилотный трамвай. Показываем, как он выглядит 👀
В Петербурге прошел фестиваль «Технокультура 4.0». Видео оттуда выглядят странно: на площадке почти никого нет, танцуют только роботы
Робот Алекс стал героем роликов с газового форума в Петербурге. Он ответил на вопрос о войне машин и людей и рассказал стих про бычка 🤖
В Петербурге запустили сервис для отслеживания движения машин скорой помощи. Рассказываем, зачем он нужен
Петербургский студент создал экзоскелет, с помощью которого можно поднимать тяжелые предметы. Его разработкой заинтересовались в МЧС
К сожалению, мы не поддерживаем Internet Explorer. Читайте наши материалы с помощью других браузеров, например, Chrome или Mozilla Firefox Mozilla Firefox или Chrome.