Рак желудка считается одной из главных причин смертности во всем мире. Возможность выявить рак желудка в значительной степени зависит от проведения эндоскопии и биопсии, это инвазивные процедуры, которые по разным причинам могут быть недоступны для пациента. Таким образом, большое значение имеет профилактика заболевания путем коррекции образа жизни, пищевых привычек или даже предотвращения формирования факторов риска. Целью исследования было создание недорогой, неинвазивной, быстрой и высокоточной диагностической модели с использованием шести алгоритмов машинного обучения (МО) для классификации пациентов с высоким или низким риском развития рака желудка путем анализа индивидуальных факторов образа жизни
В исследовании были задействованные данные 2029 человек из базы больницы Аятоллы Талегани в городе Абадан, Иран. Данные были случайным образом поделены на обучающую и тестовую выборки в соотношении 0,7:0,3. Построению прогностических моделей были обучены шесть методов МО:
- Экстремальное повышение градиента
- Многослойный перцептрон
- Случайный лес
- Метод опорных векторов (Гаусово ядро)
- Метод опорных векторов (Линейное ядро)
- Метод ближайших соседей
В исследовании в качестве наиболее важных факторов риска, влияющих на выживаемость, учитывались такие переменные, как возраст, пол, индекс массы тела, индекс Карновского, стадия опухоли, размер опухоли, локализация опухоли, присутствие лимфоваскулярной инвазии, своевременность и интенсивность лечения, тип лечения, стадия и тяжесть заболевания, потеря массы тела.
Прогностическая модель, основанная на методе экстремального повышения градиента, оказалась самой успешной в прогнозировании выживаемости пациентов с раком желудка: точность 88,37%, специфичность 87,24%, чувствительность 89,72%.
Исследование также выявило 11 ключевых факторов, влияющих на риск развития рака желудка, среди которых инфекция Helicobacter pylori, высокий уровень потребления соли, хронический атрофический гастрит, употребление фруктов, язва желудка или двенадцатиперстной кишки, потеря веса, потребление продуктов с высоким содержанием жиров, уровень образования, курение, стрессовое состояние, вес. При этом наличие Helicobacter pylori примерно в 3 раза чаще других признаков связано с развитием рака желудка.
По итогам исследования была разработана и введена в работу система поддержки принятия клинических решений на базе Windows. Основные цели системы – помощь онкологам в выборе стратегии и прогноз выживаемости пациентов с раком желудка.
Авторы исследования убеждены, что технологии машинного обучения улучшат качество медицинской помощи, снизят риск развития серьезных осложнений и смертельных исходов, связанных с раком желудка. По их мнению, для дальнейшей персонализации лечения пациентов необходимы новые исследования с участием машинного обучения, включающие большее количество алгоритмов, дополнительные переменные, более крупные базы данных и длительный срок наблюдения.