Нейронные сети в медицине. Применение искусственных нейронных сетей для ранней диагностики заболевания сахарным диабетом Оптимизация бизнес-процессов и рекламы

Сегодня мы наблюдаем бум в развитии информационных технологий и их постепенное, а порою и революционное внедрение в нашу жизнь

Цифровизация, робототизация, искусственный интеллект, искусственные нейронные сети… Сколько новых понятий и терминов уже сегодня раздвигают горизонты возможного, заставляя задумываться и разбираться в них, искать их прикладное эффективное и безопасное применение. И все же, какими бы многообещающими не были новые технологии – все они являются продуктами жизнедеятельности человека, его разума, работы мозга и мышления.

Что такое нейрон?

Среднестатистический человеческий мозг – это около 86 млрд нейронов, соединенных многочисленными связями (в среднем несколько тысяч связей на один нейрон, однако это число может сильно колебаться). Нейроны – это специальные клетки, способные распространять электрохимические сигналы. Нейрон имеет разветвленную структуру ввода информации (дендриты), ядро и разветвляющийся выход (аксон). Аксоны клетки соединяются с дендритами других клеток с помощью синапсов. При активации нейрон посылает электрохимический сигнал по своему аксону. Через синапсы этот сигнал достигает других нейронов, которые могут в свою очередь активироваться. Нейрон активируется тогда, когда суммарный уровень сигналов, пришедших в его ядро из дендритов, превысит определенный уровень (порог активации).

Нейронные сети

Искусственные нейронные сети, искусственный интеллект, машинное обучение… Что означают все эти нынче модные направления и термины?

В общем смысле слова, нейронные сети (НС – Neural Networks) – это математические модели, работающие по принципу сетей нервных клеток животного организма. Искусственные НС (ИНС) могут быть реализованы как в программируемые, так и в аппаратные решения. Для простоты восприятия нейрон можно представить, как некую ячейку, у которой имеется множество входных отверстий и одно выходное. Каким образом многочисленные входящие сигналы формируются в выходящий, как раз и определяет алгоритм вычисления. На каждый вход нейрона подаются действующие значения, которые затем распространяются по межнейронным связям (синопсисам). У синапсов есть один параметр – вес, благодаря которому входная информация изменяется при переходе от одного нейрона к другому.

Тенденция времени

В последние несколько лет наблюдается взрыв интереса к ИНС. Исследователи – программисты и разработчики аппаратных моделей – создают все новые эффективные креативные программные и аппаратные воплощения, построенные по принципу организации и функционирования биологических нейронных сетей. Нейронные сети привлекательны с интуитивной точки зрения, ибо они основаны на биологической модели нервных систем. В будущем развитие таких нейробиологических моделей может привести к созданию действительно мыслящих компьютеров. А чтобы создать искусственный интеллект, необходимо построить систему с похожей архитектурой.

Где они применяются

ИНС благодаря способности к обучению, а также тому, что это обусловлено появлением различных способов ускорения их обучения, успешно применяются в самых различных областях нашей жизни: бизнесе, медицине, технике, геологии, физике и пр. ИНС, как исключительно мощный метод моделирования, позволяющий воспроизводить чрезвычайно сложные зависимости, находит все более многочисленные области применения: создание самообучающихся систем производственных процессов, беспилотные транспортные средства, системы распознавания образов, интеллектуальные охранные системы, робототехника, системы мониторинга качества, голосовые интерфейсы взаимодействия, системы аналитики и изобретения во многих других областях, где нужно решать задачи обработки накопленного огромного потока информации – распознавания, прогнозирования, классификации, управления. В настоящее время процесс обучения ИНС стал намного быстрее и проще: стали более мощными возможности технических средств (технологический рост объемов памяти, быстродействия; постоянное накопление баз данных и пр.). Начали активно разрабатываться так называемые «предобученные» нейросети, которые позволяют существенно ускорить процесс внедрения технологии.

Одни плюсы

Впечатляющий успех и интерес к ИНС определяются способностями справляться с такими задачами, как системы распознавания и классификации объектов на изображениях и ландшафтах в исследуемой области, голосовой интерфейс взаимодействия для интернета вещей, видеоаналитика, самообучающиеся системы, оптимизирующие управление материальными потоками или расположением объектов; интеллектуальные; самообучающиеся системы управления производственными процессами и устройствами (в том числе робототехническими), универсальный перевод «на лету» для конференций и персонального использования и пр. И если пока что рано говорить о том, смогут ли когда-то нейросети полностью воспроизвести возможности человеческого мозга, вероятность того, что в ближайшее десятилетие ИНС смогут заменить человека на четверти существующих профессий, все больше становится похожей на правду.

Искусственный интеллект

Что же такое искусственный интеллект? Под искусственным интеллектом (ИИ) разработчики понимают способность машины имитировать умное поведение людей, то есть – умение ориентироваться в меняющемся контексте и принимать с учетом этих изменений оптимальные, позволяющие достичь цели решения. Врачу бывает сложно верно диагностировать заболевание, особенно если у него не слишком много практики или конкретный случай далек от его профессионального опыта. Тут на помощь может прийти ИИ, имеющий доступ к базам с тысячами и миллионами историй болезни (и другой упорядоченной информацией, в том числе свежим статьям, учебникам, специализированной медицинской литературе). С помощью алгоритмов машинного обучения ИИ классифицирует конкретный кейс, быстро просканирует вышедшую за определенный интервал времени научную литературу по нужной теме, изучит имеющиеся в доступе похожие случаи и предложит план лечения. Более того, ИИ сможет обеспечить индивидуализированный подход, приняв во внимание сведения о генетических особенностях пациента, паттернах движения, собранных его носимыми устройствами, предыдущей истории болезней – всем анамнезе жизни. ИИ вероятно (по крайней мере, на текущем этапе развития технологий), не заменит врача, но может стать и уже становится полезным инструментом, помощником в деле диагностики и лечения.

Зачем он нужен в медицине

Медицина, ориентировавшаяся ранее в основном на лечение острых заболеваний, теперь сможет больше внимания уделять недугам хроническим, многие из которых не так давно и болезнями не считались. Уже сегодня быстро растут объемы медицинских данных, приходит сознание, что от скорости и качества анализа зависит здоровье и качество жизни пациента. Врачи часто сталкиваются с необходимостью лечить ожирение, депрессии, болезни пожилого возраста. Диабет, сердечная недостаточность, аутоиммунные расстройства все чаще диагностируются вне фазы обострения, на самых ранних стадиях, причем речь идет не только о поддерживающей терапии, но и о возможности полностью излечить, исправить эти системные сбои организма. Развивается превентивная медицина, позволяющая распознать предрасположенность к определенным типам заболеваний еще до их проявления, и необходимой актуальности своевременно принять меры. И все это – работа для ИИ.

Прогноз для стоматологии

Исследователи, занимающиеся ИНС, делают прогнозы, что уже в ближайшее время быстро будет развиваться применение нейронных сетей и в стоматологии. Это направление позволит проводить более быстрый анализ большого количества необходимой профессиональной прицельно-ориентированной информации, а главное – сможет направлять и давать подсказки врачам в решении сложных клинических задач.

Материал подготовила по данным
интернет-источников Галина Масис

Правильная ссылка на статью:

Мустафаев А.Г. — Применение искусственных нейронных сетей для ранней диагностики заболевания сахарным диабетом // Кибернетика и программирование. - 2016. - № 2. - С. 1 - 7. DOI: 10.7256/2306-4196.2016.2.17904 URL: https://nbpublish.com/library_read_article.php?id=17904

Применение искусственных нейронных сетей для ранней диагностики заболевания сахарным диабетом

Другие публикации этого автора

Аннотация.

Сахарный диабет - хроническое заболевание, в патогенезе которого лежит недостаток инсулина в организме человека, вызывающий нарушение обмена веществ и патологические изменения в различных органах и тканях, зачастую приводящие к высокому риску инфаркта и почечной недостаточности. Сделана попытка разработать систему ранней диагностики сахарного диабета обследуемого пациента использующая аппарат искусственных нейронных сетей. Разработана модель нейронной сети на основе многослойного персептрона обученная на основе алгоритма обратного распространения ошибки. Для проектирования нейронной сети был использован пакет Neural Network Toolbox из MATLAB 8.6 (R2015b) являющийся мощным и гибким инструментом работы с нейронными сетями. Результаты обучения и проверки работоспособности спроектированной нейронной сети показывают её успешное применение для решения поставленных задач и способность находить сложные закономерности и взаимосвязи между различными характеристиками объекта. Чувствительность разработанной нейросетевой модели составила 89.5%, специфичность 87.2%. После того как сеть обучена, она становится надежным и недорогим диагностическим инструментом.


Ключевые слова: сахарный диабет, искусственная нейронная сеть, компьютерная диагностика, специфичность, чувствительность, классификация данных, многослойный персептрон, обратное распространение ошибки, сеть прямого распространения, обучение с учителем

10.7256/2306-4196.2016.2.17904


Дата направления в редакцию:

11-02-2016

Дата рецензирования:

12-02-2016

Дата публикации:

03-03-2016

Abstract.

Diabetes is a chronic disease, in the pathogenesis of which is a lack of insulin in the human body causing a metabolic disorder and pathological changes in various organs and tissues, often leading to a high risk of heart attack and kidney failure. The author makes an attempt to create a system for early diagnosis of diabetes patients using the device of artificial neural networks. The article presents a model of neural network based on multilayer perceptron trained by back-propagation algorithm. For the design of the neural network the author used Neural Network Toolbox из MATLAB 8.6 (R2015b) which is a powerful and flexible tool for working with neural networks. The results of training and performance tests of the neural network designed show its successful application for the task and the ability to find patterns and complex relationships between the different characteristics of the object. The sensitivity of the developed neural network model is 89.5%, specificity of 87.2%. Once the network is trained it becomes a reliable and inexpensive diagnostic tool.

Keywords:

Diabetes, artificial neural network, computer diagnostics, specificity, sensitivity, data classification, multilayer perceptron, back propagation of error, direct distribution network, training with teacher

На сегодняшний день в мире диабет считается одним из наиболее распространенных заболеваний. Согласно данных Всемирной организации здравоохранения, около 350 млн. человек всех возрастов и рас страдают разными формами диабета . Сахарный диабет не является следствием патологии какого-то конкретного органа, он возникает из-за общего сбоя в обмене веществ. Его признаки появляются со стороны органов и систем органов, наиболее чувствительных к этому процессу. Клинические признаки диабета зависят от типа заболевания, пола, возраста, уровня инсулина, артериального давления и других факторов. В работе рассматривается система ранней диагностики сахарного диабета обследуемого пациента использующая аппарат искусственных нейронных сетей.

Нейросетевые технологии призваны решать трудноформализуемые задачи, к которым, в частности, сводятся многие проблемы медицины. Это связано с тем, что исследователю часто предоставлено большое количество разнородного фактического материала, для которого еще не создана математическая модель. Хороший результаты показали модели искусственных нейронных сетей для диагностики психических расстройств , болезни Паркинсона и Хантингтона . Модели многослойных персептронов применяются для прогнозирования риска возникновения остеопороза . Логический вывод и обобщенная регрессия использованы для диагностирования гепатита B .

Одним из наиболее удобных инструментов для решения подобных задач являются искусственные нейронные сети - мощный и одновременно гибкий метод имитации процессов и явлений. Современные искусственные нейронные сети представляют собой программно-аппаратные средства создания специализированных моделей и устройств и позволяют решать широкий круг задач диагностики на основе применения алгоритмов теории распознавания образов. Отличительное свойство нейронных сетей состоит в их способности обучаться на основе экспериментальных данных предметной области. Применительно к медицинской тематике экспериментальные данные представляются в виде множества исходных признаков или параметров объекта и поставленного на основе них диагноза. Обучение нейронной сети представляет собой интерактивный процесс, в ходе которого нейронная сеть находит скрытые нелинейные зависимости между исходными параметрами и конечным диагнозом, а также оптимальную комбинацию весовых коэффициентов нейронов, соединяющих соседние слои, при которой погрешность определения класса образа стремится к минимуму . К достоинствам нейронных сетей следует отнести их относительную простоту, нелинейность, работу с нечеткой информацией, не критичность к исходным данным, способность обучаться на материале конкретных примеров. В процессе обучения на вход нейронной сети подается последовательность исходных параметров наряду с диагнозами, которые эти параметры характеризуют.

Для обучения нейронной сети необходимо иметь достаточное количество примеров для настройки адаптивной системы с заданной степенью достоверности. Если примеры относятся к разным диагностическим группам, то обученная таким образом искусственная нейронная сеть позволяет в последующем диагностировать и дифференцировать любой новый случай, представленный набором показателей, аналогичных тем на которых проводилось обучение нейронной сети. Несомненным достоинством нейронной модели является то, что при ее создании не нужно представлять весь набор сложных закономерностей описания диагностируемого феномена.

Вместе с тем, с применением нейронных сетей в практических задачах связан ряд трудностей. Одной из главных проблем применения нейросетевых технологий является заранее неизвестная степень сложности проектируемой нейронной сети, которой будет достаточно для достоверной постановки диагноза. Эта сложность может оказаться недопустимо высокой, что потребует усложнения архитектуры сетей. Простейшие однослойные нейронные сети способны решать только линейно разделяемые задачи . Это ограничение преодолимо при использовании многослойных нейронных сетей.

В данной работе использовалась модель многослойного персептрона (нейронная сеть прямого распространения) обученная на основе алгоритма обратного распространения ошибки. В качестве активационной функции в работе, использовалась логистическая активационная функция (рис. 1):

`F=1/(1+exp(-alphaY)`

где ` alpha` - параметр наклона логистической функции.

Рис. 1. Логистическая функция активации

Многослойный персептрон обладает высокой степенью связности, реализуемой посредством синаптических соединений. Изменение уровня связности сети требует изменения множества синаптических соединений или их весовых коэффициентов. Комбинация всех этих свойств наряду со способностью к обучению на собственном опыте обеспечивает вычислительную мощность многослойного персептрона.

Искусственная нейронная сеть содержала входной слой, один скрытый слой и выходной слой. Входной слой, нейронной сети, имеет 12 нейронов, выходной слой имеет два нейрона (рис. 2).

Рис. 2. Архитектура нейронной сети

Таблица 1. Параметры входного слоя нейронной сети

Параметр

Тип данных, единица измерения

Число (лет)

Физические нагрузки

Логический (да/ нет)

Логический (М / Ж)

Число беременностей

Наличие диабета у близких родственников

Логический (да/ нет)

Индекс массы тела

Число (кг/м 2)

Толщина кожи

Число (мм)

Уровень холестерина

Число, мг/дл

Диастолическое давление

Число, мм. рт. ст.

2-х часовой сывороточный инсулин

Число, мкЕд/мл

Наличие стресса, депрессии

Логический (да/ нет)

Уровень глюкозы в плазме крови

Число, мг/дл

Для проектирования нейронной сети был использован пакет Neural Network Toolbox из MATLAB 8.6 (R2015b). Пакет представляет набор функций и структур данных описывающих функции активации, алгоритмы обучения, установку синаптических весов и др.

Рис. 3. Схема работы алгоритма обратного распространения ошибки

Алгоритм обратного распространения ошибки (рис. 3) предполагает вычисление ошибки, как выходного слоя, так и каждого нейрона обучаемой сети, а также коррекцию весов нейронов в соответствии с их текущими значениями. На первом шаге данного алгоритма веса всех межнейронных связей инициализируются небольшими случайными значениями (от 0 до 1). После инициализации весов в процессе обучения нейронной сети выполняются следующие шаги:

  • прямое распространение сигнала;
  • вычисление ошибки нейронов последнего слоя;
  • обратное распространение ошибки.

Прямое распространение сигнала производится послойно, начиная со входного слоя, при этом рассчитывается сумма входных сигналов для каждого нейрона и при помощи функции активации генерируется отклик нейрона, который распространяется в следующий слой с учетом веса межнейронной связи согласно. В результате выполнения данного этапа мы получаем вектор выходных значений нейронной сети. Следующий этап обучения - вычисление ошибки нейронной сети как разницы между ожидаемым и действительным выходными значениями.

Полученные значения ошибок распространяются от последнего, выходного слоя нейронной сети, к первому. При этом вычисляются величины коррекции весов нейронов в зависимости от текущего значения веса связи, скорости обучения и ошибки, внесенной данным нейроном. После завершения данного этапа шаги описанного алгоритма повторяются до тех пор, пока ошибка выходного слоя не достигнет требуемого значения.

База обучающих и тестовых данных содержала 486 записей о пациентах, 243 из которых имели клинически установленный диагноз «сахарный диабет», другая часть пациентов была здорова.

Нейронная сеть была обучена на 240 выборках и протестирована на 146 выборках. Чувствительность разработанной нейросетевой модели составила 89.5%, специфичность 87.2%. Некоторая сложность теоретического обеспечения использования, трудоемкость и временные затраты по моделированию и обучению нейронных сетей компенсируется простотой их применения конечным пользователем. Если задача создания конкретной нейронной сети адекватной поставленной задаче и ее оптимальное обучение доступна лишь специалисту, то ее практическое применение конечным пользователем требует только навыков владения компьютером. Сложность интерпретации системы знаний обученной нейросетевой модели, является ненужной пользователю нейронной сети, так как для большинства конечных пользователей важно не понимание сущности работы нейронной сети, а ее результативность, информативность, безошибочность и быстродействие.

Библиография

.

фактов о диабете. [Электронный ресурс] Официальный сайт Всемирной организации здравоохранения http://www.who.int/features/factfiles/diabetes/ru/ (дата обращения: 13.01.2016)

.

Беребин М.A., Пашков С.В. Опыт применения искусственных нейронных сетей для целей дифференциальной диагностики и прогноза нарушений психической адаптации. Вестник Южно-Уральского государственного университета, 2006, №14, с.41-45.

.

Gil D., Johnsson M. Diagnosing Parkinson by using artificial neural networks and support vector machines. Global Journal of Computer Science and Technology, 2009, №9(4). pp.63-71.

.

Singh M., Singh M., Singh P. Artificial Neural Network based classification of Neuro-Degenerative diseases using Gait features. International Journal of Information Technology and Knowledge Management, 2013, Vol. 7, №1, pp. 27-30.

.

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_1.jpg" alt=">Нейронные сети в медицине StatSoft Russia">

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_2.jpg" alt=">Основные идеи нейросетевых методов анализа Простота и однородность отдельных элементов - «нейронов» Все основные"> Основные идеи нейросетевых методов анализа Простота и однородность отдельных элементов - «нейронов» Все основные свойства сети определяются структурой связей Избыточность системы гарантирует ее надежность как целого Связи формируются по неявным правилам в процессе «обучения»

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_3.jpg" alt=">Примеры искусственных нейронных сетей">

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_4.jpg" alt=">Особенности нейросетевого подхода к анализу данных Предлагает стандартный способ решения многих нестандартных задач. Явное"> Особенности нейросетевого подхода к анализу данных Предлагает стандартный способ решения многих нестандартных задач. Явное описание модели заменяется созданием «образовательной среды». Приводит к успеху там, где отказывают традиционные методы и трудно создать явный алгоритм.

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_5.jpg" alt=">Для практического здравоохранения особый интерес представляют экспертные системы для диагностики заболеваний">

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_6.jpg" alt=">Примеры применения нейронных сетей в медицине Выявление атеросклеротических бляшек с помощью анализа флюоресцентных спектров."> Примеры применения нейронных сетей в медицине Выявление атеросклеротических бляшек с помощью анализа флюоресцентных спектров. Диагностика заболеваний периферических сосудов. Диагностика инфаркта миокарда. Диагностика клапанных шумов сердца с помощью анализа акустических сигналов. Распознавание психических симптомов.

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_7.jpg" alt=">Экспертная система для лечения артериальной гипертонии (Италия) Модуль 1 Модуль 2 Модуль 3 Почасовые"> Экспертная система для лечения артериальной гипертонии (Италия) Модуль 1 Модуль 2 Модуль 3 Почасовые измерения давления Возраст и пол Характеристики состояния Характеристики лекарственных препаратов Структура почасового приема препаратов Другие клинические данные

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_8.jpg" alt=">Определение накопленной дозы радиоактивного облучения (Красноярская мед. академия) Классификация на 4 группы по"> Определение накопленной дозы радиоактивного облучения (Красноярская мед. академия) Классификация на 4 группы по величине накопленной дозы облучения 35 входных параметров Естественная Слабая Средняя Сильная Сеть обучалась на данных о пациентах, работающих в атомной промышленности. Со 100% правильностью такая сеть классифицирует состояние людей, в том числе и тех, кто не работает в данной отрасли.

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_9.jpg" alt=">Этапы нейросетевого анализа Исследование взаимосвязи переменных и понижение размерности Построение и обучение сетей"> Этапы нейросетевого анализа Исследование взаимосвязи переменных и понижение размерности Построение и обучение сетей разных типов Сравнение качества сетей и их статистических характеристик

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_10.jpg" alt=">Понижение размерности: отбор входных признаков Штраф за элемент, число популяций и поколений битовых"> Понижение размерности: отбор входных признаков Штраф за элемент, число популяций и поколений битовых строк Генетический алгоритм, пошаговое включение и исключение признаков

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_11.jpg" alt=">Понижение размерности: автоассоциативные сети Новые входные переменные для нейросетевой модели">

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_12.jpg" alt=">Задача классификации состояния больных с ишемической болезнью">

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_13.jpg" alt=">Нейронная сеть для диагностики развития ишемической болезни По набору показателей (48 переменных), "> Нейронная сеть для диагностики развития ишемической болезни По набору показателей (48 переменных), как номинальных (например, «слабая-умеренная-сильная боль»), так и непрерывных (например, артериальное давление или возраст), классифицируется состояние пациентов с ишемической болезнью сердца. Номинальные переменные Непрерывные переменные

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_14.jpg" alt=">Результаты классификации и анализ чувствительности Все наблюдения классифицированы правильно Анализ чувствительности позволяет утверждать,"> Результаты классификации и анализ чувствительности Все наблюдения классифицированы правильно Анализ чувствительности позволяет утверждать, что одним из важнейших факторов риска является привычка к курению.

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_15.jpg" alt=">Задача диагностики онкологического заболевания">

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_16.jpg" alt=">Нейронные сети для диагностики онкологического заболевания Сеть на радиальных базисных функциях Многослойный персептрон">

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_17.jpg" alt=">Результаты классификации Многослойный персептрон: 100% наблюдений классифицировано правильно Радиальные базисные функции: 95% наблюдений классифицировано"> Результаты классификации Многослойный персептрон: 100% наблюдений классифицировано правильно Радиальные базисные функции: 95% наблюдений классифицировано правильно

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_18.jpg" alt=">Настройка сети">

Src="https://present5.com/presentacii-2/20171208%5C21538-neuronet.ppt%5C21538-neuronet_19.jpg" alt=">Библиотеки функций пакета STATISTICA Neural Networks для построения, обучения и работы нейронных сетей"> Библиотеки функций пакета STATISTICA Neural Networks для построения, обучения и работы нейронных сетей позволяют эффективно встраивать нейросетевые модули в разрабатываемые экспертные системы для прогнозирования и диагностики заболеваний

17.04.1997 Александр Ежов, Владимир Чечеткин

Острая боль в груди. Скорая помощь доставляет больного в приемный покой, где дежурный врач должен поставить диагноз и определить, действительно ли это инфаркт миокарда. Опыт показывает, что доля пациентов, перенесших инфаркт среди поступивших с аналогичными симптомами, невеликa. Точных методов диагностики, тем не менее, до сих пор нет. Электрокардиограмма иногда не содержит явных признаков недуга. А сколько всего параметров состояния больного могут так или иначе помочь поcтавить в данном случае правильный диагноз? Более сорока. Может ли врач в приемном покое быстро проанализировать все эти показатели вместе с взаимосвязями, чтобы принять решение о направлении больного в кардиологическое отделение? В какой-то мере эту задачу помогают решать нейросетевые технологии. Нейронные сети для задач диагностики Конкретные системы Возможности применения нейросетей Борьба с раком Нейросистемы, генетика и молекулы Нейросети шагают по планете Вместо заключения Острая боль в груди. Скорая помощь доставляет

Острая боль в груди. Скорая помощь доставляет больного в приемный покой, где дежурный врач должен поставить диагноз и определить, действительно ли это инфаркт миокарда. Опыт показывает, что доля пациентов, перенесших инфаркт среди поступивших с аналогичными симптомами, невеликa. Точных методов диагностики, тем не менее, до сих пор нет. Электрокардиограмма иногда не содержит явных признаков недуга. А сколько всего параметров состояния больного могут так или иначе помочь поcтавить в данном случае правильный диагноз? Более сорока. Может ли врач в приемном покое быстро проанализировать все эти показатели вместе с взаимосвязями, чтобы принять решение о направлении больного в кардиологическое отделение? В какой-то мере эту задачу помогают решать нейросетевые технологии.

Статистика такова: врач правильно диагностирует инфаркт миокарда у 88% больных и ошибочно ставит этот диагноз в 29% случаев. Ложных тревог (гипердиагностики) чересчур много. История применения различных методов обработки данных для повышения качества диагностики насчитывает десятилетия, однако лучший из них помог сократить число случаев гипердиагностики лишь на 3%.

В 1990 году Вильям Бакст из Калифорнийского университета в Сан-Диего использовал нейронную сеть - многослойный персептрон - для распознавания инфаркта миокарда у пациентов, поступающих в приемный покой с острой болью в груди. Его целью было создание инструмента, способного помочь врачам, которые не в силах справиться с потоком данных, характеризующих состояние поступившего больного. Другой целью может быть совершенствование диагностики. Свою задачу исследователь усложнил, поскольку анализировал данные только тех пациентов, кого уже направили в кардиологическое отделение. Бакст использовал лишь 20 параметров, среди которых были возраст, пол, локализация боли, реакция на нитроглицерин, тошнота и рвота, потение, обмороки, частота дыхания, учащенность сердцебиения, предыдущие инфаркты, диабет, гипертония, вздутие шейной вены, ряд особенностей ЭКГ и наличие значительных ишемических изменений.

Сеть продемонстрировала точность 92% при обнаружении инфаркта миокарда и дала только 4% случаев сигналов ложной тревоги, ошибочно подтверждая направление пациентов без инфаркта в кардиологическое отделение. Итак, налицо факт успешного применения искусственных нейронных сетей в диагностике заболевания. Теперь необходимо пояснить, в каких параметрах оценивается качество диагноза в общем случае. Предположим, что из десяти человек, у которых инфаркт действительно есть, диагностический метод позволяет обнаружить заболевание у восьми. Тогда чувствительность метода составит 80%. Если же мы возьмем десять человек, у которых инфаркта нет, а метод диагностики заподозрит его у трех человек, то доля ложных тревог составит 30%, при этом дополнительная к нему характеристика - специфичность метода - будет равна 70%.

Идеальный метод диагностики должен иметь стопроцентные чувствительность и специфичность - во-первых, не пропускать ни одного действительно больного человека и, во-вторых, не пугать здоровых людей. Чтобы застраховаться, можно и нужно стараться прежде всего обеспечить стопроцентную чувствительность метода - нельзя пропускать заболевание. Но в это оборачивается, как правило, низкой специфичностью метода - у многих людей врачи подозревают заболевания, которыми на самом деле пациенты не страдают.

Нейронные сети для задач диагностики

Нейронные сети представляют собой нелинейные системы, позволяющие гораздо лучше классифицировать данные, чем обычно используемые линейные методы. В приложении к медицинской диагностике они дают возможность значительно повысить специфичность метода, не снижая его чувствительности.

Вспомним, что нейронная сеть, диагностирующая инфаркт, работала с большим набором параметров, влияние которых на постановку диагноза человеку невозможно оценить. Тем не менее нейросети оказались способными принимать решения, основываясь на выявляемых ими скрытых закономерностях в многомерных данных. Отличительное свойство нейросетей состоит в том, что они не программируются - не используют никаких правил вывода для постановки диагноза, а обучаются делать это на примерах. В этом смысле нейросети совсем не похожи на экспертные системы, разработка которых в 70-е годы происходила после временной "победы" Искусственного Интеллекта над тем подходом к моделированию памяти, распознавания образов и обобщения, который основывался на изучении нейронной организации мозга.

Одной из наиболее известных из разработанных экспертных систем, действие которых основывалось на знаниях, извлеченных у экспертов, и на реализации процедур вывода, была система MYCIN. Данную систему разработали в Стэнфорде в начале 70-х годов для диагностики септического шока. Половина больных умирала от него в течение суток, а врачи могли обнаруживать сепсис лишь в 50% случаев. MYCIN, казалось, была подлинным триумфом технологии экспертных систем - ведь она позволяла обнаружить сепсис в 100% случаев. Однако после более внимательного знакомства с этой экспертной системой врачи значительно усовершенствовали традиционные методы диагностики, и MYCIN потерял свое значение, превратившись в учебную систему. Экспертные системы "пошли" только в кардиологии - для анализа электрокардиограмм. Сложные правила, которые составляют главное содержание книг по клиническому анализу ЭКГ, использовались соответствующими системами для выдачи диагностического заключения.

Диагностика является частным случаем классификации событий, причем наибольшую ценность представляет классификация тех событий, которые отсутствуют в обучающем нейросеть наборе. Здесь проявляется преимущество нейросетевых технологий - они способны осуществлять такую классификацию, обобщая прежний опыт и применяя его в новых случаях.

Конкретные системы

Примером программы диагностики служит пакет кардиодиагностики, разработанный фирмой RES Informatica совместно с Центром кардиологических исследований в Милане. Программа позволяет осуществлять неинвазивную кардиодиагностику на основе распознавания спектров тахограмм. Тахограмма представляет собой гистограмму интервалов между последовательными сердцебиениями, и ее спектр отражает баланс активностей симпатической и парасимпатической нервной системы человека, специфично изменяющейся при различных заболеваниях.

Так или иначе, уже сейчас можно констатировать, что нейронные сети превращаются в инструмент кардиодиагностики - в Англии, например, они используются в четырех госпиталях для предупреждения инфаркта миокарда.

В медицине находит применение и другая особенность нейросетей - их способность предсказывать временные последовательности. Уже отмечалось, что экспертные системы преуспели в анализе ЭКГ. Нейросети здесь тоже приносят пользу. Ки Чженху, Ю Хену и Виллис Томпкинс из университета штата Висконсин разработали нейросетевую систему фильтрации электрокардиограмм, позволяющую подавлять нелинейный и нестационарный шум значительно лучше, чем ранее использовавшиеся методы. Дело в том, что нейросеть хорошо предсказывала шум по его значениям в предыдущие моменты времени. А то, что нейросети очень эффективны для предсказания временных последовательностей (таких, например, как курс валют или котировки акций), убедительно продемонстрировали результаты соревнования предсказательных программ, проводимых университетом в Санта Фе - нейросети заняли первое место и доминировали среди лучших методов.

Возможности применения нейросетей

ЭКГ - это частное, хотя и исключительно важное приложение. Однако сегодня существует и много других примеров использования нейросетей для медицинских прогнозов. Известно, что длинные очереди в кардиохирургические отделения (от недель до месяцев) вызваны нехваткой реанимационных палат. Увеличить их число не удается из-за высокой стоимости реанимационной помощи (70% средств американцы тратят в последние 2 недели жизни именно в этом отделении).

Выход только в более эффективном использовании имеющихся средств. Предположим, что состояние прооперированных в некоторый день больных настолько тяжелое, что им необходимо их длительное пребывание в реанимационной палате (более двух суток). Все это время хирурги будут простаивать, поскольку вновь прооперированных больных некуда класть. Тяжелых больных разумнее оперировать перед выходными или праздниками - операционные все равно закрыты в эти дни, хирурги будут отдыхать, а больные восстанавливаться в реанимации. А вот в начале рабочей недели лучше прооперировать тех пациентов, которым нужно будет находиться в реанимационной палате только один-два дня. Тогда койки в реанимации будут освобождаться быстрее и принимать новых, прооперированных во вторник и среду больных.

Вопрос в том, как угадать, кому придется надолго задержаться в блоке интенсивной терапии после операции, а кому - нет. Джек Ту и Майкл Гуэрир из госпиталя Святого Михаила университета в Торонто использовали нейронные сети для такого предсказания. В качестве исходных данных они взяли только те сведения о пациенте, которые известны в предоперационный период. Заметим, что в предшествующих работах, не использующих нейронные сети, в качестве факторов повышенного риска пребывания в реанимации применялись также важные послеоперационные сведения - различные осложнения, возникшие в ходе хирургического вмешательства.

Ту и Гуэрир обучили двухслойный персептрон разделять больных на три группы риска, учитывая их возраст, пол, функциональное состояние левого желудочка, степень сложности предстоящей операции и наличие сопутствующих заболеваний. Из тех пациентов, которых сеть отнесла к группе малого риска задержки в реанимации, только 16,3% действительно провели в ней более двух дней. В то же время свыше 60% из тех, кого сеть отнесла в группу повышенного риска, оправдали неблагоприятный прогноз.

Борьба с раком

Мы уделяли особое внимание сердечно-сосудистым заболеваниям, поскольку именно они удерживают печальное лидерство в списке причин смертности. На втором месте находятся онкологические заболевания. Одно из главных направлений, в котором сейчас идут работы по использованию нейронных сетей, - диагностика рака молочной железы. Этот недуг - причина смерти каждой девятой женщины.

Обнаружение опухоли осуществляется в ходе первичного рентгенографического анализа молочной железы (маммографии) и последующего анализа кусочка ткани новообразования (биопсии). Несмотря на существование общих правил дифференцирования доброкачественных и злокачественных новообразований, по данным маммографии, только от 10 до 20% результатов последующей хирургической биопсии действительно подтверждают наличие рака молочной железы. Опять мы имеем дело со случаем крайне низкой специфичности метода.

Исследователи из университета Дьюка обучили нейронную сеть распознавать маммограммы злокачественной ткани на основе восьми особенностей, с которыми обычно имеют дело радиологи. Оказалось, что сеть способна решать поставленную задачу с чувствительностью около 100% и специфичностью 59% (сравните с 10-20% у радиологов). Сколько женщин с доброкачественными опухолями можно не подвергать стрессу, связанному с проведением биопсии, если использовать эту нейронную сеть! В клинике Майо (Миннесота) нейросеть анализировала результаты ультразвукового исследования молочной железы и обеспечила специфичность 40%, в то время как для тех же женщин специфичность заключения радиологов оказалась нулевой. Не правда ли, успех использования нейросетевых технологий выглядит совсем не случайным?

После лечения рака молочной железы возможны рецидивы возникновения опухоли. Нейросети уже помогают эффективно их предсказывать. Подобные исследования проводятся на медицинском факультете Техасского университета. Обученные сети показали свои способности выявлять и учитывать очень сложные связи прогностических переменных, в частности, их тройные связи для улучшения предсказательной способности.

Разнообразны возможности применения нейросетей в медицине, и разнообразна их архитектура. На основе прогноза отдаленных результатов лечения заболевания тем или иным методом можно предпочесть один из них. Значительного результата в прогнозе лечения рака яичника (болезнь каждой семидесятой женщины) добился известный голландский специалист Герберт Каппен из университета в Нимегене (он использует в своей работе не многослойные персептроны, а так называемые Машины Больцмана - нейросети для оценки вероятностей).

А вот пример другого онкологического заболевания. Исследователи из медицинской школы в Кагаве (Япония) обучили нейросеть, которая практически безошибочно прогнозировала по предоперационным данным результаты резекции печени у больных печеночно-клеточной карциномой.

В Троицком институте инновационных и термоядерных исследований (ТРИНИТИ) в рамках реализуемого Министерством науки проекта создания нейросетевых консультационных систем была разработана нейросетевая программа, которая выбирает метод лечения базальноклеточного рака кожи (базалиомы) на основе долгосрочного прогноза развития рецидива. Число заболеваний базалиомой - онкологическим недугом белокожих людей с тонкой кожей - составляет треть всех онкологических заболеваний.

Диагностика одной из форм меланомы - опухоли, которую иногда непросто отличить от пигментной формы базалиомы, была реализована с помощью нейросетевого симулятора Multineuron, разработанного в ВЦ СОАН в Красноярске под руководством А.Н.Горбаня.

Нейросети можно использовать и для прогноза действия различных разрабатываемых средств лечения. Они уже успешно применяются в химии для прогноза свойств соединений на основе их молекулярной структуры. Исследователи из Национального института рака в США использовали нейросети для предсказания механизма действия препаратов, применяемых при химиотерапии злокачественных опухолей. Заметим, что существуют миллионы различных молекул, которые необходимо исследовать на предмет их антираковой активности. Специалисты Института рака разбили известные онкологические препараты на шесть групп в соответствии с механизмом их действия на раковые клетки и обучили многослойные сети классифицировать новые вещества и распознавать их действие. В качестве исходных данных использовались результаты экспериментов по подавлению роста клеток из различных опухолей. Нейросетевая классификация позволяет определить, какие из сотен ежедневно апробируемых молекул стоит изучать далее в весьма дорогих экспериментах in vitro и in vivo. Для решения аналогичной задачи использовались и сети Кохонена. Эти обучаемые без учителя самоорганизующиеся нейросети разбивали вещества на заранее неизвестное число кластеров и поэтому дали исследователям возможность идентифицировать вещества, обладающие новыми цитотоксическими механизмами воздействия.

Нейросистемы, генетика и молекулы

Диагностика и лечение онкологических заболеваний, а также разработка новых медикаментозных средств несомненно представляют собой важнейшую область применения нейросетевых технологий. Однако в последнее время среди исследователей и врачей растет осознание того факта, что будущие успехи должны быть тесно связаны с изучением молекулярных и генетических причин развития заболеваний.

Не случайно в апреле 1997 года эксперты Национального института здоровья (США) выступили с рекомендациями по усилению исследований, связанных с выявлением причин, вызывающих рак, и разработок, направленных на предупреждение болезней. Нейросети уже довольно давно активно применяются в анализе геномных последовательностей ДНК, в частности для распознавания промоторов - участков, предшествующих генам и связываемых с белком РНК-полимераза, который инициирует транскрипцию. Их используют для дифференциации кодирующих и некодирующих участков ДНК (экзонов и интронов) и предсказания структуры белков.

В 1996 году было сделано сенсационное открытие, связавшее фундаментальные исследования в молекулярной генетике с проблемой патогенеза и лечения самого распространенного онкологического заболевания - базальноклеточного рака кожи. Исследователи обнаружили в девятой хромосоме человека ген (PTC), мутации в котором, в отличие от гена p53, вызваны воздействием ультрафиолета и являются причиной развития опухоли. Ключом к открытию стало изучение так называемого заплаточного гена, изменения в котором стимулировали дефекты развития плодовой мушки и тот факт, что у детей, также страдающих дефектами развития костной ткани (базальный невусный синдром), часто имеются множественные базалиомы.

Теперь генетики и врачи преисполнены надежд найти медикаментозное средство лечения базалиомы или использовать методы генной хирургии, и заменить ими такие нещадящие методы лечения, как обычная лазерная, рентгеновская и криохирургия. Могут ли нейронные сети оказаться полезными для этих исследований? В частности, нельзя ли с их помощью оценить возможное влияние определенной мутации на изменение свойств соответствующих белков или оценить ее прогностическое значение, скажем, для развития рецидива рака молочной железы?

Если бы это можно было сделать, то нейросети значительно уменьшили бы область поиска для молекулярных биологов, часто "на ощупь" проводящих очень дорогостоящие эксперименты по оценке роли мутаций в молекуле ДНК. Напомним, что к развитию злокачественных опухолей приводит неконтролируемый рост и деление клеток. Геном человека, в котором записана информация о всех производимых в организме белках, насчитывает около трех миллиардов нуклеотидов. Но только 2-3% из них действительно кодируют белки - остальные нужны самой ДНК для поддержания правильной структуры, репликации и прочего.

В геномных последовательностях ДНК можно приближенно выделить три составляющие: в первой содержатся многочисленные копии одинаковых фрагментов (сателлитная ДНК); во второй находятся умеренно повторяющиеся последовательности, рассеянные по геному; а в третьей _уникальная ДНК. В сателлитной ДНК различные копии представлены неодинаково - их численность варьируется от сотен до миллионов. Поэтому они обычно еще подразделяются на мини- и микросателлитов.

Замечательно, что распределение микросателлитов по геному столь специфично, что может использоваться в качестве аналога отпечатков пальцев для человека. Полагают также, что это распределение может быть использовано и для диагностики различных заболеваний.

В скрытом виде повторы нуклеотидных последовательностей играют важную роль и в уникальных последовательностях ДНК. Согласно гипотезе Фрэнсиса Крика, эволюция ДНК начинается от квазипериодических структур, и если мы сможем найти скрытые повторы, то узнаем, где произошли мутации, определившие эволюцию, а значит, найдем и древнейшие, и важнейшие участки, мутации в которых наиболее опасны. Распределение скрытых повторов также тесно связано со структурой и функцией белков, кодируемых соответствующей последовательностью.

В ТРИНИТИ была разработана система, в которой для поиска скрытых повторов и оценки роли мутаций в последовательностях ДНК используются модификации нейросетей Хопфилда. Есть надежда, что этот подход можно будет использовать для обобщенного спектрального анализа последовательностей данных весьма общего вида, например, для анализа электрокардиограмм.

Нейросети шагают по планете

География исследовательских групп, применяющих нейросети для разработки медицинских приложений, очень широка. О США нечего и говорить - в университете каждого штата ведутся подобные исследования, причем главное их направление - рак молочной железы. Да что там университеты - военные академии этим тоже занимаются. В Чехии Иржи Шима разработал теорию обучения нейронных сетей, способных эффективно работать с так называемыми интервальными данными (когда известны не значения параметра, а интервал его изменения), и использует их в различных медицинских приложениях. В Китае сотрудники Института атомной энергии обучили нейросеть отличать больных с легкими и тяжелыми заболеваниями эпителия пищевода от тех, кто страдает раком пищевода, на основе элементного анализа ногтей.

В России в НИИЯФ МГУ нейросети применяются для анализа заболеваний органов слуха.

Наконец, в Австралии Джордж Христос использовал теорию нейронных сетей для построения первой гипотезы о причинах загадочного синдрома внезапной смерти новорожденных.

***

Разумеется, в статье приведен далеко не полный перечень примеров использования технологий искусственных нейронных сетей в медицине. В стороне осталась психиатрия, травматология и другие разделы, в которых нейросети пробуются на роль помощника диагноста и клинициста. Не все, конечно, выглядит безоблачным в союзе новой компьютерной технологии и здравоохранения. Нейросетевые программы подчас крайне дороги для широкого внедрения в клинике (от тысяч до десятков тысяч долларов), а врачи довольно скептически относятся к любым компьютерным инновациям. Заключение, выданное с помощью нейронной сети, должно сопровождаться приемлемыми объяснениями или комментариями.

Но основания для оптимизма все-таки есть. Освоить и применять технологии нейронных сетей значительно проще, чем изучать математическую статистику или нечеткую логику. Для создания нейросетевой медицинской системы требуются не годы, а месяцы. Да и параметры очень обнадеживают - вспомним еще раз высокую специфичность диагностики.

И еще одна надежда на сотрудничество - само слово "нейрон". Все-таки оно так хорошо знакомо медикам...

Александр Ежов, Владимир Чечеткин -- Институт инновационных и термоядерных исследований (Троицк).

Количество публикаций по применению нейротехнологии в медицине трудно оценить точно. Однако если в 1988-89 годах их были единицы, то с 1995 года ежегодно появляются сотни. Могут оказаться полезными следующие адреса:



Нейронные сети в медицине

Нейронные сети для задач диагностики

Острая боль в груди. Скорая помощь доставляет больного в приемный покой, где дежурный врач должен поставить диагноз и определить, действительно ли это инфаркт миокарда. Опыт показывает, что доля пациентов, перенесших инфаркт среди поступивших с аналогичными симптомами, невеликa. Точных методов диагностики, тем не менее, до сих пор нет. Электрокардиограмма иногда не содержит явных признаков недуга. А сколько всего параметров состояния больного могут так или иначе помочь поcтавить в данном случае правильный диагноз? Более сорока. Может ли врач в приемном покое быстро проанализировать все эти показатели вместе с взаимосвязями, чтобы принять решение о направлении больного в кардиологическое отделение? В какой-то мере эту задачу помогают решать нейросетевые технологии.

Статистика такова: врач правильно диагностирует инфаркт миокарда у 88% больных и ошибочно ставит этот диагноз в 29% случаев. Ложных тревог (гипердиагностики) чересчур много. История применения различных методов обработки данных для повышения качества диагностики насчитывает десятилетия, однако лучший из них помог сократить число случаев гипердиагностики лишь на 3%.

В 1990 году Вильям Бакст из Калифорнийского университета в Сан-Диего использовал нейронную сеть – многослойный персептрон – для распознавания инфаркта миокарда у пациентов, поступающих в приемный покой с острой болью в груди. Его целью было создание инструмента, способного помочь врачам, которые не в силах справиться с потоком данных, характеризующих состояние поступившего больного. Другой целью может быть совершенствование диагностики. Свою задачу исследователь усложнил, поскольку анализировал данные только тех пациентов, кого уже направили в кардиологическое отделение. Бакст использовал лишь 20 параметров, среди которых были возраст, пол, локализация боли, реакция на нитроглицерин, тошнота и рвота, потение, обмороки, частота дыхания, учащенность сердцебиения, предыдущие инфаркты, диабет, гипертония, вздутие шейной вены, ряд особенностей ЭКГ и наличие значительных ишемических изменений.

Сеть продемонстрировала точность 92% при обнаружении инфаркта миокарда и дала только 4% случаев сигналов ложной тревоги, ошибочно подтверждая направление пациентов без инфаркта в кардиологическое отделение. Итак, налицо факт успешного применения искусственных нейронных сетей в диагностике заболевания. Теперь необходимо пояснить, в каких параметрах оценивается качество диагноза в общем случае. Предположим, что из десяти человек, у которых инфаркт действительно есть, диагностический метод позволяет обнаружить заболевание у восьми. Тогда чувствительность метода составит 80%. Если же мы возьмем десять человек, у которых инфаркта нет, а метод диагностики заподозрит его у трех человек, то доля ложных тревог составит 30%, при этом дополнительная к нему характеристика – специфичность метода – будет равна 70%.

Идеальный метод диагностики должен иметь стопроцентные чувствительность и специфичность – во-первых, не пропускать ни одного действительно больного человека и, во-вторых, не пугать здоровых людей. Чтобы застраховаться, можно и нужно стараться прежде всего обеспечить стопроцентную чувствительность метода – нельзя пропускать заболевание. Но в это оборачивается, как правило, низкой специфичностью метода – у многих людей врачи подозревают заболевания, которыми на самом деле пациенты не страдают.

Нейронные сети для задач диагностики

Нейронные сети представляют собой нелинейные системы, позволяющие гораздо лучше классифицировать данные, чем обычно используемые линейные методы. В приложении к медицинской диагностике они дают возможность значительно повысить специфичность метода, не снижая его чувствительности.

Вспомним, что нейронная сеть, диагностирующая инфаркт, работала с большим набором параметров, влияние которых на постановку диагноза человеку невозможно оценить. Тем не менее нейросети оказались способными принимать решения, основываясь на выявляемых ими скрытых закономерностях в многомерных данных. Отличительное свойство нейросетей состоит в том, что они не программируются – не используют никаких правил вывода для постановки диагноза, а обучаются делать это на примерах. В этом смысле нейросети совсем не похожи на экспертные системы, разработка которых в 70-е годы происходила после временной "победы" Искусственного Интеллекта над тем подходом к моделированию памяти, распознавания образов и обобщения, который основывался на изучении нейронной организации мозга.

Одной из наиболее известных из разработанных экспертных систем, действие которых основывалось на знаниях, извлеченных у экспертов, и на реализации процедур вывода, была система MYCIN. Данную систему разработали в Стэнфорде в начале 70-х годов для диагностики септического шока. Половина больных умирала от него в течение суток, а врачи могли обнаруживать сепсис лишь в 50% случаев. MYCIN, казалось, была подлинным триумфом технологии экспертных систем – ведь она позволяла обнаружить сепсис в 100% случаев. Однако после более внимательного знакомства с этой экспертной системой врачи значительно усовершенствовали традиционные методы диагностики, и MYCIN потерял свое значение, превратившись в учебную систему. Экспертные системы "пошли" только в кардиологии – для анализа электрокардиограмм. Сложные правила, которые составляют главное содержание книг по клиническому анализу ЭКГ, использовались соответствующими системами для выдачи диагностического заключения.

Диагностика является частным случаем классификации событий, причем наибольшую ценность представляет классификация тех событий, которые отсутствуют в обучающем нейросеть наборе. Здесь проявляется преимущество нейросетевых технологий – они способны осуществлять такую классификацию, обобщая прежний опыт и применяя его в новых случаях.

Конкретные системы

Примером программы диагностики служит пакет кардиодиагностики, разработанный фирмой RES Informatica совместно с Центром кардиологических исследований в Милане. Программа позволяет осуществлять неинвазивную кардиодиагностику на основе распознавания спектров тахограмм. Тахограмма представляет собой гистограмму интервалов между последовательными сердцебиениями, и ее спектр отражает баланс активностей симпатической и парасимпатической нервной системы человека, специфично изменяющейся при различных заболеваниях.

Так или иначе, уже сейчас можно констатировать, что нейронные сети превращаются в инструмент кардиодиагностики – в Англии, например, они используются в четырех госпиталях для предупреждения инфаркта миокарда.

В медицине находит применение и другая особенность нейросетей – их способность предсказывать временные последовательности. Уже отмечалось, что экспертные системы преуспели в анализе ЭКГ. Нейросети здесь тоже приносят пользу. Ки Чженху, Ю Хену и Виллис Томпкинс из университета штата Висконсин разработали нейросетевую систему фильтрации электрокардиограмм, позволяющую подавлять нелинейный и нестационарный шум значительно лучше, чем ранее использовавшиеся методы. Дело в том, что нейросеть хорошо предсказывала шум по его значениям в предыдущие моменты времени. А то, что нейросети очень эффективны для предсказания временных последовательностей (таких, например, как курс валют или котировки акций), убедительно продемонстрировали результаты соревнования предсказательных программ, проводимых университетом в Санта Фе – нейросети заняли первое место и доминировали среди лучших методов.

Возможности применения нейросетей

ЭКГ – это частное, хотя и исключительно важное приложение. Однако сегодня существует и много других примеров использования нейросетей для медицинских прогнозов. Известно, что длинные очереди в кардиохирургические отделения (от недель до месяцев) вызваны нехваткой реанимационных палат. Увеличить их число не удается из-за высокой стоимости реанимационной помощи (70% средств американцы тратят в последние 2 недели жизни именно в этом отделении).

Выход только в более эффективном использовании имеющихся средств. Предположим, что состояние прооперированных в некоторый день больных настолько тяжелое, что им необходимо их длительное пребывание в реанимационной палате (более двух суток). Все это время хирурги будут простаивать, поскольку вновь прооперированных больных некуда класть. Тяжелых больных разумнее оперировать перед выходными или праздниками – операционные все равно закрыты в эти дни, хирурги будут отдыхать, а больные восстанавливаться в реанимации. А вот в начале рабочей недели лучше прооперировать тех пациентов, которым нужно будет находиться в реанимационной палате только один-два дня. Тогда койки в реанимации будут освобождаться быстрее и принимать новых, прооперированных во вторник и среду больных.

Вопрос в том, как угадать, кому придется надолго задержаться в блоке интенсивной терапии после операции, а кому – нет. Джек Ту и Майкл Гуэрир из госпиталя Святого Михаила университета в Торонто использовали нейронные сети для такого предсказания. В качестве исходных данных они взяли только те сведения о пациенте, которые известны в предоперационный период. Заметим, что в предшествующих работах, не использующих нейронные сети, в качестве факторов повышенного риска пребывания в реанимации применялись также важные послеоперационные сведения – различные осложнения, возникшие в ходе хирургического вмешательства.

Ту и Гуэрир обучили двухслойный персептрон разделять больных на три группы риска, учитывая их возраст, пол, функциональное состояние левого желудочка, степень сложности предстоящей операции и наличие сопутствующих заболеваний. Из тех пациентов, которых сеть отнесла к группе малого риска задержки в реанимации, только 16,3% действительно провели в ней более двух дней. В то же время свыше 60% из тех, кого сеть отнесла в группу повышенного риска, оправдали неблагоприятный прогноз.

Борьба с раком

Мы уделяли особое внимание сердечно-сосудистым заболеваниям, поскольку именно они удерживают печальное лидерство в списке причин смертности. На втором месте находятся онкологические заболевания. Одно из главных направлений, в котором сейчас идут работы по использованию нейронных сетей, – диагностика рака молочной железы. Этот недуг – причина смерти каждой девятой женщины.

Обнаружение опухоли осуществляется в ходе первичного рентгенографического анализа молочной железы (маммографии) и последующего анализа кусочка ткани новообразования (биопсии). Несмотря на существование общих правил дифференцирования доброкачественных и злокачественных новообразований, по данным маммографии, только от 10 до 20% результатов последующей хирургической биопсии действительно подтверждают наличие рака молочной железы. Опять мы имеем дело со случаем крайне низкой специфичности метода.

Исследователи из университета Дьюка обучили нейронную сеть распознавать маммограммы злокачественной ткани на основе восьми особенностей, с которыми обычно имеют дело радиологи. Оказалось, что сеть способна решать поставленную задачу с чувствительностью около 100% и специфичностью 59% (сравните с 10-20% у радиологов). Сколько женщин с доброкачественными опухолями можно не подвергать стрессу, связанному с проведением биопсии, если использовать эту нейронную сеть! В клинике Майо (Миннесота) нейросеть анализировала результаты ультразвукового исследования молочной железы и обеспечила специфичность 40%, в то время как для тех же женщин специфичность заключения радиологов оказалась нулевой. Не правда ли, успех использования нейросетевых технологий выглядит совсем не случайным?

После лечения рака молочной железы возможны рецидивы возникновения опухоли. Нейросети уже помогают эффективно их предсказывать. Подобные исследования проводятся на медицинском факультете Техасского университета. Обученные сети показали свои способности выявлять и учитывать очень сложные связи прогностических переменных, в частности, их тройные связи для улучшения предсказательной способности.

Разнообразны возможности применения нейросетей в медицине, и разнообразна их архитектура. На основе прогноза отдаленных результатов лечения заболевания тем или иным методом можно предпочесть один из них. Значительного результата в прогнозе лечения рака яичника (болезнь каждой семидесятой женщины) добился известный голландский специалист Герберт Каппен из университета в Нимегене (он использует в своей работе не многослойные персептроны, а так называемые Машины Больцмана – нейросети для оценки вероятностей).

А вот пример другого онкологического заболевания. Исследователи из медицинской школы в Кагаве (Япония) обучили нейросеть, которая практически безошибочно прогнозировала по предоперационным данным результаты резекции печени у больных печеночно-клеточной карциномой.

В Троицком институте инновационных и термоядерных исследований (ТРИНИТИ) в рамках реализуемого Министерством науки проекта создания нейросетевых консультационных систем была разработана нейросетевая программа, которая выбирает метод лечения базальноклеточного рака кожи (базалиомы) на основе долгосрочного прогноза развития рецидива. Число заболеваний базалиомой – онкологическим недугом белокожих людей с тонкой кожей – составляет треть всех онкологических заболеваний.

Диагностика одной из форм меланомы – опухоли, которую иногда непросто отличить от пигментной формы базалиомы, была реализована с помощью нейросетевого симулятора Multineuron, разработанного в ВЦ СОАН в Красноярске под руководством А.Н.Горбаня.

Нейросети можно использовать и для прогноза действия различных разрабатываемых средств лечения. Они уже успешно применяются в химии для прогноза свойств соединений на основе их молекулярной структуры. Исследователи из Национального института рака в США использовали нейросети для предсказания механизма действия препаратов, применяемых при химиотерапии злокачественных опухолей. Заметим, что существуют миллионы различных молекул, которые необходимо исследовать на предмет их антираковой активности. Специалисты Института рака разбили известные онкологические препараты на шесть групп в соответствии с механизмом их действия на раковые клетки и обучили многослойные сети классифицировать новые вещества и распознавать их действие. В качестве исходных данных использовались результаты экспериментов по подавлению роста клеток из различных опухолей. Нейросетевая классификация позволяет определить, какие из сотен ежедневно апробируемых молекул стоит изучать далее в весьма дорогих экспериментах in vitro и in vivo. Для решения аналогичной задачи использовались и сети Кохонена. Эти обучаемые без учителя самоорганизующиеся нейросети разбивали вещества на заранее неизвестное число кластеров и поэтому дали исследователям возможность идентифицировать вещества, обладающие новыми цитотоксическими механизмами воздействия.

Нейросистемы, генетика и молекулы

Диагностика и лечение онкологических заболеваний, а также разработка новых медикаментозных средств несомненно представляют собой важнейшую область применения нейросетевых технологий. Однако в последнее время среди исследователей и врачей растет осознание того факта, что будущие успехи должны быть тесно связаны с изучением молекулярных и генетических причин развития заболеваний.

Не случайно в апреле 1997 года эксперты Национального института здоровья (США) выступили с рекомендациями по усилению исследований, связанных с выявлением причин, вызывающих рак, и разработок, направленных на предупреждение болезней. Нейросети уже довольно давно активно применяются в анализе геномных последовательностей ДНК, в частности для распознавания промоторов – участков, предшествующих генам и связываемых с белком РНК-полимераза, который инициирует транскрипцию. Их используют для дифференциации кодирующих и некодирующих участков ДНК (экзонов и интронов) и предсказания структуры белков.

В 1996 году было сделано сенсационное открытие, связавшее фундаментальные исследования в молекулярной генетике с проблемой патогенеза и лечения самого распространенного онкологического заболевания – базальноклеточного рака кожи. Исследователи обнаружили в девятой хромосоме человека ген (PTC), мутации в котором, в отличие от гена p53, вызваны воздействием ультрафиолета и являются причиной развития опухоли. Ключом к открытию стало изучение так называемого заплаточного гена, изменения в котором стимулировали дефекты развития плодовой мушки и тот факт, что у детей, также страдающих дефектами развития костной ткани (базальный невусный синдром), часто имеются множественные базалиомы.

Теперь генетики и врачи преисполнены надежд найти медикаментозное средство лечения базалиомы или использовать методы генной хирургии, и заменить ими такие нещадящие методы лечения, как обычная лазерная, рентгеновская и криохирургия. Могут ли нейронные сети оказаться полезными для этих исследований? В частности, нельзя ли с их помощью оценить возможное влияние определенной мутации на изменение свойств соответствующих белков или оценить ее прогностическое значение, скажем, для развития рецидива рака молочной железы?

Если бы это можно было сделать, то нейросети значительно уменьшили бы область поиска для молекулярных биологов, часто "на ощупь" проводящих очень дорогостоящие эксперименты по оценке роли мутаций в молекуле ДНК. Напомним, что к развитию злокачественных опухолей приводит неконтролируемый рост и деление клеток. Геном человека, в котором записана информация о всех производимых в организме белках, насчитывает около трех миллиардов нуклеотидов. Но только 2-3% из них действительно кодируют белки – остальные нужны самой ДНК для поддержания правильной структуры, репликации и прочего.

В геномных последовательностях ДНК можно приближенно выделить три составляющие: в первой содержатся многочисленные копии одинаковых фрагментов (сателлитная ДНК); во второй находятся умеренно повторяющиеся последовательности, рассеянные по геному; а в третьей _уникальная ДНК. В сателлитной ДНК различные копии представлены неодинаково – их численность варьируется от сотен до миллионов. Поэтому они обычно еще подразделяются на мини- и микросателлитов.

Замечательно, что распределение микросателлитов по геному столь специфично, что может использоваться в качестве аналога отпечатков пальцев для человека. Полагают также, что это распределение может быть использовано и для диагностики различных заболеваний.

В скрытом виде повторы нуклеотидных последовательностей играют важную роль и в уникальных последовательностях ДНК. Согласно гипотезе Фрэнсиса Крика, эволюция ДНК начинается от квазипериодических структур, и если мы сможем найти скрытые повторы, то узнаем, где произошли мутации, определившие эволюцию, а значит, найдем и древнейшие, и важнейшие участки, мутации в которых наиболее опасны. Распределение скрытых повторов также тесно связано со структурой и функцией белков, кодируемых соответствующей последовательностью.

В ТРИНИТИ была разработана система, в которой для поиска скрытых повторов и оценки роли мутаций в последовательностях ДНК используются модификации нейросетей Хопфилда. Есть надежда, что этот подход можно будет использовать для обобщенного спектрального анализа последовательностей данных весьма общего вида, например, для анализа электрокардиограмм.

Нейросети шагают по планете

География исследовательских групп, применяющих нейросети для разработки медицинских приложений, очень широка. О США нечего и говорить – в университете каждого штата ведутся подобные исследования, причем главное их направление – рак молочной железы. Да что там университеты – военные академии этим тоже занимаются. В Чехии Иржи Шима разработал теорию обучения нейронных сетей, способных эффективно работать с так называемыми интервальными данными (когда известны не значения параметра, а интервал его изменения), и использует их в различных медицинских приложениях. В Китае сотрудники Института атомной энергии обучили нейросеть отличать больных с легкими и тяжелыми заболеваниями эпителия пищевода от тех, кто страдает раком пищевода, на основе элементного анализа ногтей.

В России в НИИЯФ МГУ нейросети применяются для анализа заболеваний органов слуха.

Наконец, в Австралии Джордж Христос использовал теорию нейронных сетей для построения первой гипотезы о причинах загадочного синдрома внезапной смерти новорожденных.

Вместо заключения

Разумеется, в статье приведен далеко не полный перечень примеров использования технологий искусственных нейронных сетей в медицине. В стороне осталась психиатрия, травматология и другие разделы, в которых нейросети пробуются на роль помощника диагноста и клинициста. Не все, конечно, выглядит безоблачным в союзе новой компьютерной технологии и здравоохранения. Нейросетевые программы подчас крайне дороги для широкого внедрения в клинике (от тысяч до десятков тысяч долларов), а врачи довольно скептически относятся к любым компьютерным инновациям. Заключение, выданное с помощью нейронной сети, должно сопровождаться приемлемыми объяснениями или комментариями.

Но основания для оптимизма все-таки есть. Освоить и применять технологии нейронных сетей значительно проще, чем изучать математическую статистику или нечеткую логику. Для создания нейросетевой медицинской системы требуются не годы, а месяцы. Да и параметры очень обнадеживают – вспомним еще раз высокую специфичность диагностики.

И еще одна надежда на сотрудничество – само слово "нейрон". Все-таки оно так хорошо знакомо медикам…

ОПРЕДЕЛЕНИЕ ОПТИМАЛЬНОГО РАЗМЕРА НЕЙРОСЕТИ ОБРАТНОГО

РАСПРОСТРАНЕНИЯ ЧЕРЕЗ СОПОСТАВЛЕНИЕ СРЕДНИХ ЗНАЧЕНИЙ

МОДУЛЕЙ ВЕСОВ СИНАПСОВ

Предлагается новая "кривая обучения" . график зависимости среднего модуля веса

синапса от размера нейросети. Эксперименты показывают, что локальные минимумы и

выходы на асимптоты данного индикатора хорошо соответствуют свойствам

традиционных кривых обучения. зависимостей ошибок обучения и обобщения от

размера нейросети. Индикатор может быть использован для определения оптимального

размера сети при отсутствии тестовой выборки.

1. Задача определения оптимальной структуры нейросети

При использовании искусственных нейронных сетей важной задачей является

нахождение оптимального размера (структуры) сети. такого числа скрытых слоев

нейронов и нейронов в слоях, которые дадут максимум обобщающих способностей, т.е.

минимум ошибки обобщения (generalization error), особенно в случае отсутствия

независимой тестовой выборки или невозможностью искусственно разделить выборку

данных на обучающую и тестовую части из-за недостаточности общего объема данных.

Поэтому широко используется парадигма "кривых обучения" (learning curves) .

зависимостей ошибок обучения и обобщения от размеров нейросети и обучающей

выборки . Оптимуму соответствуют локальные минимумы или моменты выхода

графиков на асимптоты. Формальные приемы экстраполяции таких графиков

позволяют также оценивать необходимые и достаточные для достижения максимума

обобщающих способностей объемы обучающих выборок в случае первоначальной

недостаточности объемов выборочных данных.

Иным классом кривых обучения являются зависимости "внутренних" свойств

нейросети от её размера, сопоставляемые затем с динамикой ошибки обобщения.

Варианты. анализ внутреннего представления (internal representation) задачи,

теоретическая связь ошибки обучения и максимума суммы модулей весов синапсов,

приходящих на нейрон сети, NIC-критерий , оперирующий с градиентами целевой

функции и матрицей Гессе обученной сети и позволяющий оценить разницу между

ошибками обучения и обобщения. Такие критерии позволяют обходиться без

независимой тестовой выборки.

В работе предлагается новый вариант кривой обучения. зависимость среднего

модуля веса синапса от размера нейросети. Точнее, в экспериментах далее будет

использовано значение длины вектора весов синапсов сети (вычисленного в

евклидовой норме), деленное на общее число синапсов, с целью увеличения влияния

наибольших по модулю весов и следующей из этого перестраховке исходя из

результатов о нежелательности именно больших весов синапсов.

Этот критерий не является всеобъемлющим, т.к. имеется неоднородность

наборов синапсов сети от слоя к слою (для сетей малого размера в часто наблюдалось

статистическое различие средних модулей и дисперсий весов синапсов выходного и

скрытого слоя сети). Структурная неоднородность слоистых сетей известна и уже__учитывается алгоритмами обучения , но здесь влияние этого факта не исследуется.

2. Данные для экспериментальной проверки и результаты

Было взято 6 баз реальных данных, имеющих независимые тестовые выборки

(чтобы не вносить погрешность в оценку ошибки обобщения способом разбиения

обучающей выборки на обучающую и тестовую части). Взяты базы данных

AnnThyroid, Opt digits, Pen digits, Satellite, Statlog shuttle из UCI KDD Database

Repository http://kdd.ics.uci.edu/, и база данных Gong , доступная на страничке

http://www-ee.uta.edu/eeweb/IP/training_data_files.htm. Все 6 задач представляют собой

задачи классификации с учителем на то или иное число классов.

Все эти задачи обладают значительным, от нескольких тысяч до нескольких

десятков тысяч векторов, размером обучющей выборки. данное условие нужно для

гарантирования представительности выборки (и, соответственно, наличия четкой

асимптотики в ошибках обучения и обобщения после достижения и превышения

нейронной сетью адекватного для задачи размера) и отсутствия возникновения эффекта

переобучения при дальнейшем росте размера нейросети (шум и искажения в

обучающей выборке, если таковые наличествуют, не смогут быть запомнены

нейросетью из-за значительного, при большом объеме выборки, числа таких

искажений, а не единичности случаев этих искажений).

Использовались сети с одним скрытым слоем, число нейронов в котором

менялось от 1 до 25. В каждой задаче для каждого размера нейросети обучалось по 25

сетей (с разными начальными случайными значениями синапсов), свойства которых

затем усреднялись при построении кривых обучения.

Средние значения ошибок обучения и обобщения (выраженные в процентах доли

неправильно решенных примеров в объеме соответствующей выборки);

Среднеквадратичный вес синапса в сети. предлагаемый индикатор;

Максимум среди понейронных сумм модулей весов синапсов. индикатор .

Вдоль осей ординат отложено число нейронов в скрытых слоях сетей. Значения

индикаторов, отражающих свойства весов синапсов, перемасштабированы для

приведения в диапазон значений величин ошибок обучения и обобщения, что было

вызвано ограничениями программы построения графиков (невозможностью ввода двух

шкал). Вокруг каждой точки отложена дисперсия соответствующей выборки из 25

экспериментальных значений.

Видно, что выход нового индикатора на асимптоту (и стабилизация. такое

снижение дисперсии, что "усы" вокруг точки закрываются самой точкой) немножко

отстает от выхода ошибок обучения и обобщения на асимптоты, т.е. немножко

перестраховывается в плане требуемого размера сети, что можно только

приветствовать исходя из теоретических результатов : увеличение числа путей

прохождения сигнала по сети может снизить максимальные веса синапсов за счет

размножения каналов, где ранее требовалось усиление.

Также индикатор выявляет выход ошибки обобщения на оптимум во всех двух

случаях возникновения переобучения (задачи AnnThyroid, Gong), когда с ростом

размера сети с некоторого момента ошибка обобщения начинает снова возрастать.

момент стабилизации и выход индикатора на асимптоту чуть запаздывает по

сравнению с моментом достижения минимума ошибки в задаче AnnThyroid, а в задаче

Gong локальный минимум при размере сети в 6 нейронов точно соответствует

минимуму ошибки обобщения. Индикатор же в задаче Gong не имеет четко

выраженного экстремального поведения существенно нестабилен на всем диапазоне

исследованных размеров нейросети. от 1 до 25 нейронов.__

Локальные минимумы индикатора (шесть нейронов для задачи Gong, три для

задачи Opt digits, два для задачи Satellite) также могут указывать на оптимум ошибки

обобщения (задача Gong) или на структурные уровни сложности задачи (последнее

совпадает с изломами графиков ошибок обучения и обобщения). Последнее может

позволять идентифицировать моменты перехода от области адекватности

малопараметрических моделей классической статистики (линейная регрессия,

линейный дискриминант или байесовский классификатор на основе оценок

ковариационных матриц для каждого класса) к областям адекватности

многопараметрических моделей (нейронные сети, полиномиальные аппроксимации)

или непараметрических методов (непараметрическая статистика на основе ядерных

аппроксимаций плотностей вероятности, метод потенциальных функций).

Также индикатор чуть быстрее снижает свою дисперсию по набору проб, чем

максимальная понейронная сумма модулей весов синапсов , что в реальной работе

позволит обойтись меньшим числом попыток обучения для каждого размера

нейросети, или даже вообще без необходимости статистического усреднения свойств

нескольких нейросетей одного размера для получения четкой картины на графиках

наподобие приведенных в данной работе.

Как видно из экспериментальных графиков, при выборе оптимального размера

сети опираться только на значение ошибки обучения недостаточно. нельзя выявить

возникновение переобучения нейросети, поэтому сопоставление поведения нескольких

индикаторов (как было сделано на приведенных графиках) позволяет либо более

обоснованно подтвердить выбор размера нейросети, либо увидеть возможное

существование проблем (например, неадекватности модели из-за возникновения

переобучения). Возможность же обойтись без проверки на тестовой выборке позволяет

обучать нейросеть на всем доступном наборе примеров, без разделения его на

обучающий и тестовый фрагменты, и ожидать, что с ростом числа обучающих

примеров снизится и риск переобучения нейросети .

3. Заключение

Предложен новый вариант кривой обучения. зависимость яыјяj__среднего значения

модуля веса синапса в сети от размера нейросети. Экспериментально показано, что с

его помощью возможно достаточно надежное определение оптимального размера сети,

обеспечивающего минимум ошибки обобщения. Индикатор позволяет обходиться без

расчета ошибки обобщения на независимой тестовой выборке, допускает вариации

путем выбора нормы (модуль веса, среднее квадратичное значение,.) и учета

структурной неоднородности сети для максимизации прогностических способностей.

Также данный критерий может быть применен и при обучении растущих

нейросетей, наподобие нейросетей каскадной корреляции, причем как на этапе отбора

обученного нейрона-кандидата для вставки в нейросеть (наряду с использованием

значения целевой функции для этого нейрона), так и после вставки отобранного

нейрона в сеть и коррекции последней (не единственный отобранный нейрон-кандидат

вставляется в нейросеть, а несколько лучших возможных нейронов вставляются

каждый в свою копию нейросети, и уже эти доученные копии сравниваются между

собой как по значению целевой функции, так и по предлагаемому индикатору).



gastroguru © 2017