Почему машинное обучение популярно в медицинских исследованиях, но не в кабинетах наших врачей?

Научная технология

Машинное обучение (МО) программирует компьютеры учиться так же, как мы, — посредством постоянной оценки данных и выявления закономерностей на основе прошлых результатов. ML может быстро выявлять тенденции в больших наборах данных, работать практически без участия человека и со временем улучшать свои прогнозы. Благодаря этим способностям он быстро находит применение в медицинских исследованиях.

У людей с раком молочной железы вскоре будет возможность диагностировать рак молочной железы быстрее, чем с помощью биопсии. ML также может помочь парализованным людям восстановить самостоятельность с помощью протезов, контролируемых закономерностями, выявленными в данных сканирования мозга. Исследования МО обещают эти и многие другие возможности помочь людям вести более здоровый образ жизни. Но хотя количество исследований ОД растет, фактическое использование его в кабинетах врачей не расширилось.

Ограничения заключаются в небольших размерах выборки медицинских исследований и уникальных наборах данных. Из-за этого небольшого объема данных машинам сложно идентифицировать значимые закономерности. Чем больше данных, тем выше точность диагностики и прогнозов ОД. Для многих диагностических целей потребуется огромное количество субъектов, исчисляемое тысячами, но в большинстве исследований используются меньшие числа субъектов, исчисляемые десятками.

Но есть способы получить значимые результаты из небольших наборов данных, если вы знаете, как манипулировать числами. Проведение статистических тестов снова и снова с различными подмножествами ваших данных может указать на значимость набора данных, который на самом деле может быть просто случайными выбросами.

Эта тактика, известная как P-хакинг или взлом функций в машинном обучении, приводит к созданию прогнозных моделей, которые слишком ограничены, чтобы их можно было использовать в реальном мире. То, что выглядит хорошо на бумаге, не означает способности врача поставить нам диагноз или лечить. Эти статистические ошибки, часто совершаемые по незнанию, могут привести к опасным выводам.

Чтобы помочь ученым избежать этих ошибок и продвигать приложения машинного обучения, Конрад Кординг, профессор Пенсильванского университета интегрирует знания, назначенный на кафедру нейронаук в Медицинской школе Перельмана и на кафедры биоинженерии, компьютерных и информационных наук в Школе медицинских наук. Инженерные и прикладные науки возглавляет часть крупной программы, финансируемой НИЗ, известной как ЦЕНТР – Создание образовательной связи для обучения строгому экспериментированию. Кординг возглавит группу Пенна, создав «Сообщество строгости», которое будет предоставлять ресурсы с открытым доступом для проведения надежных научных исследований. Члены этого инклюзивного научного сообщества смогут участвовать в симуляциях ML и дискуссионных курсах.

«Причина отсутствия МО в реальных сценариях связана со статистическим злоупотреблением, а не с ограничениями самого инструмента», — говорит Кординг. «Если в исследовании публикуется утверждение, которое кажется слишком хорошим, чтобы быть правдой, обычно так оно и есть, и во многих случаях мы можем отследить это на основе использования статистики».

Чтобы добиться значимого прогресса в области МО в биомедицинских исследованиях, необходимо будет повысить осведомленность об этих проблемах, помочь исследователям понять, как их выявлять и ограничивать, а также создать более сильную культуру научной строгости в исследовательском сообществе.

Кординг стремится донести до нас, что тот факт, что включение машинного обучения в биомедицинские исследования может привести к предвзятости, не означает, что ученым следует избегать этого. Им просто нужно понять, как использовать его осмысленно.

Сообщество за строгость стремится решать проблемы в этой области с помощью конкретных планов по созданию модуля по машинному обучению в биомедицинских исследованиях, который будет помогать участникам использовать наборы данных и статистические тесты, а также определять точные места, где обычно возникает предвзятость.

Эта история написана Мелиссой Паппас. Узнайте больше на сайте Penn Engineering Today.