Rambler's Top100
 
Статьи ИКС № 09-10 2017
Борис ЗИНГЕРМАН  07 ноября 2017

Нужно задействовать методы поисковых систем интернета

В системе здравоохранения с данными для аналитики всегда были затруднения, обусловленные тем, что компьютерные технологии в медицину пришли позже, чем в другие области. Поэтому и организаций, которые собирают данные в электронном виде, пригодном для анализа, меньше, чем в других отраслях.

В системе здравоохранения с данными для аналитики всегда были затруднения, обусловленные тем, что компьютерные технологии в медицину пришли позже, чем в другие области. Поэтому и организаций, которые собирают данные в электронном виде, пригодном для анализа, меньше, чем в других отраслях.

Но есть и принципиальная проблема, которую в медицине пытаются решить уже в течение нескольких десятков лет: данные для анализа нужно определенным образом структурировать. Появилось несколько версий разнообразных стандартов, в частности HL7 и OpenEHR. Но медицинские данные очень разнообразные и разветвленные, поэтому часто упорядочить их не удается. Более того, врачи привыкли оперировать данными не в форме опросников, разбитых на определенные блоки и пункты, а в виде сплошных текстов, потому что они получаются короткими и емкими.

Характерный пример: несколько лет назад сотрудники известного института, занимавшиеся структурированием данных, придумали опросник по состоянию дыхательной системы. Он состоял из 50 страниц всевозможных галочек, точечек и т.п. После того как врач его заполнял, опросный лист превращался в гладкий текст из двух-трех абзацев с описанием состояния человека. И тут выяснилось, что врачи не готовы заполнять такие анкеты, им гораздо проще написать те самые абзацы гладкого текста.

Однако анализировать такую информацию гораздо сложнее. Я думаю, что выход из создавшейся ситуации состоит в том, чтобы для анализа неструктурированной медицинской информации применять методы, подобные тем, которые задействованы в поисковых системах в интернете. Сегодня в здравоохранении эти методы только апробируются. Специалисты экспериментируют, используя различные решения, начиная с Watson и заканчивая рядом систем, которые мы пытаемся развивать в России. Но реально прорывных успехов еще нет.

Здесь возникает и еще одна важная психологическая проблема – эти новые методы, скажем так, вероятностны. Когда мы запрашиваем информацию в интернете, мы находим 90% ссылок, а 10% остаются недоступными, поскольку алгоритм не позволяет их определить. Если для специалистов из других отраслей потеря этих 10% некритична, то для представителей здравоохранения представляет серьезную проблему. Поэтому применение таких «нестрогих» методов в нашей сфере пока находится на начальном этапе. 

Поделиться:
Заметили неточность или опечатку в тексте? Выделите её мышкой и нажмите: Ctrl + Enter. Спасибо!