простой материал

ТЕЗИСЫ КОНЦЕПЦИИ ЭКОЛОГО-ЭПИДЕМИОЛОГИЧЕСКОЙ ИНФОРМАЦИОННОЙ СИСТЕМЫ (1996)

EHIPS - система СРЕДА-ЗДОРОВЬЕ


  1. ПРИНЦИПИАЛЬНЫЕ ПРОБЛЕМЫ
  2. КАК УСТРОЕНА ИНФОРМАЦИОННАЯ СИСТЕМА?


Цель проекта
   Обеспечить ЛПР новым типом информации - оценками риска здоровью за счет загрязнения среды и возможными сценариями уменьшения риска. Эта выходная информация должна быть стабильной по форме и качеству, учитывать социальные и экономические, но не технологические факторы, и опираться в основном на уже имеющиеся входные данные.
В начало


Альтернативы, выбор которых определяет суть концепции

Предлагается Альтернатива
западная схема оценки/управления риском должна быть принята, но адаптирована за счет специальной схемы обработки информации к сложившимся в РФ "плохим" системам сбора данных и принятия решений существующие системы должны быть пересмотрены ради возможно более точного воспроизведения хорошо зарекомендовавшей себя западной схемы, рассчитанной на "хорошие" данные и высокоорганизованных лиц, принимающих решения (ЛПР)
создание постоянного информационного канала для ЛПР ("информационная магистраль") со стабильной технологией обработки данных и возможностью интеграции в нее результатов отдельных специализированных ЭЭ-исследований проект состоит из отдельных эколого-эпидемиологических (ЭЭ)-исследований, которые затем сшиваются экспертами на основе их понимания ЭЭ-ситуации в отчет и рекомендации для ЛПР
возможно более точная оценка истинной величины риска для здоровья с привлечением экспертных знаний для уменьшения неопределенности количественных данных характеризация риска с учетом неопределенностей в виде запаса, гарантирующего охрану здоровья за счет преувеличения риска
относить критерии качества к выходной, а не к входной информации. Качество исходных данных определяется их окончательной ценностью для принятия решений. В частности, важнее ликвидировать барьер непонимания между ЛПР и результатами анализа риска, чем улучшать данные мониторинга акцент на сборе возможно более детальных и высококачественных данных мониторинга среды и здоровья независимо от их сиюминутной эффективности для принятия решений

В начало


Чем концепция отличается от американского подхода к риску?
   В отличие от США, в России экономические факторы более весомы, чем медицинские. Механизм управления, основанный на повышенной чувствительности общественного мнения и юридической системы к рискам для здоровья, не будет здесь работать. Поэтому оценки риска должны быть реалистичны и балансироваться с затратами (анализ стоимость-эффективность). Лишь в этом случае они будут учитываться ЛПР.
   Экономически невозможно организовать сколько-нибудь масштабный дополнительный сбор исходных данных или общее улучшение их качества. Поэтому необходимо извлечь максимум полезной информации из стандартных, почти бесплатных данных, пусть даже ценой как угодно сложной их обработки.
   Нет ни средств, ни организационных струкутр для изучения причинно-следственных связей типа "отдельный загрязнитель - отдельная нозология". Кроме того, неопределенность таких связей выше, чем в США, из-за большего веса социальных факторов. Поэтому необходимо использовать для описания риска пучок (паттерн) взаимосвязанных загрязнителей, заболеваний и социальных факторов, типичный для данной территории или когорты.
   Проект нацелен не на разовые акции по устранению конкретных источников загрязнения, а на постоянно действующую систему поддержки принятия решений. Поэтому необходима постоянно действующая система и стабильная технология обработки информации. В то же время, она должна адаптироваться к накоплению более детальной информации, изменению запросов ЛПР и т.д.
В начало


Где установлена система?
   Система представляет собой три сервера - федеральный и два региональных - соединенных по сетям компьютерной связи. Каждый региональный сервер, одновременно с обработкой данных для проекта, служит центром обмена информацией между разнородными региональными базами ЭЭ-данных, и за счет этого имеет к ним доступ.
   К каждому серверу, как региональному, так и федеральному, подсоединены компьютеры - рабочие места экспертов, обеспечивающих обработку информации и ведущих специальные ЭЭ-исследования.
   Федеральный сервер устанавливается на площади федерального центра Санэпиднадзора. Региональные серверы - на площади, где размещаются объединенные в локальную сеть основные базы региональных ЭЭ-данных, т.е., по состоянию на текущий момент, в санэпидцентрах регионов.
   Для обмена данными между федеральным и региональным серверами арендуется канал сети Интернет или аналогичный. Одновременно обеспечивается открытый доступ по Интернету отечественных и зарубежных пользователей к результатам расчета рисков.
   Обработка информации проводится независимо в региональных и федеральном центре по единой схеме с обменом результатами обработки, формированием общей базы экспертных знаний, а также подкачкой необходимой информации из баз данных, связанных с одним сервером, на другой. При этом базы данных разных центров обработки остаются раздельными и соответствуют территории, обслуживаемой этим центром.
   Другие регионы могут подключиться к системе на тех же началах, при этом они должны установить у себя сервер со стандартным для системы программным обеспечением и подсоединиться к линии связи.
В начало


Как обслуживается система?
   Стандартный режим функционирования системы обеспечивают в основном специалисты по обработке информации. Их задача - обеспечить правильный режим для ядра системы - ЭЭ-модели обслуживаемой территории - в частности:    Стандартный режим поддерживают также эксперты - эпидемиологи. Их функции:    Система также поддерживает рабочие места для эпидемиологов, занимающихся отдельными исследованиями, например когортными, которые не являются частью постоянного информационного потока. Система должна обеспечивать интеграцию результатов этих исследований в процедуру оценки риска и пополнение на их основе моделей и баз знаний.
   "Железо" системы обслуживают в обычном порядке штатные сотрудники проекта или привлеченные организации.
В начало


К каким источникам данных подключена система?
   Система, через региональный сервер, имеет доступ к поддерживаемым в санэпидцентре региональным базам данных по окружающей среде, основанным на постоянных наблюдениях Госкомгидромета, Санэпиднадзора, Водоканала и т.п., к постоянно ведущейся региональной статистике заболеваемости и смертности с разбивкой по территориям, диагнозам, группам риска, а также к имеющейся демографической статистике.
   Штат регионального центра вносит в базу данных результаты специализированных региональных ЭЭ-исследований в одной из стандартных форм, поддерживаемых системой.
   На федеральном уровне в систему вводятся ежегодные сводки наблюдений окружающей среды и здоровья, аналогичные региональным данным, но агрегированные во времени (напр., с интервалом в месяц) и пространстве (напр., до уровня города или области).
   Возможен ввод в систему экспертами качественных суждений о состоянии окружающей среды, здоровья людей и их связи.
   Система должна иметь доступ к открытым зарубежным базам данных в ЭЭ-области (напр., IRIS) по сети Интернет, на CD-ROM или на других носителях.
   Предусмотрена закупка данных дистанционного зондирования, если расчеты показывают, что это способствует снятию неопределенности, например, в модели распространения выбросов.
В начало


Кто и какую информацию принимает с выхода системы?
   Главный поток выходной информации - это "сценарии", т.е. развертка ЭЭ-ситуации по пространству (на карте), во времени (динамика рисков), по демографическим группам и т.д. ЭЭ-ситуация описывается характеристиками риска (endpoints), которые задают различные эксперты, а с другой стороны, экономическими и социальными характеристиками, которые задают различные ЛПР.
   Критерии для оценки желательности сценария могут по-разному и с разными весами комбинировать его характеристики. Это т.наз. многокритериальность. Как правило, не бывает сценариев, наилучших по всем критериям сразу. Поэтому выходная информация для ЛПР содержит пучок сценариев, каждый из которых оптимальным образом представляет один определенный тип управления, наилучший в рамках какого-либо одного критерия.
   Баланс различных критериев оценки ситуации - прерогатива ЛПР. Он не входит в задачи системы. Однако система должна характеризовать неопределенность, заложенную в каждый сценарий, поскольку от нее зависит, насколько важно на практике различие между сценариями, построенными, исходя из разных критериев оптимальности. (Конфликты интересов, исходящие из недостоверной информации, могут быть устранены.)
   Как правило, структура сценария - это дерево возможных решений и их последствий (с отсечением неоптимальных ветвей).
   Сценарии регионального уровня соответствуют, как правило, различным административным мерам воздействия на источники загрязнения или на медицинское обслуживание, а также различным маневрам деньгами, включая наложение штрафов и финансирование очистных работ. Они поставляются мэриям, руководителям территориальных медицинских служб, санэпиднадзора и т.п.
   Сценарии федерального уровня соответствуют, как правило, различным возможным изменениям природоохранного и медицинского законодательства или возможным решениям соответствующих центральных ведомств РФ.
   Важный тип сценариев описывает ожидаемый эффект мер по улучшению качества исходных данных. Они влияют на неопределенность, с которой оцениваются различные ЭЭ-критерии, а значит, на разрешающую способность выбора мер по управлению риском.
   Вспомогательный поток выходной информации отражает внутренние характеристики модели ЭЭ-ситуации, используемой при оценке риска, например ее устойчивость, информационную обеспеченность разных частей модели и т.д. Он выдается экспертам по обработке информации, обслуживающим систему, с целью совершенствования структуры модели и контроля качества обработки информации.
   Еще один вспомогательный поток выходной информации - оценки риска, стандартизованные для сравнения с зарубежными аналогами, независимо от адекватности этих стандартов российским условиям. Адресат - эксперты-эпидемиологи. Назначение - анализ необходимых модификаций зарубежных данных перед интеграцией их в систему а также выявление "подозрительных" оценок риска, резко отличающихся от зарубежных аналогов.
   Своего рода выходной информацией является накопление апробированных модельных характеристик ЭЭ-ситуации в базах данных и знаний. Эта информация, в силу специфического формата, доступна только самой системе, однако возможен запрос к ней через систему от экспертов или ЛПР с выдачей в преобразованной, наглядной форме.
В начало


Как представляется и обрабатывается информация внутри системы?
   До окончания проектирования системы все нижеследующие решения нельзя считать окончательными.
   Ядром системы является комплексная ЭЭ-модель, развернутая в территориальном измерении, временном измерении и по демографическим группам. Модель включает подмодели выброса, распространения загрязнителей, отклика организма, демографической динамики и др.
   Модель является одновременно главным процессором, выполняющим обработку данных. Основным процессом в модели является продукция прогнозных оценок риска здоровью, их сравнение с реальной медицинской статистикой и экспертными оценками и коррекция модели соответственно выявленным невязкам.
   Наиболее важные подпроцессы в модели соответствуют отдельным типам оценок ЭЭ-риска (популяционным, поперечным, когортным и т.д.). Они запускаются автоматически при обеспеченности соответствующей входной информацией или по запросу эксперта, который при этом должен вводить недостающую информацию в диалоговом режиме.
   Модель содержит также подпроцессы, соответствующие как аппроксимации данных об окружающей среде и здоровье с очисткой от ошибок, так и согласованию данных разного уровня.
   Модель организована иерархически и содержит несколько уровней пространственной, временной и демографической организации, соответствующих, как минимум, федерации, области, городу, когорте, индивиду. Параллельно имеется несколько уровней иерархии параметров модели, соответствующих разной детальности модельного представления ЭЭ-процессов (например, коэффициент, описывающий соотношение доза-эффект, может детализироваться как модель реакции организма на загрязнитель). Если модель функционирует правильно, то чем выше уровень, тем более надежная информация в нем накапливается. В модели постоянно идет фоновый процесс, отвечающий за согласование разных уровней представления информации.
   Каждый уровень модели разбит на объекты. Объекты верхнего уровня - комплексы факторов и процессов, соответствующих разным ЭЭ-опасностям. Объекты более низких уровней представляют собой конкретизацию этих опасностей по территориям, отдельным типам выбросов, группам нозологий и т.д. Объекты включают как поля - данные, так и методы - процессы, обновляющие и обрабатывающие эти данные. Такой подход позволяет, с одной стороны, эффективно конструировать модель методами объектно-ориентированного программирования, а с другой стороны, наглядно представлять структуру модели в "единицах"-объектах, соответствующих интуитивному пониманию проблематики экспертом, работающим с моделью.
   Базы данных и знаний хранят информацию в структурах, соответствующих модельным объектам. Объекты создаются и уничтожаются в ходе функционирования модели, если это диктуется потребностями представления структуры данных или запросами экспертов.
   В стандартном режиме работы модель постоянно адаптируется к новым входным данным и генерирует (с заданной периодичностью и пространственным разрешением) сценарии развития ЭЭ-ситуации в пространстве, времени и по демографическим когортам.
   Любая информация, обрабатываемая моделью, как количественная, так и качественная, снабжается энтропийной мерой неопределенности. Эта величина описывает как неточности входных данных, так и ожидаемые погрешности модельной аппроксимации и т.п. Комбинируясь в процессе обработки, эти меры дают итоговую меру достоверности выходных сценариев. При необходимости, ЛПР должен иметь возможность с их помощью выяснить, за счет чего возникла неопределенность в том или ином сценарии.
   Модельные объекты имеют несколько форм представления: графическую, картографическую, вербальную (логическую), сетевую (в форме паттерна). Последняя является основной внутренней формой представления объекта в модели и комбинирует различные факторы, входящие в определение объекта, и взаимосвязи между ними, например отклик здоровья на загрязнители. Система оперирует с паттернами в целом с помощью нейросетевых алгоритмов, байесовых сетей и т.п. При наличии достаточной информации, возможно вычленение из паттерна пары факторов и работа с причинно-следственной связью между ними с помощью стандартных алгебраических алгоритмов.
В начало


В какой последовательности должна строиться система?
   На первом этапе параллельно идут два процесса:    Решения, апробированные в "мини-варианте", будут переноситься на "большую систему" по мере ее создания.
   На втором этапе информационная система создается в объеме, достаточном для:    Таким образом, ориентировочно к концу 1996 г. система сможет выдать первые грубые оценки риска для федерации и двух регионов.
   На третьем этапе система развивается в объеме, достаточном для:    К исходу этого этапа должен быть разработан уточненный план дальнейшего развития системы, технология ее обслуживания, порядок обучения новых экспертов работе с ней.
   На четвертом этапе примерные задачи таковы:    На пятом этапе система должна быть интегрирована в государственный механизм контроля и управления качеством окружающей среды и здоровьем, а обслуживающие ее эксперты должны образовать консультационную фирму для проведения специализированных исследований с помощью этой системы.
В начало

Оглавление

© ИКИ РАН, 1998-2001