Словарь

сложный материал

ИЕРАРХИЧЕСКАЯ ОРГАНИЗАЦИЯ ДАННЫХ

EHIPS - система СРЕДА-ЗДОРОВЬЕ


   Структура данных системы иерархическая. Нижний уровень - "случай", обычно соответствующий единичной записи в базе данных. Следующий уровень - элементарный интервал одной из координат системы: период времени, единица территориального деления, вещество-загрязнитель и др. Соответствующие данные - число случаев (напр., заболевания), попадающих в интервал, или средние (напр., концентрации) по интервалу. Интервалы образуют иерархию (напр., один момент - день - месяц - год), выбору уровня которой традиционно уделяется большое внимание в задачах "среда-здоровье". Это следующий уровень - дерево соответствующей координаты.
   Каждый тип информации имеет свой набор характерных координат, которые образуют куб данных. Это следующий уровень иерархии данных. Напр., данные о концентрациях размещаются в кубе с осями "загрязняющее вещество - территория - время". Каждая ось - координатное дерево.
   Следующий уровень иерархии - блок, объединяющий все кубы данных, где находится информация одного типа. Основных кубов в каждом блоке три: данные измерений, модельный прогноз и фон ( система отсчета).
   Верхний уровень иерархии данных - "опасность", т.е. совокупность данных из разных блоков, характеризующая ту или иную проблему "среда-здоровье". Этому уровню соответствует вся выборка данных в целом и вся совокупность блоков. Однако допускается представление выборки как наложения нескольких опасностей. Оно производится в режиме определения приоритетов, и за ним обычно должно следовать разделение выборки на части, соответствующие отдельным опасностям.
   Нельзя говорить об "уровне, на котором происходит обработка информации". Информационный конвейер может проходить по разным "этажам" иерархии.
   Иерархию образуют также уровни принятия решений: как минимум, региональный и локальный (город или район). Наличие информационной связи между этими уровнями с помощью данной системы способствует:    Модели, используемые системой, также организованы иерархически. Во-первых, они могут содержать несколько алгоритмов расчета, соответствующих уровням пространственной, временной и т.п. организации данных. Так, модель распространения выброса ISC3 использует разные алгоритмы для ежечасного прогноза (ISC3ST) и прогноза среднегодовых концентраций (ISC3LT). Экспозиционные, демографические и др. модели также должны содержать уровни, соответствующие области, городу, индивиду.
   Параллельно имеется иерархия параметров модели, отвечающих разной степени детальности моделирования. Например, параметры линейной модели могут дополняться параметрами, описывающими нелинейность. Многомерные модели, например используемые в многофакторной регрессии, организованы как иерархия моделей возрастающей размерности соответственно числу учитываемых факторов. Если модель функционирует правильно, то чем выше иерархический уровень (т.е. чем "грубее" модель), тем более надежная информация в нем накапливается. В системе к моделям применяется фоновый алгоритм, обеспечивающий согласование разных уровней информации.
   В процессе анализа данных система имеет возможность перехода вверх или вниз по иерархии моделей от уровня, на котором поставлена исходная задача. Так, для оценки риска по популяции требуется выдача "снизу" данных о чувствительности отдельных групп населения к воздействию тех или иных загрязнителей. Эта возможность используется тогда, когда прогнозируется повышение достоверности расчетов (снижение уровня неопределенности). Кроме того, она облегчает согласование планов между ЛПР разного уровня, например городского и областного.

Оглавление

© ИКИ РАН, 1998-2001