ПОКАЗАТЕЛИ

Это рабочее место хранит непосредственно сами статистические данные (временные ряды), которые подчинены различным источникам данных.

ОБЩИЙ ОБЗОР

На главной странице представлены имеющиеся в СУБД показатели.

Часть данных для формирования временного ряда показателя система:

  • Для «вычисляемых» показателей рассчитывает по требованию;
  • Для «загружаемых» - подгружает автоматически из общедоступных источников (однократно или периодически), согласно регламентному заданию (например, курсы валют, погода). Иным способом данные показателей преобразуются в специально подготовленные файлы (формат XLSX, CSV) и либо в ручном режиме загружаются в систему Администраторами доменов из локального источника, либо по заданию закачиваются из файлов, предварительно сохраненных на сетевой диск. См. подробнее в главе «Источники данных».

Статусы вычисляемых показателей:

  • «Вычисляемые данные рассчитаны» - данные готовы для работы;

Статусы загружаемых показателей:

  • «Данные не загружены» - данных в показателе нет, (первоначальный статус, создана оболочка показателя);
  • «Загружены. Готовы к ИИ» - данные готовы для работы;
  • «Загружены. Недостаточны для ИИ» - для дальнейшей работы с показателем недостаточны: либо мощность данных (минимум 3 года), либо частота квантования (месяц, квартал год, желательно неделя).

Общие статусы показателей:

  • «Ошибка» - данные не загружены, во время загрузки произошла ошибка. Для того чтобы понять причину ошибки, на центральном экране «Дашборд», в области «Список заданий на загрузку данных за последние…» можно перейти к нужной задаче в РМ «Сервер заданий», ознакомиться с протоколом выполнения (Например, в протоколе может быть указана фатальная ошибка: не тот формат файла данных, или нет нужных колонок и т.д.):

ИНСПЕКТОР

Панель Инспектор является инструментом для отражения свойств выбранного объекта (показателя) и их редактирования:

  • Элементы управления, с помощью которых пользователь может создавать, изменять и удалять объекты (показатели).
  • Временной тренд показателя
  • Детализированная текстовая информация (сведения о реквизитах выбранного показателя), закладка «о показателе».
  • Ссылочная контекстно-связанная информация, закладка « Используется в …». На этом примере можно видеть, в каких когнитивных моделях используется показатель в качестве фактора и перейти к описанию этой модели по ссылке.

ГРАФИКИ

По кнопке «Подробнее» можно развернуть на весь экран **график с историческими данными по выбранному показателю

СОЗДАНИЕ ПОКАЗАТЕЛЯ

Этот диалог корректно проверяет все вводимые данные и не позволяет ввести их некорректно. Форма ввода нового элемента представлена следующими реквизитами:

Общая информация:

  • Имя – уникальное наименование сущности в системе (может быть в виде сокращения, понятного автору сущности);
  • Краткое описание – наименование без сокращений.
  • Полное описание – кратко описание, дополненное любой иной информацией, имеющей отношение к сущности;
  • Комментарий – дополнительные сведения.

Классификация:

  • Группа/Подгруппа, Сфера/Сегмент, Географический уровень данных – классификация-обобщение показателя внутри системы по признакам для удобства работы – использование, отбор, поиск;
  • Вычисляемые/Загружаемые – признак показателя, определяющий способ загрузки/расчета данных показателя в БД.

О данных:

  • Тип данных – представление данных в виде дробного или целого числа.
  • Единица измерения – величина фиксированного размера (рубль, %, секунда, тонна и т.д.);
  • Шкала измерений – размерность количественного учета единицы измерения (единица, тысяча, миллион и т.д.);
  • Ограничения сверху/снизу – минимально/максимально допустимые значения показателя.

Источник данных:

  • Источник данных – ссылка на родительский «Источник данных», заполняется для показателя с установленным признаком «Загружаемые»;
  • Имя колонки в источнике данных – признак, по которому при загрузке данных из файла-шаблона происходит сопоставление показателя и колонки специально подготовленного файла (формат XLSX, CSV), заполняется для показателя с установленным признаком «Загружаемые»;
  • Формула вычисления для вычисляемых показателей – алгоритм получения данных, заполняется для показателя с установленным признаком «Вычисляемые».

Методы:

  • Метод заполнения пустот разреженности – способ, согласно которому ИИ сведет квантование данных до недели между значениями исходных данных.

Рекомендации (данные признаки для каждого показателя на этапе формирования структуры «Когнитивной модели» можно будет переопределить под потребности):

  • Используется как фактор наблюдения – показатели, которые будут использоваться системой для расчета прогноза.
  • Используется как фактор для прогнозных импульсов - показатели, на которые имеет возможность воздействовать пользователь (вводить импульс на фактор, чтобы смоделировать другой прогноз).
  • Используется в качестве целевого фактора - показатель, для которого можно задать целевое значение, которое должно получиться в результате решения задачи подбора импульсов.

Инспектор

  • Качество данных (анализ временного ряда, данных показателя) – это сумма взвешенных показателей от 0 до 1. В оценку входят количество данных, на какую глубину истории данные присутствуют, как давно мы получали новые данные. Самую большую оценку получат данные с глубиной > 7 лет, хотя бы 4 значения в год, и последние данные не позже полугода назад;
  • Качество описания (анализ описания показателя) – насколько качественно и полно дано описание показателя для его возможного использования в отборе переменных в прогнозную модель (от 0 до 1). Критерии оценки:
    • 0–0.3: описание слишком общее, непонятно, что измеряется и как использовать. 0 звезд;
    • 0.31–0.6: описание частично полезно, но не хватает деталей (единицы, контекст, интерпретация). 1 звезда;
    • 0.61–0.85: описание в целом подходит, можно использовать, но есть недочёты. 2 звезды;
    • 0.86–1: описание отличное, полностью ясно, как показатель применить для модели. 3 звезды.

Оценка качества описания позволяет ориентироваться на показатель при автоматическим построении модели с помощью ИИ. Плохо описанный показатель трудно использовать не только ИИ, но и эксперту.

Оценка качества данных позволяет понять, насколько пригодны данные для модели. Плохие данные – такие же результаты на выходе.

  • Анализ ИИ – признак того, описание показателя проанализировано ИИ;
  • Метрики ряда
  • Частота квантования – временной промежуток между данными ряда, неделя минимальное значение в системе;
  • Мощность данных – количество данных во временном ряде, минимум 3 года.
  • Метод статистической очистки, Метод приведения, Метод нормализации – дополнительные встроенные методы для подготовки данных;
  • Наличие разреженности – величина в %, показывающая удаленность между исходными данными: минимум неделя –> 0%, максимум год –> 98%; Формула расчета: 1-N/52 недели, где N – период квантования исходных данных.

ИЗМЕНЕНИЕ ПОКАЗАТЕЛЯ

Кроме создания показателя, его можно изменить в аналогичном диалоге. Достаточно выбрать нужный объект в списке, нажать в панели «Инспектор», кнопку «Изменить». Меняются только допустимые бизнес-логикой атрибуты. Система поддерживает целостность данных.