Во внутреннем операционном процессе периодически возникали интервалы повышенной и критической нагрузки.
Цель проекта — определить, когда и при каких условиях процесс чаще переходит в напряжённое состояние, какие временные зоны и группы факторов чаще связаны с перегрузкой, а также какие метрики стоит использовать для регулярного мониторинга.
Проект выполнен на реальных обезличенных данных: без раскрытия деталей процесса, с нейтральными категориями, укрупнёнными временными признаками и безопасной для публикации структурой данных.
В рамках проекта нужно было ответить на несколько вопросов:
- в какие дни и части дня нагрузка возникает чаще;
- как часто процесс переходит в критическое состояние;
- какие группы факторов чаще сопровождают проблемные интервалы;
- какие показатели стоит вынести в дашборд для регулярного мониторинга.
- подготовил и проверил структуру данных;
- привёл поля к удобному виду для анализа;
- выделил ключевые метрики нагрузки;
- проанализировал интервалы по времени, уровню нагрузки и группам факторов;
- собрал итоговый дашборд в Yandex DataLens;
- сформулировал выводы, ограничения анализа и дальнейшие шаги.
В основе проекта — обезличенная таблица наблюдений, где каждая строка соответствует одному интервалу нагрузки.
Используемые поля:
- день недели;
- часть дня;
- час начала интервала;
- длительность интервала;
- уровень нагрузки;
- группа факторов;
- тема наблюдения;
- краткое описание;
- теги проблемы.
В качестве основных метрик использовал:
- количество интервалов;
- общую длительность нагрузки;
- среднюю длительность интервала;
- долю критических интервалов.
Отдельно сравнивал:
- общую длительность нагрузки по дням недели;
- количество интервалов по дням недели;
- общую длительность нагрузки по части дня;
- длительность нагрузки по уровню нагрузки;
- длительность нагрузки по группам факторов.
По итогам проекта собран дашборд в Yandex DataLens с ключевыми показателями и основными разрезами нагрузки.
Ссылка на дашборд: https://datalens.yandex/ikx785wisv882
- общая длительность нагрузки по дням недели;
- количество интервалов по дням недели;
- общая длительность нагрузки по части дня;
- длительность нагрузки по уровню нагрузки;
- длительность нагрузки по группам факторов.
По итогам анализа удалось:
- выявить, что нагрузка распределена неравномерно и концентрируется в отдельных временных зонах;
- показать, что для оценки процесса важно смотреть не только на общую длительность нагрузки, но и на частоту возникновения интервалов;
- зафиксировать, что заметная часть интервалов относится к критическому уровню нагрузки;
- определить группы факторов, которые чаще сопровождают проблемные периоды и требуют отдельного внимания.
Проведённый анализ позволяет:
- выделить временные зоны повышенной нагрузки;
- понять, какие показатели стоит отслеживать на постоянной основе;
- быстрее замечать проблемные периоды в процессе;
- использовать дашборд как базовую точку для регулярного мониторинга нагрузки.
- данные обезличены и частично агрегированы;
- анализ показывает общие паттерны, но не позволяет точно диагностировать отдельные события;
- проект не доказывает причинно-следственные связи, а отражает повторяющиеся закономерности;
- выводы основаны на журнале наблюдений и укрупнённых категориях.
Если развивать проект как рабочую задачу, следующими шагами могут быть:
- сравнение динамики по неделям;
- отдельный анализ наиболее частых тем наблюдений;
- детализация групп факторов;
- добавление регулярного обновления витрины для мониторинга;
- проверка пересечения высокой длительности и высокой частоты интервалов.
Excel, SQL, Yandex DataLens
