1. Прогнозирование наработки на отказ нефтедобывающего оборудования

  • Категория: Прогнозные системы
  • Клиент: Газпром нефть
  • Дата: 2018

Разработать методику прогнозирования средней наработки на отказ (СНО) внутрискважинного оборудования и планирования межремонтного периода (МРП) работы скважин, а также систему определения технического предела работы оборудования в скважине. Общая задача: Создание системы прогнозирования средней наработки на отказ (СНО) оборудования по группе заданных параметров.

Функция распределения

Постановка задачи

Используемые признаки входных данных, описывающих нефтедобывающие скважины

  • Численные: 'Напор', 'Глубина спуска', 'Произв.', Q ж (режим)', Q н (режим)', '% воды (режим)', ' H дин (режим)', Pзаб(режим), Pпр(режим)
  • Категориальные (полная бинаризация ): 'Причина (предыдущая остановка)', 'Принадлежность', 'Подрядчик ЭПУ', 'Тип насоса', 'Режим работы', 'ЭЦН, завод изготовитель', 'Протектор, завод изготовитель', 'ПЭД, завод изготовитель', 'Кабель, завод изготовитель‘

Целевой признак: наработка на отказ (в днях) '

Проблема: много пропущенных данных

Начальная обработка входных данных

Используемые признаки дополнительных таблиц:

  • Используются только данные по насосам
  • Численные ::'Номинал Q', ' Левая зона', 'Правая зона', 'Номинал F', 'Q', ' Н', ' Мощн ', 'КПД
  • Категориальные (полная бинаризация): 'VENDOR', 'TYPERU', 'TYPEFGN'

Использованный классификатор: Catboost

Результат после начальной обработки (SMAPE): 0.734

Двухпараметрическое распределение Вейбулла

Нормальное распределение является частным случаем двухпараметрического распределения Вейбулла, которое описывает наработку до отказа с учетом коэффициента k, характеризующую изменение интенсивности отказов во времени.

Добавление признаков распределения Вейбулла по месторождениям

  • Для каждого месторождения обучающей выборки по целевому признаку (НнО) автоматически рассчитываются параметры распределения Вейбулла (коэффициент формы, матожидание, дисперсия)
  • Указанные параметры добавляются, в зависимости от месторождения, в обучающую и тестовую выборки.

Результат с признаками Вейбулла (SMAPE): 0.732

Результат после настройки параметров catboost (SMAPE): 0.726

2. Прогнозная система отказа тяговыхэлектродвигателей электровозов 2ЭС6

  • Категория: Прогнозные системы
  • Клиент: Синара Транспортные Машины
  • Дата: 2019

Разработанные модели позволяют делать следующие прогнозы:

  • Прогноз вероятности отказа в течении в среднем 36 часов непрерывной работы через 1 день от даты прогноза с использованием данных за 6 дней до даты прогноза
  • То же, через 7 дней с использованием данных за 7 дней
  • То же, через 14 дней с использованием данных за 16 дней
  • То же, через 30 дней с использованием данных за 30 дней

В процессе анализа предоставленных данных, были обнаружены следующие особенности, влияющие на конечные результаты прогнозов

  • Фрагментация данных
  • Выбросы в данных
  • Шумы
  • Смещение выборки в сторону отказов

Ниже представлены метрики roc-auc оценки качества моделей прогноза:

  • Прогноз через 1 день: roc-auc: 0.75
  • Прогноз через 7 дней: roc-auc: 0.7
  • Прогноз через 14 дней: roc-auc: 0.65
  • Прогноз через 30 дней: roc-auc: 0.6

3. Система прогнозирования останова при производстве пероксидноймарки

  • Категория: Прогнозные системы
  • Клиент: Сибур
  • Дата: 2019

При производстве пероксидной марки полипропилена последний этап заключается в нарезке гранулята. Бывает так, что на ножи начинают налипать агломераты в результате ножи начинают отъезжать от фильеры, процесс деградирует и происходит останов оборудования. Это большие потери для производства. Процесс деградации косвенно можно отследить по наличию агломератов на вибросите. На базе данных телеметрии (за год), по а также данным по остановам экструдера разработать систему предсказывающая останов.

Общая задача: использовать эти данные для разработки и развертывания прогнозной системы, способной предвидеть отключения оборудования.

В рамках пилотного проекта мы успешно реализовали LSTM (Long Short-Term Memory) and GRU (Gated Recurrent Unit) модели.

Результаты (LSTM):

  • Training Accuracy = 0.97
  • Test Accuracy = 0.89

Результаты (GRU):

  • Accuracy = 1.000
  • Test Accuracy = 0.87

Эти результаты могут быть дополнительно улучшены за счет постоянного сотрудничества со специалистами в предметной области и внедрения более совершенных методов предварительной обработки данных.