Intelligent system for petroleum product quality estimation based on ensemble machine learning methods

Technical sciences and technologies, Mar 2026

The efficiency of catalytic reforming units with continuous catalyst regeneration (CCR) significantly depends on the availability of real-time product quality information. However, key quality indicators, including the research octane number (RON) and liquid product yield are determined by laboratory methods with a periodicity of 2 to 8 hours, creating a significant delay in the control loop. The problem addressed in this study is the lack of a comprehensive approach to building an intelligent quality estimation system that combines high prediction accuracy with automatic adaptation to process changes and reliability assessment of predictions. The purpose of this article is to develop an intelligent system for real-time quality estimation of catalytic reforming products based on ensemble machine learning methods with online adaptation and prediction uncertainty quantification mechanisms. The Random Forest method was selected for soft sensor construction based on a comparative analysis of six methods (linear regression, PLS, decision tree, RF, Gradient Boosting, and LSTM). The soft sensor for RON prediction achieves MAE of 0.41 points with R² = 0.974. Although LSTM and Gradient Boosting showed slightly better accuracy metrics, RF was chosen due to its built-in uncertainty quantification and simpler incremental adaptation mechanism. An incremental online adaptation mechanism was implemented through the addition of new decision trees trained on updated data with simultaneous removal of the oldest trees. The uncertainty quantification mechanism based on the distribution of tree predictions enables the detection of abnormal operating modes. Verification within a nonlinear model predictive control (NMPC) loop with an economic objective function confirmed the system effectiveness: RON variation reduction by 57% compared to PID control, settling time reduction by a factor of 2.8, and maximum deviation reduction under disturbances by 63%. The adaptation mechanism maintains MAE at only 33% above the initial level during catalyst deactivation, compared to 430% degradation without adaptation. The economic effect for a 1.5 million tons per year unit amounts to approximately 2.7 million USD per year.

Article PDF cannot be displayed. You can download it here:

https://tst.stu.cn.ua/article/download/353960/340415

Intelligent system for petroleum product quality estimation based on ensemble machine learning methods

ТЕХНІЧНІ НАУКИ ТА ТЕХНОЛОГІЇ № 1(43), 2026 TECHNICAL SCIENCES AND TECHNOLOGIES DOI: https://doi.org/10.25140/2411-5363-2026-1(43)-45-57 УДК 004.852:665.63 Сергій Михайлович Ткачук1, Вадим Валерійович Бондар2 1аспірант кафедри технічних та програмних засобів автоматизації Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського» (Київ, Україна) E-mail: . ORCID: https://orcid.org/0009-0002-4013-8875 2аспірант кафедри технічних та програмних засобів автоматизації Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського» (Київ, Україна) E-mail: . ORCID: https://orcid.org/0009-0000-3320-4550 ІНТЕЛЕКТУАЛЬНА СИСТЕМА ОЦІНЮВАННЯ ЯКОСТІ НАФТОПРОДУКТІВ НА ОСНОВІ АНСАМБЛЕВИХ МЕТОДІВ МАШИННОГО НАВЧАННЯ Розроблено інтелектуальну систему оцінювання якості продукції каталітичного риформінгу в реальному часі на основі ансамблевих методів машинного навчання. Систему побудовано із застосуванням методу Random Forest, що забезпечує прогнозування октанового числа риформату із середньою абсолютною похибкою 0,41 пункту та коефіцієнтом детермінації R² = 0,974. Для підвищення адекватності порівняння додатково залучено глибоку нейронну мережу LSTM. Реалізовано механізм інкрементальної онлайн-адаптації моделі та квантифікації невизначеності прогнозів для детекції аномальних режимів роботи. Інтеграція розробленої системи в контур нелінійного предиктивного управління забезпечує зниження варіації октанового числа на 57 % та скорочення часу перехідних процесів у 2,8 раза порівняно з традиційним PID-управлінням. Ключові слова: soft-сенсор; оцінювання якості; Random Forest; нейронні мережі; онлайн-адаптація; каталітичний риформінг; предиктивне управління; ансамблеві методи; LSTM. Рис.: 3. Табл.: 5. Бібл.: 12. Актуальність теми дослідження. Каталітичний риформінг є одним із ключових процесів нафтопереробної промисловості, що забезпечує виробництво високооктанових компонентів автомобільного бензину та водню для процесів гідроочищення [1]. В умовах четвертої промислової революції (Industry 4.0) цифровізація нафтопереробних виробництв та впровадження концепції цифрових двійників ставлять нові вимоги до оперативності та точності вимірювання якості продукції. Установки каталітичного риформінгу з безперервною регенерацією каталізатора (Continuous Catalytic Reforming, CCR) є найбільш прогресивним типом установок, що дозволяють підтримувати високу активність каталізатора та забезпечувати стабільну якість продукції протягом тривалого періоду експлуатації [2]. Ефективне управління якістю продукції на установках CCR потребує оперативної інформації про октанове число риформату та вихід рідкого продукту. Проте ці показники визначаються лабораторними методами з періодичністю 2–8 годин, що створює значну затримку в контурі управління [3]. Поточні аналізатори на основі інфрачервоної спектроскопії або хроматографії потребують регулярного калібрування та мають обмежену надійність в умовах промислової експлуатації. Це суттєво обмежує можливості реалізації стратегій оптимального управління в реальному часі та призводить до підвищеної варіабельності якості продукції, перевитрат енергоресурсів та неоптимального використання каталізатора. Перспективним вирішенням цієї проблеми є застосування soft-сенсорів (програмних сенсорів, віртуальних аналізаторів) — математичних моделей, що забезпечують оцінку важковимірюваних показників якості на основі легкодоступних вимірювань технологічних параметрів [4]. На відміну від апаратних аналізаторів, soft-сенсори не потребують спеціального обладнання, проте їх точність залежить від якості математичної моделі, а їх деградація з часом внаслідок дрейфу характеристик процесу є серйозною проблемою для промислової експлуатації [5]. За даними досліджень, значна частка впроваджених softсенсорів втрачає прийнятну точність протягом першого року без регулярного перенавчання, що зумовлює актуальність розробки адаптивних механізмів. © С. М. Ткачук, В. В. Бондар, 2026 ТЕХНІЧНІ НАУКИ ТА ТЕХНОЛОГІЇ № 1(43), 2026 TECHNICAL SCIENCES AND TECHNOLOGIES Постановка проблеми. Процес каталітичного риформінгу є складним нелінійним багатовимірним об’єктом управління з багатомасштабною динамікою: постійні часу контурів якості становлять 25–45 хвилин, транспортні затримки — 30–60 хвилин, а динаміка дезактивації каталізатора розвивається протягом сотень годин [2]. Нелінійність процесу обумовлена експоненційною залежністю швидкостей реакцій від температури та складними кінетичними механізмами каталітичних перетворень. Основна проблема полягає у відсутності комплексного підходу до побудови інтелектуальної системи оцінювання якості, що поєднує високу точність прогнозування з можливістю автоматичної адаптації до змін процесу та оцінкою надійності прогнозів. Існуючі рішення на основі лінійних методів не забезпечують необхідної точності при суттєвих змінах режиму, а нейромережеві soft-сенсори потребують складної процедури перенавчання при дрейфі характеристик. Аналіз останніх досліджень і публікацій. Проблемі розробки soft-сенсорів для промислових процесів присвячено значну кількість наукових праць. Комплексний огляд softсенсорів для моніторингу, управління та оптимізації наведено в [3], де систематизовано основні підходи: від лінійних методів до глибокого навчання. Лінійні методи – метод головних компонент (PCA), проєкція на латентні структури (PLS) – залишаються базовим інструментом завдяки простоті інтерпретації, проте мають обмежену точність для нелінійних процесів. Роль штучного інтелекту в розвитку soft-сенсорів для сталого промислового виробництва проаналізовано в [4], де показано переваги data-driven підходів над фізичними моделями для складних процесів. Ансамблеві методи — Random Forest (RF), Gradient Boosting (XGBoost, LightGBM) — поєднують прогнози кількох базових моделей для підвищення точності та робастності. Сучасні модифікації RF, зокрема з покращеним відбором ознак та адаптивними стратегіями, продемонстровано в [7]. Підходи на основі графових нейронних мереж (GCN) для побудови soft-сенсорів запропоновано в [6], що дозволяє моделювати складні кореляції між змінними. Гібридні моделі з адаптивними механізмами набувають все більшого поширення: у [8] розроблено глибоку гаусівську змішану адаптивну мережу з механізмом калібрування для компенсації дрейфу процесу. Проблема адаптації soft-сенсорів до дрейфу характеристик процесу (concept drift) досліджується у [9], де систематизовано методи адаптації в рамках глибокого навчання. Проблему трансферного навчання та переносимості soft-сенсорів між різними установками розглянуто в [5]. Квантифікація невизначеності прогнозів ML-моделей, зокрема через ансамблювання та баєсівські підходи, проаналізовано у [10]. Питанням інтеграції ML-моделей з нелінійним предиктивним управлінням для хімічних процесів присвячено роботу [12]. Виділення недосліджених частин загальної проблеми. Проведений аналіз показав, що існуючі дослідження мають такі обмеження. По-перше, більшість soft-сенсорів (...truncated)


This is a preview of a remote PDF: https://tst.stu.cn.ua/article/download/353960/340415
Article home page: https://tst.stu.cn.ua/article/view/353960/340415

Ткачук Сергій, Вадим Бондар. Intelligent system for petroleum product quality estimation based on ensemble machine learning methods, Technical sciences and technologies, 2026,