A METHOD FOR FRACTAL-DRIVEN REGULARIZATION OF AUTOENCODERS IN SEMI-SUPERVISED MEDICAL IMAGE CLASSIFICATION

Scientific news of KPI, Dec 2025

Background: Medical image classification using deep learning is a critical task, yet its effectiveness is constrained by the scarcity of labeled data, which is expensive to acquire. Semi-supervised learning (SSL) methods address this by leveraging unlabeled data. Common autoencoder (AE)-based approaches use reconstruction as a training signal. However, standard reconstruction loss minimization does not guarantee that the resulting latent space will be optimally structured for the classification task, as the model may focus on diagnostically irrelevant features. Objective: To develop and experimentally validate a novel latent space regularization method: fractal-driven regularization (FDR). The goal is to improve classification metrics for medical images under conditions of severe labeled data scarcity (5%) by integrating fractal dimension (FD) as an additional, a priori training signal. Methods: The proposed model (FDR-AE) is based on an autoencoder architecture, augmented with two heads attached to the latent space: a classification head and a regression head. The regression head is trained to predict the input image's FD, which is pre-calculated using the "box-counting" method. The total loss function is a combination of three components: classification loss (on 5% labeled data) and both reconstruction and fractal regression losses (on 100% of data). The method's efficacy was validated on three datasets of different modalities (ISIC2024, COVID-19 Radiology, Brain Tumor MRI), comparing it against a baseline convolutional network (Base-CNN) and a standard semi-supervised autoencoder (SSL-AE). Results: The experiments demonstrated a consistent advantage for the proposed method. On the ISIC2024 dataset, FDR-AE achieved an F1-Score of 0.508 for the "malignant" class, compared to 0.431 for SSL-AE and 0.304 for Base-CNN. On the COVID-19 dataset, the F1-Score for the "covid19" class was 0.722 for FDR-AE versus 0.695 for SSL-AE. In the 4-class Brain Tumor task, FDR-AE showed improved F1-Scores across all classes, with the most significant gains (+0.079 and +0.054) observed for classes 0 and 3, which also had the greatest mutual statistical difference in their FD values. Conclusions: Fractal-driven regularization demonstrates that FD is a valuable a priori signal for learning higher-quality, structurally-grounded representations in SSL tasks. The method is particularly effective on simple architectures under severe data scarcity. Prospects for future research include using FDR as a pre-training method or implementing a dynamic coefficient for the regression component of the loss function.

Article PDF cannot be displayed. You can download it here:

https://scinews.kpi.ua/article/download/343202/335718

A METHOD FOR FRACTAL-DRIVEN REGULARIZATION OF AUTOENCODERS IN SEMI-SUPERVISED MEDICAL IMAGE CLASSIFICATION

31 СИСТЕМНИЙ АНАЛІЗ ТА НАУКА ПРО ДАНІ DOI: https://doi.org/10.20535/kpisn.2025.4.343202 UDC 004.85.032.26:004.93’1:616(045) О.О. Зарицький1*, В.Я. Данилов1 КПІ ім. Ігоря Сікорського, Київ, Україна 1 Відповідальний автор: * МЕТОД ФРАКТАЛЬНО-КЕРОВАНОЇ РЕГУЛЯРИЗАЦІЇ АВТОЕНКОДЕРІВ ДЛЯ НАПІВКЕРОВАНОГО НАВЧАННЯ В ЗАДАЧАХ КЛАСИФІКАЦІЇ МЕДИЧНИХ ЗОБРАЖЕНЬ Проблематика. Класифікація медичних зображень за допомогою глибокого навчання є критично важливою задачею, однак її ефективність обмежується дефіцитом розмічених даних, збір яких є дорогим. Методи напівкерованого навчання (НН) вирішують цю проблему, залучаючи нерозмічені дані. Поширені підходи, що ґрунтуються на автоенкодерах (АЕ), використовують реконструкцію як навчальний сигнал. Утім, стандартна мінімізація втрат реконструкції не гарантує, що отриманий латентний простір буде оптимально структурований для вирішення завдання класифікації, оскільки модель може фокусуватися на нерелевантних для діагностики ознаках. Мета дослідження. Розробка та експериментальна перевірка нового методу регуляризації латентного простору – фрактально-керованої регуляризації (FDR). Мета полягає у покращенні метричних показників класифікації медичних зображень в умовах гострого дефіциту розмічених даних (5 %) за допомогою інтеграції фрактальної розмірності (ФР) як додаткового, апріорного навчального сигналу. Методика реалізації. Запропонована модель FDR-AE ґрунтується на архітектурі АЕ, доповненій двома повнозв’язними шарами, що приєднані до латентного простору: класифікаційним та регресійним. Регресійний шар навчається прогнозувати ФР вхідного зображення, обчислену заздалегідь методом «box-counting». Загальна функція втрат є комбінацією трьох компонент: втрат класифікації на 5 % розмічених даних і втрат реконструкції та фрактальної регресії на 100 % даних. Ефективність методу перевірено на трьох наборах даних різної модальності (ISIC2024, COVID-19 Radiology, Brain Tumor MRI) порівняно з базовою згортковою мережею Base-CNN і стандартним напівкерованим АЕ SSL-AE. Результати дослідження. Експерименти показали стабільну перевагу запропонованого методу. На датасеті ISIC2024 модель FDR-AE досягла F1-Score 0.508 для класу «malignant» проти 0.431 у SSL-AE та 0.304 у BaseCNN. На датасеті COVID-19, F1-Score для класу «covid19» склав 0.722 для FDR-AE проти 0.695 для SSL-AE. У 4-класовій задачі Brain Tumor модель FDR-AE продемонструвала покращення F1-Score щодо всіх класів, причому найбільший приріст +0.079 та +0.054, відповідно, спостерігався для класів 0 та 3, що мали найбільшу взаємну статистичну відмінність у ФР. Висновки. Фрактально-керована регуляризація доводить, що ФР є цінним апріорним сигналом для навчання більш якісних і структурно обґрунтованих представлень у задачах НН. Метод особливо ефективний на простих архітектурах в умовах сильного дефіциту даних. Перспективи подальших досліджень включають використання FDR як методу попереднього навчання (pre-training) або впровадження динамічного коефіцієнта для регресійного компонента функції втрат. Ключові слова: напівкероване навчання; фрактальна розмірність; автоенкодер; регуляризація латентного простору; медичні зображення; класифікація зображень; box-counting. Вступ Автоматизований аналіз медичних зображень на основі глибоких нейронних мереж є важливим напрямом досліджень, оскільки може допомогти у ранній діагностиці патологій. Однією з основних проблем у впровадженні таких систем є дефіцит розмічених даних, отримання й розмітка яких вимагає висококваліфікованих спеціалістів і суттєвих витрат грошей і часу. Пропозиція для цитування цієї статті: О.О. Зарицький, В.Я. Данилов, “Метод фрактально-керованої регуляризації автоенкодерів для напівкерованого навчання в задачах класифікації медичних зображень”, Наукові вісті КПІ, № 4, с. 31–39, 2025. doi: https://doi.org/10.20535/kpisn.2025.4.343202 Offer a citation for this article: O.O. Zarytskyi, V.Y. Danilov, “A method for fractal-driven regularization of autoencoders in semi-supervised medical image classification”, KPI Science News, no. 4, pp. 31–39, 2025. doi: https://doi. org/10.20535/kpisn.2025.4.343202 © Автор(и). Стаття поширюється на умовах ліцензії CC BY 4.0 32 2025 / 4 KPI Science News Для вирішення цієї проблеми активно розвиваються методи НН, що дають можливість використовувати одночасно розмічені й нерозмічені дані для навчання моделей. Поширеним підходом у НН є використання AE, які вивчають корисні ознаки через задачу реконструкції вхідних зображень. Такий підхід довів свою ефективність у таких методах, як Adversarial Autoencoders та Ladder Networks. Утім, стандартна мінімізація втрат реконструкції не гарантує, що латентний простір моделі буде оптимально структурованим для вирішення завдання класифікації. Наше припущення ґрунтується на тому, що його можна покращити, використовуючи апріорні знання про структуру і складність даних, на яких навчається модель. Постановка задачі Метою цієї роботи є розробка та експериментальна перевірка нового методу НН – FDR. Ми пропонуємо використовувати ФР як додатковий навчальний сигнал для покращення якості латентного простору в задачах НН. Ефективність методу продемонстровано на трьох медичних датасетах в умовах гострого дефіциту розмічених даних (5 % вибірки), де запропонована модель АЕ із фрактальною регуляризацією FDR-AE порівнюється з базовою керованою моделлю BaseCNN і стандартним напівкерованим АЕ SSL-AE. Фрактальна розмірність як класифікаційна ознака у медичних зображеннях Виділення інформативних ознак, що описують складні біологічні структури, є ключовою проблемою під час аналізу медичних зображень. Фрактальна розмірність – це числовий показник, що оцінює структурну складність і нерегулярність об’єкта. Цей показник широко використовують як ключову ознаку в багатьох медичних дослідженнях, оскільки доведено, що ФР корелює з діагностичними станами [1–5]. Наприклад, у нейроонкології ФР корелює з показником агресивності гліобластом [3], а в мамографії доведено чітку кореляцію між злоякісністю утворення та його ФР [5]. Утім, у більшості досліджень ФР використовують як основну ознаку для аналізу. Відповідно, якщо статистичні розподіли значень ФР суттєво накладаються один на одного, – використання цього показника як основного сигналу для класифікації є неможливим. У цьому дослідженні ми пропонуємо метод використання ФР як сигналу для НН (фрактальна регуляри- зація латентного простору мережі) і покажемо, що навіть в разі суттєвого накладання статистичних розподілів ця ознака може суттєво покращувати якість моделі. Вибір та адаптація методу обчислення фрак тальної розмірності Є багато методів обчислення ФР зображень, що адаптовані під різні задачі та структуру самих зображень, зокрема основані на базовому методі box-counting [6–9], морфології об’єкта [10] чи навіть Фур’є-спектра [11–12]. Для цього дослідження було обрано один із найбільш поширених методів визначення ФР: box-counting. Він полягає у накладанні на зображення сіток з різними розмірами комірок r та підрахунку кількості комірок Nr, що (...truncated)


This is a preview of a remote PDF: https://scinews.kpi.ua/article/download/343202/335718
Article home page: https://scinews.kpi.ua/article/view/343202/335718

Oleksii Zarytskyi, Danilov Valerii. A METHOD FOR FRACTAL-DRIVEN REGULARIZATION OF AUTOENCODERS IN SEMI-SUPERVISED MEDICAL IMAGE CLASSIFICATION, Scientific news of KPI, 2025,