A METHOD FOR FRACTAL-DRIVEN REGULARIZATION OF AUTOENCODERS IN SEMI-SUPERVISED MEDICAL IMAGE CLASSIFICATION
31
СИСТЕМНИЙ АНАЛІЗ ТА НАУКА ПРО ДАНІ
DOI: https://doi.org/10.20535/kpisn.2025.4.343202
UDC 004.85.032.26:004.93’1:616(045)
О.О. Зарицький1*, В.Я. Данилов1
КПІ ім. Ігоря Сікорського, Київ, Україна
1
Відповідальний автор:
*
МЕТОД ФРАКТАЛЬНО-КЕРОВАНОЇ РЕГУЛЯРИЗАЦІЇ АВТОЕНКОДЕРІВ
ДЛЯ НАПІВКЕРОВАНОГО НАВЧАННЯ В ЗАДАЧАХ КЛАСИФІКАЦІЇ
МЕДИЧНИХ ЗОБРАЖЕНЬ
Проблематика. Класифікація медичних зображень за допомогою глибокого навчання є критично важливою
задачею, однак її ефективність обмежується дефіцитом розмічених даних, збір яких є дорогим. Методи
напівкерованого навчання (НН) вирішують цю проблему, залучаючи нерозмічені дані. Поширені підходи, що
ґрунтуються на автоенкодерах (АЕ), використовують реконструкцію як навчальний сигнал. Утім, стандартна
мінімізація втрат реконструкції не гарантує, що отриманий латентний простір буде оптимально структурований
для вирішення завдання класифікації, оскільки модель може фокусуватися на нерелевантних для діагностики
ознаках.
Мета дослідження. Розробка та експериментальна перевірка нового методу регуляризації латентного простору –
фрактально-керованої регуляризації (FDR). Мета полягає у покращенні метричних показників класифікації
медичних зображень в умовах гострого дефіциту розмічених даних (5 %) за допомогою інтеграції фрактальної
розмірності (ФР) як додаткового, апріорного навчального сигналу.
Методика реалізації. Запропонована модель FDR-AE ґрунтується на архітектурі АЕ, доповненій двома
повнозв’язними шарами, що приєднані до латентного простору: класифікаційним та регресійним. Регресійний
шар навчається прогнозувати ФР вхідного зображення, обчислену заздалегідь методом «box-counting».
Загальна функція втрат є комбінацією трьох компонент: втрат класифікації на 5 % розмічених даних і втрат
реконструкції та фрактальної регресії на 100 % даних. Ефективність методу перевірено на трьох наборах
даних різної модальності (ISIC2024, COVID-19 Radiology, Brain Tumor MRI) порівняно з базовою згортковою
мережею Base-CNN і стандартним напівкерованим АЕ SSL-AE.
Результати дослідження. Експерименти показали стабільну перевагу запропонованого методу. На датасеті
ISIC2024 модель FDR-AE досягла F1-Score 0.508 для класу «malignant» проти 0.431 у SSL-AE та 0.304 у BaseCNN. На датасеті COVID-19, F1-Score для класу «covid19» склав 0.722 для FDR-AE проти 0.695 для SSL-AE.
У 4-класовій задачі Brain Tumor модель FDR-AE продемонструвала покращення F1-Score щодо всіх класів,
причому найбільший приріст +0.079 та +0.054, відповідно, спостерігався для класів 0 та 3, що мали найбільшу
взаємну статистичну відмінність у ФР.
Висновки. Фрактально-керована регуляризація доводить, що ФР є цінним апріорним сигналом для навчання
більш якісних і структурно обґрунтованих представлень у задачах НН. Метод особливо ефективний на простих
архітектурах в умовах сильного дефіциту даних. Перспективи подальших досліджень включають використання
FDR як методу попереднього навчання (pre-training) або впровадження динамічного коефіцієнта для
регресійного компонента функції втрат.
Ключові слова: напівкероване навчання; фрактальна розмірність; автоенкодер; регуляризація латентного
простору; медичні зображення; класифікація зображень; box-counting.
Вступ
Автоматизований аналіз медичних зображень на основі глибоких нейронних мереж є
важливим напрямом досліджень, оскільки може
допомогти у ранній діагностиці патологій. Однією з основних проблем у впровадженні таких
систем є дефіцит розмічених даних, отримання
й розмітка яких вимагає висококваліфікованих
спеціалістів і суттєвих витрат грошей і часу.
Пропозиція для цитування цієї статті: О.О. Зарицький, В.Я. Данилов, “Метод фрактально-керованої регуляризації автоенкодерів для напівкерованого навчання в задачах класифікації медичних зображень”, Наукові
вісті КПІ, № 4, с. 31–39, 2025. doi: https://doi.org/10.20535/kpisn.2025.4.343202
Offer a citation for this article: O.O. Zarytskyi, V.Y. Danilov, “A method for fractal-driven regularization of autoencoders in semi-supervised medical image classification”, KPI Science News, no. 4, pp. 31–39, 2025. doi: https://doi.
org/10.20535/kpisn.2025.4.343202
© Автор(и).
Стаття поширюється на умовах ліцензії CC BY 4.0
32
2025 / 4
KPI Science News
Для вирішення цієї проблеми активно розвиваються методи НН, що дають можливість використовувати одночасно розмічені й нерозмічені
дані для навчання моделей.
Поширеним підходом у НН є використання AE, які вивчають корисні ознаки через задачу реконструкції вхідних зображень. Такий
підхід довів свою ефективність у таких методах,
як Adversarial Autoencoders та Ladder Networks.
Утім, стандартна мінімізація втрат реконструкції не гарантує, що латентний простір моделі
буде оптимально структурованим для вирішення
завдання класифікації. Наше припущення ґрунтується на тому, що його можна покращити,
використовуючи апріорні знання про структуру
і складність даних, на яких навчається модель.
Постановка задачі
Метою цієї роботи є розробка та експериментальна перевірка нового методу НН – FDR.
Ми пропонуємо використовувати ФР як додатковий навчальний сигнал для покращення якості
латентного простору в задачах НН. Ефективність
методу продемонстровано на трьох медичних датасетах в умовах гострого дефіциту розмічених
даних (5 % вибірки), де запропонована модель
АЕ із фрактальною регуляризацією FDR-AE порівнюється з базовою керованою моделлю BaseCNN і стандартним напівкерованим АЕ SSL-AE.
Фрактальна розмірність як класифікаційна
ознака у медичних зображеннях
Виділення інформативних ознак, що описують складні біологічні структури, є ключовою
проблемою під час аналізу медичних зображень.
Фрактальна розмірність – це числовий показник,
що оцінює структурну складність і нерегулярність об’єкта. Цей показник широко використовують як ключову ознаку в багатьох медичних
дослідженнях, оскільки доведено, що ФР корелює з діагностичними станами [1–5]. Наприклад,
у нейроонкології ФР корелює з показником агресивності гліобластом [3], а в мамографії доведено чітку кореляцію між злоякісністю утворення
та його ФР [5]. Утім, у більшості досліджень ФР
використовують як основну ознаку для аналізу.
Відповідно, якщо статистичні розподіли значень
ФР суттєво накладаються один на одного, – використання цього показника як основного сигналу для класифікації є неможливим. У цьому
дослідженні ми пропонуємо метод використання
ФР як сигналу для НН (фрактальна регуляри-
зація латентного простору мережі) і покажемо,
що навіть в разі суттєвого накладання статистичних розподілів ця ознака може суттєво покращувати якість моделі.
Вибір та адаптація методу обчислення фрак
тальної розмірності
Є багато методів обчислення ФР зображень, що адаптовані під різні задачі та структуру
самих зображень, зокрема основані на базовому
методі box-counting [6–9], морфології об’єкта
[10] чи навіть Фур’є-спектра [11–12]. Для цього
дослідження було обрано один із найбільш поширених методів визначення ФР: box-counting.
Він полягає у накладанні на зображення сіток
з різними розмірами комірок r та підрахунку
кількості комірок Nr, що (...truncated)