NEURAL NETWORK AUTOENCODER MODEL FOR FORMING REDUCED VECTOR CHARACTERISTICS OF ECG SIGNALS

Bulletin of Kyiv Polytechnic Institute. Instrument making series, Jun 2025

The paper considers the actual problem of improving neural network models for the classification of cardiovascular pathologies by compressing the information contained in electrocardiographic (ECG) signals. Due to the active implementation of artificial intelligence in medical diagnostics, the study focuses on creating a reduced ECG feature vector that allows for a significant reduction in training data volume without losing important diagnostic information. The research is dedicated to the development of an autoencoder model with a specialized architecture that combines convolutional and fully connected layers, attention layers, residual connections, and a symmetric structure with shared weights. This approach enables not only to compress the input multichannel signal but also to form a latent space from which the signal can be restored or used as a feature vector for classification. In the proposed autoencoder architecture, the latent representation is combined with the layer weight vector into a single reduced vector that contains information about both the shape and the structural features of the ECG signal. The model was trained using a composite loss function, which allows for balancing between signal reconstruction quality and classification accuracy. To evaluate the model, several alternative dimensionality reduction methods were used, including downsampling, transformation to Frank's orthogonal leads, calculation of a resultant vector, and principal component analysis (PCA). A number of alternative dimensionality reduction methods were used to test the model: reduction of the sampling frequency; transformation to Frank orthogonal derivations; calculation of the resulting vector; principal component analysis (PCA). All methods were tested on the PTB-XL dataset, which contains 12-lead ECG recordings with a wide range of cardiovascular pathologies. The effectiveness of the reduced feature vector was assessed using two models—a convolutional neural network (EcgNet) and a fully connected network with two hidden layers. The analysis of the results showed that, on average, classification accuracy using the reduced vector decreased by only 2% for EcgNet and increased by 3–6% for the fully connected network, indicating preservation of diagnostic information even with a high compression ratio of 25. In contrast, traditional dimensionality reduction methods such as PCA and orthogonal transformation showed a significant deterioration in classification quality (up to –16%). While downsampling to 75 Hz significantly reduces data volume, it also leads to the loss of high-frequency information critical for detecting ischemia and arrhythmias. Particular attention is given to ventricular and atrial late potentials, which are low-amplitude and high-frequency in nature. The constructed reduced feature vector preserved the informative characteristics of these classes, resulting in improved classification accuracy compared to traditional dimensionality reduction methods. Thus, the developed reduced feature vector demonstrates the ability to retain diagnostic information under significant ECG data compression, achieving a balance between computational efficiency, classification accuracy, and application versatility. The obtained results suggest that the use of the proposed reduced feature vector may serve as a promising solution for compact and efficient systems for automated ECG analysis, particularly in mobile or computing-limited systems, while also enabling faster development and testing of new neural network models for diagnostics.

Article PDF cannot be displayed. You can download it here:

https://visnykpb.kpi.ua/article/download/331920/322714

NEURAL NETWORK AUTOENCODER MODEL FOR FORMING REDUCED VECTOR CHARACTERISTICS OF ECG SIGNALS

ISSN (e) 2663-3450, ISSN (p) 0321-2211 Прилади і системи біомедичних технологій 10.20535/1970.69(1).2025.331920 УДК 616.12-073.7 DOI: МОДЕЛЬ НЕЙРОМЕРЕЖЕВОГО АВТОЕНКОДЕРА ДЛЯ ФОРМУВАННЯ СКОРОЧЕНИХ ВЕКТОРІВ ОЗНАК ЕКГ СИГНАЛІВ Мневець А.В., Іванушкіна Н. Г. Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Київ, Україна E-mail: , У статті розглянута актуальна проблема вдосконалення моделей нейронних мереж для класифікації серцево-судинних патологій шляхом стиснення інформації, яка міститься в електрокардіографічних (ЕКГ) сигналах. Через активне впровадження штучного інтелекту в медичну діагностику в роботі зосереджено увагу на створенні скороченого вектора ознак ЕКГ сигналів, що дозволяє зменшити обсяг тренувальних даних без втрати важливої інформації. Дослідження присвячено розробці моделі автоенкодера зі спеціалізованою архітектурою, яка поєднує згорткові та повнозв’язні шари, шари уваги, залишкові зв’язки та симетричну структуру зі спільними вагами. Такий підхід дозволяє не лише стискати вхідний багатоканальний сигнал, але й формувати латентний простір, з якого можна відновити сигнал або використовувати його як вектор ознак для класифікації. В архітектурі моделі автоенкодера виконано поєднання латентного представлення та вектору вагових коєфіцієнтів шарів у єдиний скорочений вектор, що одночасно містить інформацію як про форму, так і про структуру ознак ЕКГ сигналу. Навчання моделі відбувалося з використанням комбінованої функції втрат, яка дозволяє балансувати між якістю реконструкції сигналу та точністю класифікації. Для тестування моделі було використано низку альтернативних методів скорочення розмірності: зниження частоти дискретизації; перетворення до ортогональних відведень Франка; обчислення результуючого вектора; метод головних компонент (PCA). Усі методи були протестовані на базі даних PTB-XL, яка містить 12-канальні ЕКГ-записи з широким спектром патологій. Для оцінки єфективності скороченого вектора ознак застосовано дві моделі – згорткову нейронну мережу EcgNet і повнозв’язну мережу з двома прихованими шарами. Аналіз результатів показав, що в середньому точність класифікації з використанням скороченого вектора знижується лише на 2 % для EcgNet і збільшується на 3–6 % для повнозв’язної мережі, що свідчить про збереження діагностичної інформації навіть у разі значного коєфіцієнту стиснення сигналу зі значенням 25. Водночас, традиційні методи зменшення розмірності, такі як PCA або переведення в ортогональну систему відведень, демонструють суттєве погіршення якості класифікації (до –16 %). Зменшення частоти дискретизації до 75 Гц хоча дозволяє суттєво знизити обсяг даних, однак, також веде до втрати високочастотної інформації, критичної для виявлення ішемій та аритмій. Окрему увагу приділено пізнім потенціалам шлуночків (ППШ) та передсердь (ППП), що мають низькоамплітудну і високочастотну природу. Сформований скорочений вектор ознак забезпечив збереження інформативних характеристик цих класів, що відобразилось у підвищенні точності їх класифікації порівняно з традиційними методами зменшення розмірності. З огляду на це, розроблений скорочений вектор ознак демонструє здатність до збереження діагностичної інформації за умов суттєвого зменшення розмірності даних ЕКГ, що дозволяє досягти балансу між обчислювальною єфективністю, точністю класифікації та універсальністю застосування. Отримані результати свідчать про те, що використання запропонованого скороченого вектора ознак може бути перспективним рішенням для компактних і продуктивних систем автоматизованого аналізу ЕКГ, в мобільних, або обмежених за обчислювальними ресурсами системах, а також дає можливість пришвидшити розробку та тестування нових нейромережевих моделей для діагностики. Ключові слова: електрокардіографія; автоенкодер; пізні потенціали шлуночків; пізні потенціали передсердь; стиснення даних. Вступ Штучні нейронні мережі (НМ) широко впроваджуються в різні галузі медицини, зокрема для обробки біомедичних сигналів і зображень. Вони демонструють високі результати діагностики під час аналізу радіологічних знімків, електроенцефалограм та електрокардіограм, а також під час виявлення небезпечних для життя кардіологічних станів [1]. Такі результати зумовлені здатністю НМ ефективно узагальнювати інформацію та працювати з необробленими даними, мінімізуючи необхідність проєкту- вання ознак. Сучасні архітектури НМ реалізують механізми автоматичного виділення релевантних ознак, що дозволяє зосередитися на підготовці якісних навчальних вибірок і вдосконаленні нейромережевих архітектур [2]. Крім того, сучасні мережі оснащені засобами контролю перенавчання, зокрема спеціалізованими функціями втрат, які дозволяють регулювати співвідношення хибнопозитивних і хибнонегативних рішень, а також впливати на розподіл вихідних значень застосовуючи різноманітні шари активації [3]. Вісник КПІ. Серія ПРИЛАДОБУДУВАННЯ, Вип. 69(1), 2025 93 ISSN (e) 2663-3450, ISSN (p) 0321-2211 Прилади і системи біомедичних технологій Архітектурні рішення, такі як механізми уваги, рекурентні блоки, довга короткочасна пам’ять (Long Short-Term Memory, LSTM) чи блок керованої рекурентної мережі (Gated Recurrent Unit, GRU), забезпечують обробку часових залежностей та реалізують механізми внутрішньої пам’яті, що підвищує стійкість моделі до варіативності вхідних даних [4]. В свою чергу, механізм уваги дає змогу моделі акцентувати обчислювальні ресурси на ділянках сигналу з найбільшою кількістю діагностичної інформації, а рекурентні структури ефективно фіксують довготривалі часові патерни. Штучні НМ особливо перспективні для задач класифікації біомедичних сигналів, зокрема ЕКГ, що характеризуються складною структурою та великою кількістю можливих патологій. Традиційне формування векторів ознак для кожної патології потребує високої точності виділення ключових елементів кардіоциклу, що складно реалізувати в умовах клінічної практики. Натомість НМ здатна створювати внутрішній набір ознак у процесі навчання, що спрощує її розробку та підтримку. Однак, аналіз повнорозмірних ЕКГ-сигналів, особливо багатоканальних, вимагає значних обчислювальних ресурсів. На відміну від вектора зі 100 обчислених ознак, повноцінна 12-канальна ЕКГ містить тисячі відліків, кожен з яких має потенційне діагностичне значення. Наприклад, діагностика задньо-базальної ішемії потребує аналізу відведень V7–V9, а гіпертрофія правого шлуночка – V1–V3. Як наслідок, зменшення кількості каналів або частоти дискретизації може призводити до втрати критичної інформації. З метою зменшення обчислювального навантаження під час тренування та використання НМ застосовуються різні методи зменшення розмірності даних. Найпростішим методом є зниження частоти дискретизації, однак такий підхід супроводжується втратою високочастотних компонентів, які можуть містити ознаки ішемії, аритмій або порушень провідності [5]. Використання згорткових шарів дозволяє скорочувати розмірність вхідного сигналу шляхом навчання фільтрів, що виявляють локальні пат (...truncated)


This is a preview of a remote PDF: https://visnykpb.kpi.ua/article/download/331920/322714
Article home page: https://visnykpb.kpi.ua/article/view/331920/322714

Антон Мневець, Наталія Іванушкіна. NEURAL NETWORK AUTOENCODER MODEL FOR FORMING REDUCED VECTOR CHARACTERISTICS OF ECG SIGNALS, Bulletin of Kyiv Polytechnic Institute. Instrument making series, 2025, pp. 93-105,