Beyond Balance: Addressing class imbalance in fine-tuning deep learners

Moritz Mock; Thomas Borsani; Giuseppe Di Fatta; Barbara Russo

doi:10.1016/j.scico.2026.103474

Back

Beyond Balance: Addressing class imbalance in fine-tuning deep learners

Journal article

Open access

Peer reviewed

Beyond Balance: Addressing class imbalance in fine-tuning deep learners

Moritz Mock, Thomas Borsani, Giuseppe Di Fatta and Barbara Russo

Science of Computer Programming, Vol.253, pp.1-10

253

2026

DOI: https://doi.org/10.1016/j.scico.2026.103474

Handle:

https://hdl.handle.net/10863/51446

Abstract

Code Comment Classification

Imbalanced data

Loss-Weighting

Deep Learner

Datasets often contain heavily underrepresented classes. Class imbalance biases models toward frequent classes, reducing performance on rare but important categories; in-process strategies such as loss-weighting remain under-explored for software engineering artefacts. We investigate loss-weighting functions for code comment classification and package our methods into Beyond Balance, a reusable implementation offering multiple weighting strategies for Transformer- and Sentence-Transformer–based models. Loss weighting consistently improves F1 performance across datasets, demonstrating an effective and easily adoptable imbalance-handling technique through Beyond Balance.

Files and links (2)

pdf

1-s2.0-S0167642326000407-main4.02 MBDownload View

Open Access

url

https://www.sciencedirect.com/science/article/pii/S0167642326000407?via%3DihubView

Details

Title: Beyond Balance: Addressing class imbalance in fine-tuning deep learners
Creators: Moritz Mock - Free University of Bozen-Bolzano
Thomas Borsani - Free University of Bozen-Bolzano
Giuseppe Di Fatta - Free University of Bozen-Bolzano
Barbara Russo - Free University of Bozen-Bolzano
Publication Details: Science of Computer Programming, Vol.253, pp.1-10
ISSN: 0167-6423
EISSN: 1872-7964
Series / Volume: 253
Publisher: Elsevier
Number of pages: 10
Identifiers: (UNIBZ)94196148
991007295446601241
Scopus ID: 2-s2.0-105035340419
Copyright: Published by Elsevier B.V. This is an open access article under the CC BY-NC-ND license (http://creativecommons.org/licenses/by-nc-nd/4.0/).
Academic Unit: Faculty of Engineering
Language: English
Resource Type: Journal article
Author Names String: Mock M, Borsani T, Di Fatta G, Russo B

Metrics

1 Record Views