Die Studie untersucht Korrelationen zwischen 81 Variablen, die den Softwareentwicklungsprozess beschreiben, und der Einführung von Fehlern in den Quellcode. Dadurch ermöglicht sie eine umfassende empirische Analyse potenzieller Zusammenhänge und ebnet den Weg für zukünftige Arbeiten, die kausale Ursachen von Fehlern erforschen.
Für die Durchführung der Studie wurde ein neuer Datensatz erstellt. Dieser umfasst 71 Commits, die Bugs eingeführt haben (basierend auf einem manuell validierten Datensatz von Rodriguez-Perez et al. 2020), sowie eine Kontrollgruppe aus 71 Commits ohne Bugs. Viele der 81 Variablen wurden dabei manuell kodiert.
Die Ergebnisse der Studie beinhalten ein Framework, das logische Variablengruppen und deren Beziehungen nutzt, um Bereiche im Entwicklungsprozess zu identifizieren, in denen intermediäre Effekte und Störfaktoren auf die Einführung von Fehlern vermutet werden. Die Analyse zeigt, dass Softwareentwicklungspraktiken während der Entwicklung fehlerverursachender Änderungen voneinander abhängig sind und Störfaktoren entsprechend berücksichtigt werden müssen.
Der Link unten führt zum Pre-Print des Papers.