Lines of Code

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Lines of Code (kurz LOC; englisch für Code-Zeilen i. S. v. Anzahl der Programmzeilen; engl. source lines of code, SLOC) ist ein Begriff aus der Softwaretechnik. Es handelt sich dabei um eine Softwaremetrik, d. h. eine Maßzahl, um die Größe einer Codebasis eines Computerprogramms oder seines Wachstums zu beschreiben. Die Lines of Code sind im einfachsten Fall die Anzahl der Zeilen des Quelltextes, aus denen das Programm besteht.

Diese Metrik erlaubt keine direkten Aussagen über die Effizienz der Programmierer, denn die Anzahl der Zeilen hängt von unterschiedlichsten Faktoren ab: gewählte Architektur, Erfahrung des Programmierers, gewählte Lösung, Formatierung des Quellcodes, verwendete Programmiersprache usw. Zudem besagt die 80/20-Regel, dass 80 % der Zeilen in 20 % der Zeit geschrieben werden. So kann das gründliche Testen eines Programms sehr viel Zeit in Anspruch nehmen, während die Anzahl geänderter oder ergänzter Programmzeilen nur gering ist.

Üblicherweise rechnet man mit einer Produktivität – inklusive aller Projekttätigkeiten – von 10 bis 50 Codezeilen je Mitarbeiter und Tag. Ein Softwareentwicklungsprojekt mit einem insgesamten Aufwand von 1.000 Personentagen (~ 5 Personenjahre) sollte also zwischen 10.000 und 50.000 Lines of Code produziert haben.[1]

Berechnungsarten[Bearbeiten | Quelltext bearbeiten]

Bei Lines of Code gibt es einige gängige Ausprägungen welche anhand folgenden Beispieles erläutert werden:

1 /* Wie viele Zeilen sind das? */
2 public void ausgabeEinsBisHundert() {
3 
4   for (int i = 1; i <= 100; ++i) {
5     System.out.print(" " + i); //hier die Ausgabe der Zahlen aus der Schleife
6   }
7 }
Lines of Code (LOC)
Auch Physische Lines of Code genannt. Anzahl Zeilen inklusive Leerzeilen und Kommentare. In obigem Beispiel 7. Wird oft stellvertretend für eine der anderen Berechnungsarten genannt.
Source Lines of Code (SLOC)
Anzahl der Codezeilen ohne Leerzeilen und Kommentare. In obigem Beispiel 5.
Comment Lines of Code (CLOC)
Anzahl Kommentarzeilen, wobei nicht definiert ist, ob auch Zeilen mit Code und Kommentare eingerechnet werden. In obigem Beispiel somit 1 oder 2.
Non-Comment Lines of Code (NCLOC)
Auch Non-Comment Source Lines (NCSL) oder Effective Lines of Code (ELOC) genannt. Anzahl der Codezeilen ohne Leerzeilen und Kommentare ohne Header und Footer. Header und Footer sind insbesondere die äußeren öffnenden und schließenden Klammern sowie (auf Klassenebene) Import/Include-Statements und (auf Methodenebene) Methodendeklarationen. Obiges Beispiel hat auf Methodenebene 3, auf Klassenebene 5 NCLOC.
Logical Lines of Code (LLOC)
Auch Number of Statements (NOS) genannt. Zählt die Anzahl der Anweisungen. Wird bspw. bei COCOMO verwendet. In obigem Beispiel 2. In der Programmiersprache C gelten allerdings die Instruktionen in for-Schleifen als eigenständige Anweisung. In C hätte obiges Beispiel also 4 LLOC.

Verwendung[Bearbeiten | Quelltext bearbeiten]

Die meisten Vergleiche von Programmen über die LOC betrachten nur die Größenordnungen der Anzahl Zeilen verschiedener Projekte. Computerprogramme können aus nur wenigen Dutzend bis zu hunderten von Millionen Programmzeilen bestehen. Der Umfang eines Programmes in Codezeilen muss nicht zwangsläufig Rückschlüsse auf die Komplexität oder Funktionalität des Programms erlauben, da die Verwendung externer Frameworks und Programmbibliotheken, die verwendete Programmiersprache und auch die Formatierung des Quelltextes großen Einfluss auf die Codezeilen haben. Insbesondere sind Rückschlüsse auf die investierte Arbeitszeit meistens sinnfrei.

Auch bei Verwendung von Logical Lines of Code (LLOC) hängt das Verständnis, was unter einer Anweisung zu verstehen ist und wie die Komplexität derselben zu beurteilen ist, von der verwendeten Programmiersprache ab. So kann etwa in einem mehrere Bildschirmseiten umfassenden Assembler-Quelltext letztlich das gleiche Programm formuliert sein, wie in einigen wenigen Zeilen einer höheren Programmiersprache.

Abhängig vom Programmierer und den verwendeten Formatierungsrichtlinien kann das obige Beispiel in folgenden, programmtechnisch gesehen vollkommen gleichwertigen Quelltext umformuliert werden:

1 /* Wie viele Zeilen sind das? */
2 public void ausgabeEinsBisHundert() {
3   for (int i = 1; i <= 100; i++) System.out.print(" " + i); // hier die Ausgabe der Zahlen aus der Schleife
4 }

Nun besteht der Quelltext aus vier physischen Codezeilen (LOC), drei SLOC, je nach Berechnung ein bis zwei Comment Lines of Code (CLOC), einem Non-Comment Line of Code (auf Methodenebene) und weiterhin zwei logischen Programmzeilen (LLOC).

Da die hier getätigte Reduktion der Codezeilen die Lesbarkeit reduziert hat, ist die Komplexität des Programmes erhöht worden, was wiederum auf die Produktivität einen negativen Einfluss hat. Weniger Zeilen Code kann somit durchaus höhere Aufwände verursachen.

Die Größe Lines of Code wird u. a. auch zur Berechnung der Fehlerdichte eines Programms verwendet: Je nach Einsatzzweck sollte, auch abhängig von der Programmiersprache,[2] ein bestimmtes Maß an Programmfehlern nicht überschritten werden, z. B. max. 0,5 Fehler je KLOC (= Kilo = 1000 LOC) in militärischen oder Krankenhaussystemen.

Beispiele[Bearbeiten | Quelltext bearbeiten]

Hier sind einige Beispiele für die Anzahl der Zeilen von Programmcode in verschiedenen Betriebssystemen und Anwendungsprogrammen.

Anzahl der Zeilen Programmcode in verschiedenen Betriebssystemen und Programmen
Erscheinungsjahr System SLOC in Mio.
Betriebssystem-Kernel
1983 Multics-Kernel [3]0,25
1994 Linux-Kernel 1.0 (nur i386) < 0,2
1996 Linux-Kernel 2.0 (IA-32, Alpha, MIPS, SPARC) 0,72
1999 Linux-Kernel 2.2 1,7
2001 Linux-Kernel 2.4 3,2
2003 Linux-Kernel 2.6.0 8,1
2005 XNU 792.x (Darwin 8.x bzw. Mac OS X 10.4) [4]2
2011 Linux-Kernel 2.6.39 und 3.0 14,5
2012 Linux-Kernel 3.2 LTS [5]15
2012 Linux-Kernel 3.6 [6]15,9
2015 Linux-Kernel 4.2 [7]> 20
2018 Linux-Kernel 4.15 [8]25,3
ganze Betriebssysteme
FreeBSD 8,8
OpenSolaris 9,7
1993 Windows NT 3.1 [9]4–5
1994 Windows NT 3.5 [9]7–8
1996 Windows NT 4.0 [9]11–12
2000 Debian GNU/Linux 2.2 [10][11]55–59
2000 Windows 2000 [9]> 29
2001 Windows XP [9]40
2002 Debian GNU/Linux 3.0 [11]104
2003 Windows Server 2003 [9]50
2005 Debian GNU/Linux 3.1 [11]215
2005 Mac OS X Tiger (10.4) [12]86
2007 Debian GNU/Linux 4.0 [11]283
2007 Windows Vista [13]50
2009 Debian GNU/Linux 5.0 [11]324
2009 Windows 7 [13]40
Andere Software
1983 Lotus 1-2-3 1.0 [14]0,02
1989 Lotus 1-2-3 3.0 [14]0,4
2007 SAP NetWeaver 2007 [15]238

Literatur[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. Steve McConnell: Code Complete A Practical Handbook of Software Construction. 2. Auflage. Microsoft Press, 2004, ISBN 978-0-7356-1967-8, 20.5 The General Principle of Software Quality, S. 514 (englisch): “The industry-average productivity for a software product is about 10 to 50 of lines of delivered code per person per day (including all non coding overhead).”
  2. Prechelt: SWT2 Kap. 1.5 Messen und Maße. FU Berlin, 1. Oktober 2012, abgerufen am 19. März 2020.
  3. Tom Van Vleck, John Gintell, Joachim Pense, Monte Davidoff, Andi Kleen, Doug Quebbeman, Jerry Saltzer: Multics Myths. (Wiki) In: Multicians. Abgerufen am 21. Mai 2020 (englisch).
  4. Amit Singh: Mac OS X Internals: A Systems Approach. Addison-Wesley Professional, 2006, ISBN 978-0-13-270226-3, 2.4 (online): „The Darwin xnu package consists of roughly a million lines of code, of which about half could be categorized under BSD and a third under Mach. The various kernel extensions, not all of which are needed (or loaded) on a given system, together constitute another million lines of code.“
  5. Greg Kroah-Hartman, Jonathan Corbet, Amanda McPherson: Linux Kernel Development: How Fast it is Going, Who is Doing It, What They are Doing, and Who is Sponsoring It. (PDF; 0,6 MB) Linux Foundation, März 2012, abgerufen am 8. Januar 2013 (englisch).
  6. Thorsten Leemhuis: Die Neuerungen von Linux 3.6. In: Heise online. 1. Oktober 2012. Abgerufen am 2. Mai 2013.
  7. Thorsten Leemhuis: Linux-Kernel durchbricht die 20-Millionen-Zeilen-Marke. In: Heise online. 30. Juni 2015. Abgerufen am 1. Juli 2015.
  8. Thorsten Leemhuis: Die Neuerungen von Linux 4.15. In: Heise online. 12. Februar 2018. S. 9: Ausblick auf 4.16, Umfang der Änderungen & Changelog. Abgerufen am 27. Mai 2020.
  9. a b c d e f How Many Lines of Code in Windows? Knowing.NET, 6. Dezember 2005, abgerufen am 14. Mai 2014 (englisch).
  10. Jesús M. González-Barahona, Miguel A. Ortuño Pérez, Pedro de las Heras Quirós, José Centeno González, Vicente Matellán Olivera: Counting potatoes: the size of Debian 2.2. (Nicht mehr online verfügbar.) 3. Januar 2002, archiviert vom Original am 4. Juli 2008; (englisch).
  11. a b c d e Gregorio Robles: Debian Counting. (Nicht mehr online verfügbar.) Archiviert vom Original am 14. März 2013; (englisch).
  12. Steve Jobs: Live from WWDC 2006: Steve Jobs Keynote. 7. August 2006, abgerufen am 16. Februar 2007 (englisch, Enthält vermutlich auch ein paar Anwendungsprogramme.): „86 million lines of source code that was ported to run on an entirely new architecture with zero hiccups“
  13. a b Mark Wilson: Infographic: How Many Lines Of Code Is Your Favorite App? In: Fast Company magazine online. 7. November 2013, abgerufen am 29. Mai 2020 (englisch): „Windows Vista (2007), for instance, had 50 million lines of code, while Windows 7 shaved that figure down to 40 million.“
  14. a b Detlef Borchers: Vor 30 Jahren: Die erste Killeranwendung. In: Heise online. 28. Januar 2013. Abgerufen am 14. Juni 2020.; Zitat: „Hatte das erste 1-2-3 noch weniger als 20.000 Codezeilen, so kam Version 3 mit 400.000 Zeilen.“.
  15. What SAP says about ABAP’s future. Abgerufen am 20. November 2011 (englisch).