GNU/LINUX in Zahlen

Von Carsten Schulz
 
Unter dem Titel More than a Gigabuck: Estimating GNU/Linux's Size hat David A. Wheeler eine umfangreiche Untersuchung der GNU/LINUX-Distribution Red Hat 7.1 vorgelegt. Basierend auf einer Ermittlung der dieser Distribution zugrundeliegenden physikalischen Quellcodezeilen ("Physical Source Lines of Code") kommt er dabei zu einer Reihe sehr bemerkenswerter Ergebnisse:

- Die Red Hat 7.1-Distribution enthält insgesamt über 30 Millionen physikalische Quellcodezeilen. Die größten Komponenten sind der Linux Kernel (2,4 Millionen), Mozilla (2 Millionen), das X Window System (1,8 Millionen), gcc und gdb (jeweils ca. 1 Million).
- Die dominierenden Programmiersprachen sind C (71 %) und C++ (15%).
- Auf der Basis des "COCOMO Cost and Effort Estimation Models" lässt sich für die Entwicklung sämtlicher Komponenten der Red Hat 7.1-Distribution ein Entwicklungsaufwand von etwa 8.000 Personenjahren (95.469 Personenmonate) ermitteln. Damit entstünden bei geschlossener (proprietärer) Entwicklung - ausgehend vom heutigen Durchschnittseinkommen eines us-amerikanischen Softwareprogrammierers - Entwicklungskosten in Höhe von weit mehr als einer Milliarde US-Dollar (1.074 Millionen US-Dollar).

Aus juristischer Sicht besonders interessant ist, dass die Studie auch ermittelt, welche Softwarelizenzen dem Code zugrundeliegen: Ganz im Vordergrund steht die Verwendung der GNU General Public License ( GPL ). Mehr als die Hälfte der Quellcodezeilen stehen unter dieser Lizenz (50,36%). Es folgen die LGPL (10,05%), die MIT (9,43%), die BSD- Lizenz (7,56%) und die Mozilla Public License ( MPL ) (6,85%). Der Anteil von Software, die als Public Domain gekennzeichnet ist ("No Copyright"), beläuft sich auf nur 0,2%.

Hintergrund:
Für den schlichten Nutzer einer freien Betriebssystemdistribution gehört die Frage nach den zugrundeliegenden Softwarelizenzen sicherlich zunächst nicht zu den Problemen, die ihn Tag und Nacht beschäftigen oder beschäftigen sollten. Und damit fährt er in der Regel auch ganz richtig: Sämtliche "Freien Softwarelizenzen" (nach dem Verständnis der Free Software Foundation ) bzw. "Open Source Lizenzen" (nach der Open Source Definition ) gestatten es, die Software nach Belieben zu Kopieren und Weiterzugeben. Der Nutzer kann die Software auf so vielen Computern installieren, wie er möchte, und er kann sie jedem zur Verfügung stellen, der diese auch nutzen möchte.

Interessant wird die Frage nach den verwendeten freien Softwarelizenzen allerdings dort, wo bestehende Software weiterentwickelt oder für sonstige Bedürfnisse verändert werden soll. Das Recht, die Software zu modifizieren, gestehen alle freien Softwarelizenzen jedermann zu. Und, um dieses sicherzustellen, gehört es auch zu den grundsätzlichen Voraussetzungen freier Software, dass der Zugang zum (kommentierten) Quellcode sichergestellt wird. Weitreichende Unterschiede bestehen allerdings (unter anderem) in Bezug auf die "Entwicklerpflichten", die im Zusammenhang mit dem Recht auf Modifizierung der Software statuiert werden. Während es die sog. Non-Copyleft-Lizenzen (z.B. MIT/BSD-Style) dem Bearbeiter gestatten, die bearbeitete Software nach Belieben, d.h. auch proprietär, zu vermarkten, knüpfen die sog. Copyleft- Lizenzen (z.B. die GPL, LGPL, unter Einschränkungen auch die MPL) das Bearbeitungsrecht an die Bedingung, die modifizierte Software wiederum ausschließlich unter derselben Lizenz zu verbreiten. Damit wird sichergestellt, dass auch die bearbeiteten Versionen in ununterbrochener Folge wieder uneingeschränkt vervielfältigt, verbreitet und bearbeitet werden dürfen und jedermann Zugang zum modifizierten Quellcode erhalten kann.