Startseite >> Artikel

Hintergrundinformationen

ODF und Open XML im Vergleich

Seit Anfang Dezember existieren zwei offizielle Standards für digitale (Office-)Dokumente: Das von der International Organization for Standardization (ISO) verabschiedete OpenDocument-Format (ODF) und das von der European Computer Manufacturers Association (Ecma) veröffentlichte Format Office Open XML, nachfolgend kurz "Open XML" genannt. Beide Standards haben sich auf die Fahnen geschrieben, die Interoperabilität zwischen den Anwendungen unterschiedlicher Hersteller zu verbessern. Im Detail unterscheiden sich die beiden Standards jedoch erheblich. Aber welcher der beiden Standards ist für den Unternehmenseinsatz besser geeignet?

Was ist ein Standard?

Um einer Antwort näher zu kommen, ist es hilfreich, den Begriff "Standard" näher zu definieren. Zentrale Frage ist hierbei: Was macht einen guten Standard eigentlich aus?

Das British Standards Institute definiert einen Standard wie folgt:

"Ein Standard ist ein öffentlich zugängliches technisches Dokument, das unter Beteiligung aller interessierter Parteien entwickelt wird und deren Zustimmung findet. Der Standard beruht auf Ergebnissen aus Wissenschaft und Technik und zielt darauf ab, das Gemeinwohl zu fördern." (Übersetzung aus der Enzyklopädie Wikipedia)

Entfernt man sich nun ein wenig von dieser allgemeinen Ebene und wendet sich dem spezielleren Bereich der Informationstechnologie (IT) zu, stellt man fest, dass an einen Standard in diesem Bereich weitere Anforderungen gestellt werden müssen, wenn er von praktischem Nutzen sein soll. Ein sehr gutes Beispiel hierfür sind die international akzeptierten und sehr weit verbreiteten Internet-Standards. Sie regeln so wichtige Bereiche wie die E-Mail-Kommunikation oder das Zusammenspiel von Web-Browser und -Server. Die Internet-Standards sind dem Standardisierungsprozess der Internet Engineering Task Force (IETF) unterworfen, der in dem Dokument RFC 2026 ausführlich beschrieben ist. Dieser Standardisierungsprozess der IETF stellt eine Vielzahl weiterer Anforderungen an ein technisches Dokument bzw. die darin beschriebenen Verfahren, wenn dieses einmal zu einem Internet-Standard erklärt werden soll (notwendige, aber nicht hinreichende Bedingungen).

Eine besonders wichtige Forderung sei an dieser Stelle explizit genannt: Die Forderung nach mindestens zwei unabhängigen und interoperablen Implementierungen des beschriebenen Standards (vgl. Abschnitt 4.1.2 "Draft Standard" im o. g. RFC).

Einen guten Standard zeichnen somit vor allem vier Dinge aus:

  1. Er wird durch ein öffentlich zugängliches, technisches Dokument definiert, das von allen interessierten Parteien gemeinsam entwickelt wurde,
  2. er dient dem allgemeinen Wohl,
  3. es existieren mindestens zwei unabhängige und interoperable Implementierungen von ihm und
  4. der Standardisierungsprozess ist effektiv und praxistauglich.
ODF und Open XML als Standards

Wie sind nun die Standards ODF und Open XML vor diesem Hintergrund zu bewerten? Bei einem Vergleich zwischen den beiden Standards fällt zunächst die unterschiedliche Bedeutung der beteiligten Standardisierungsgremien auf. Die 1961 gegründete Ecma ist ein von Unternehmen ins Leben gerufenes, europäisches Gremium, das international operiert und dem ausschließlich Unternehmen angehören. Viele Standards, welche die Ecma in der Vergangenheit verabschiedet hat, wurden der ISO zur Standardisierung vorlegt. Insgesamt hat die Ecma etwas über 300 Standards verabschiedet; zu rund 200 dieser Standards existiert eine korrespondierende ISO-Norm. Sie spielt damit in einer anderen Klasse, als die ISO, die inzwischen mehr als 16.000 internationale Standards verabschiedet hat und der praktisch jede nationale Normungsorganisation auf der Welt angehört. Das von der Ecma veröffentliche Dokument "Ecma and ISO, a well matched pair of actors: Collaboration for the common good." geht im Abschnitt "Mutually beneficial" (Seite 2) auf Unterschiede zwischen der ISO und der Ecma ein und erläutert kurz die unterschiedlichen Zielsetzungen der beiden Organisationen aus Sicht der Ecma.

Punkt 1 und 2 der o. g. Anforderungen an einen Standard werden somit von dem ISO-Standard ODF wesentlich besser erfüllt, als von dem Ecma-Standard Open XML. Zumal hierbei zwei wichtige Aspekte nicht außer Acht gelassen werden dürfen:

  • Die Firma Microsoft, der Erfinder von Open XML, gehört selbst der OASIS, an – einem internationalen Konsortium, das ODF schon früh verabschiedet und dessen ISO-Zertifizierung voran getrieben hat.
  • Internationale Experten vertreten die Ansicht, dass von ODF keine Patentrisiken ausgehen. Bei Open XML ist dieser Punkt keineswegs geklärt.

Die Bewertung von Punkt 3 geht ebenfalls klar zu Gunsten von ODF aus, weil ODF bereits von mehr als einem Dutzend Anwendungen unterstützt wird. Von Open XML hingegen existiert aktuell nur eine Implementierung und diese stammt vom Erfinder von Open XML. Weitere Implementierungen von Open XML in Form von Import-Filtern sind in Planung (wobei ein Import-Filter natürlich keine vollständige Implementierung darstellt).

Punkt 4 ist schwer zu bewerten. Für die Verfahren der ISO sprechen über 16.000 internationale Standards, darunter so essentielle Normen wie das Qualitätsmanagementsystem nach ISO 9001, das Informationssicherheits-Managementsystems ISO 27001 oder auch die Gewinde-Norm für das metrische ISO-Gewinde, um auch einmal ein Beispiel zu nennen, das nicht einmal indirekt mit der Informationstechnik zu tun hat. Der Standardisierungsprozess der ISO führt somit zu einem praxistauglichen Ergebnis, dass international anerkannt und intensiv genutzt wird. Gleiches kann aber auch der Standardisierungsprozess der Ecma für sich in Anspruch nehmen, denn die Ecma hat selbst sehr wichtige Standards im Bereich der Informationstechnik (IT) verabschiedet, die später internationale Gültigkeit erlangt haben. Zu nennen wäre hier beispielsweise der Standard Ecma-94, der von der ISO als Standard ISO 8859-1 bis -4 verabschiedet wurde. Er definiert die 8-bit-Kodierung der lateinischen Zeichensätze 1-4. Nähere Informationen zu diesem Thema liefert der Artikel ISO-8859 in der deutschsprachigen, freien Enzyklopädie Wikipedia. Der Vergleich endet für Punkt 4 daher unentschieden.

Unterschiedliche Zielsetzungen

Vielleicht jedoch zeigen die im Vorfeld definierten Zielsetzungen für die Entwicklung der beiden Standards noch deutlicher als die obigen Ausführungen, welches Format einem Standard am ehesten gerecht wird:

Auszug aus dem Memento zu Open XML:

Scope
The goal of the Technical Committee is to produce a formal standard for office productivity applications within the Ecma International standards process which is fully compatible with the Office Open XML Formats. The aim is to enable the implementation of the Office Open XML Formats by a wide set of tools and platforms in order to foster interoperability across office productivity applications and with line-of-business systems. The Technical Committee will also be responsible for the ongoing maintenance and evolution of the standard.

Auszug aus der ODF-Charta:

Statement of Purpose
The purpose of this TC is to create an open, XML-based file format specification for office applications.

The resulting file format must meet the following requirements:
1. it must be suitable for office documents containing text, spreadsheets, charts, and graphical documents,
2. it must be compatible with the W3C Extensible Markup Language (XML) v1.0 and W3C Namespaces in XML v1.0 specifications,
3. it must retain high-level information suitable for editing the document,
4. it must be friendly to transformations using XSLT or similar XML-based languages or tools,
5. it should keep the document's content and layout information separate such that they can be processed independently of each other, and
6. it should 'borrow' from similar, existing standards wherever possible and permitted.

Bei der Definition von Open XML ging es also primär darum, einen Standard zu schaffen, der die Kompatibilität zum Open-XML-Format garantiert (vgl. Einleitung). Das Ziel bei der Entwicklung des ODF-Standards war es hingegen, einen offenen (Einleitung), XML-Standard-basierten (Punkt 2) und maximal interoperablen (Punkt 4) Format-Standard für Büroanwendungen (Punkt 1) zu schaffen, der wann immer möglich auf bestehenden Standards aufsetzt (Punkt 6).

Fazit: Geht es um die Schaffung eines Standards für Dokumente – wobei hier die Betonung auf dem Wort "Standard" liegt – ist ODF wesentlich besser geeignet als Open XML. Bleibt die Frage zu klären, wie es um die technische Seite bestellt ist. Wie einfach können Unternehmen ODF bzw. Open XML in eigenen Anwendungen implementieren? Wie leistungsfähig sind die beiden Formate?

Technische Qualität

Das Dokument, das den ODF-Standard beschreibt, umfasst rund 700 Seiten. Es ist damit nicht gerade ein Leichtgewicht und es wird den Firmen, die dieses Format implementieren möchten, sicherlich einige Ressourcen abverlangen. Überdies ist der Standard in vielen Bereichen nicht detailliert genug und lässt zu viel Spielraum für Interpretationen. Allerdings existieren bereits einige Implementierungen – viele davon in Form von Open-Source-Software –, so dass sich diese Schwächen relativieren.

Die Dokumentation, die den Open-XML-Standard beschreibt, darf ruhigen Gewissens als Mammutwerk bezeichnet werden. Allein der vierte Teil (PDF-Datei, rund 35 MB) der Open-XML-Spezifikation mit dem Thema "Markup Language Reference" umfasst über 5.000 Seiten. Was den Aufwand für eine Implementierung betrifft, existiert eine aufschlussreiche Bemerkung von Rick Schaut, einem Entwickler bei Microsoft, dem Unternehmen, das den Open XML-Standard entwickelt hat:

"So, one handler per developer, and, on average, it's fair to assume productivity of one handler per dev per day.

At that rate, a team of 5 developers will implement 25 handlers a week, which means that we'd have all the XML handlers written in 44 weeks. Well, a little more than that, because I've rounded the number of elements down to the nearest 100. Nevertheless, we have taken a little less than a year to get the converters reading the new file format. We still are not writing the new file format, we have the RTF side of things to worry about, which is actually more complex than the XML side, and I have completely left out all of the design and coding for the intermediate representation of the file. The intermediate representation, itself, is at least 6 to 8 months worth of work."

Direkter formuliert bedeutet dies, dass für die Implementierung von Open XML mit einem Gesamtaufwand von rund 20 Personenjahren zu rechnen ist. Aber selbst mit diesem Ressourceneinsatz ist die Implementierung keinesfalls vollständig, denn einige Zeilen später heißt es in dem Dokument:

"[...] This is just for Word. We need additional teams for Excel and PowerPoint [...]."

Derartige Ressourcen stehen manchem Unternehmen, das ODF bereits erfolgreich implementiert hat, überhaupt nicht zur Verfügung. Es darf daher als Tatsache angesehen werden, dass der Implementierungsaufwand von ODF deutlich geringer ist, als dies bei Open XML der Fall ist.

Woraus resultiert aber der enorme Aufwand bei der Implementierung von Open XML? Betrachtet man die Open-XML-Spezifikation näher, stellt man fest, dass Open XML quasi die bestehenden Formate von Microsoft Office bzw. Microsoft Windows kapselt. Es geht bei Open XML also nicht um die Definition eines neuen Standards, sondern um die Beschreibung bislang proprietärer Formate durch öffentliche Dokumentationen. Besonders deutlich wird dies an dem folgenden Abschnitt aus der Open-XML-Spezifikation (Abschnitt 3.17.4.1):

For legacy reasons, an implementation using the 1900 date base system shall treat 1900 as though it was a leap year. [...] A consequence of this is that for dates between January 1 and February 28, WEEKDAY shall return a value for the day immediately prior to the correct day, so that the (nonexistent) date February 29 has a day-of-the-week that immediately follows that of February 28, and immediately precedes that of March 1.[...]

In Kurzform: Der Open-XML-Standard fordert aus "legacy" Gründen eine Änderung der international gültigen Zeitrechnung. Die angesprochenen "legacy reasons" beziehen sich auf einen Fehler in älteren Versionen von Microsoft Excel. Der Standard (!) definiert also eine Ausnahmeregelung für eine konkrete, defekte Implementierung und zwingt alle auf dem Standard basierenden Implementierungen, den Fehler ebenfalls zu berücksichtigen.

Es gibt in dem o. g. Dokument zahlreiche weitere Beispiele, die eindrucksvoll - jedoch sehr technisch - zeigen, dass Open XML vor allem die bestehenden Formate von Microsoft Office kapselt. Der Artikel "A bit about the bit with the bits" von Robert Weir legt beispielsweise dar, wie in Open XML untypische und technisch fragwürdige XML-Definitionen vorgenommen werden, um Notationen aus der Welt von Microsoft Office/Windows gerecht zu werden.

Doch nicht allein das Zuschneiden von Open XML auf Microsoft Office bzw. Microsoft Windows ist ein Grund für den enormen Implementierungsaufwand für dieses Format. Auch der Verzicht auf die Integration bestehender internationaler Standards wie SVG oder MathML zu gunsten eigener Verfahren trägt einen guten Teil dazu bei.

Darüber hinaus müssen sich die Entwickler von Open XML eine weitere, grundsätzliche Frage gefallen lassen: Warum sollten Unternehmen und Privatanwender einen weiteren Standard (Open XML) akzeptieren, wenn bereits ein internationaler ISO-Standard (ODF) existiert, der die gleichen Dinge regelt?

Fazit

Im Gegensatz zu ODF ist Open XML weder aus formaler noch aus technischer Sicht als internationaler Standard gut geeignet. Open XML wird – als zentrales Format in Microsoft Office – sicherlich an Bedeutung gewinnen, die Forderung nach einer möglichst hohen Interoperabilität und Investitionssicherheit kann Open XML jedoch nicht erfüllen. Die Chirado OHG empfiehlt daher allen Kunden den Einsatz des ISO-Formats ODF und wird ODF selbst auch weiterhin standardmäßig für sämtliche Dokumentationsprozesse verwenden.

Picture

Artikel

ODF-und-OpenXML