Rob Weir hat in seinem Blog (das es immer wert ist, gelesen zu werden), eine anschauliche und übersichtliche Zeitlinie erstellt, die die Entwicklung von (Office-)Dateiformaten der letzten 10 Jahre zeigt. Gegenüber gestellt sind Microsofts Produkte auf der einen und offene Standards auf der anderen Seite. Jeder Kommentar außer „die Vergangenheit wiederholt sich immer wieder “ erübrigt sich. Liest selbst in A File Format Timeline.
Auch das Open Malaysia Blog hat des öfteren sehr informative Beiträge über Dateiformate (ODF und OOXML) zu bieten. Is VML in or out now, or was that a typo? (wird OOXML mit dem nächsten MS Office wieder über den Haufen geworfen?) und Billions of Documents (über die Marketing-Lüge mit den „Milliarden von binären Office-Dokumenten“) und Day 1, Microsoft Technology Summit 2007 (ein Microsoft-Techniker gibt zu, dass OOXML nie als öffentlicher Standard konzipiert war) sind zum Beispiel solche Artikel.
Und wenn ich schon dabei bin, gibt es noch 2 Aufrufe zum Thema:
Bis OpenOffice.org 3.0 im Herbst 2008 erscheinen soll, werden noch einige größere Projekte fertiggestellt und in OOo 2.x eingebaut. Dazu gehören das neue Diagrammmodul für Calc, der Report-Designer für Base und Notes2 für Writer, das einen einfacheren Umgang mit Notizen ermöglichen soll.
Und was kommt mit OOo 3.0?
Neben den allgemeinen Arbeiten der Entwickler, die OOo 3 schneller, modularer und leichter zu warten machen sollen, gibt es einige große Projekte, die OOo 3.0 besser machen als seine Vorgänger. (Die Liste ist noch nicht fix, und es kann vieles dazukommen oder auch einiges wegfallen bzw. sich auf frühere oder spätere Versionen verschieben.)
- Die Änderungen von OpenDocument (ODF) 1.2 sollen umgesetzt werden, was bessere Zugänglichkeit/Barrierearmut von Dokumenten, bessere Zusammenarbeit mit den neuen MS Office-XML-Dokumenten und bessere Zusammenarbeit mit anderen Programmen gewährleistet, die ebenfalls OpenDocument verwenden. Außerdem gehört der neue Abschnitt über Tabellenkalkulationen zu ODF 1.2 (OpenFormula), der OpenDocument, KOffice und anderen Programmen nun ermöglicht, ein in Dokumentenebene völlig offenes, „interoperables“ und freies Excel-Pendant fertigzustellen. (Ohne die Fehler des Excel-Formats.)
Zum Glück sind es noch anderthalb Jahre bis OOo 3 erscheint, denn die Entwicklung von ODF 1.2 ist die letzten Monate langsamer geworden. Der Erscheinungstermin von ODF 1.2 war im Herbst 2007 angepeilt, was nun wohl nicht mehr realistisch ist. (Warum die Arbeit nicht schneller voran geht ist mir ein Rätsel und ein Ärgernis im Hinblick auf die Konkurrenzsituation mit OOXML. – Mir brennt es in den Fingern, ein ODF-Arbeitsgruppenmitglied dazu zu befragen.) - Das ODF-Toolkit soll anderen Programmen den Umgang mit OpenOffice.org bzw. dem OpenDocument-Format erleichtern.
- Bibliographic enhancements
- Unterstützung für Tabellen im Präsentationsmodul Impress
- Verbesserungen für Impress wie das Anzeigen von Notizen oder von Vorschaubildern der vorherigen und nächsten Seiten während einer Präsentation am Bildschirm des Vortragenden (nicht jedoch am Ausgabegerät für die Zuseher)
- Verbesserungen für Writer wie Vorschau von Hyperlinks innerhalb eines Dokuments oder einen ODF-Metadaten-Editor
- Verbesserungen für Calc wie die GETPIVOTDATA-Funktion oder das oben angesprochene OpenFormula
- Importfilter für MS Office 12 (Das mag nun keine „gute“ [als Gegenteil von „böse“] Neuerung sein – wo bleiben die guten Importfilter von Microsoft für ODF? – ist aber unumgänglich für die Weiterverbreitung von OOo.)
- Verbesserte Verwaltung von Erweiterungen (Extension enhancements)
- Möglicherweise besserer Umgang mit Microsofts VBA
- Verbesserte Integration in Windows Vista wie ein neuer Dateidialog und das Anzeigen von Metadaten im Explorer
Was fehlt?
Bis zum Veröffentlichungstermin von OpenOffice.org 3 werden sicherlich noch viele kleinere und größere Projekte zur Liste der neuen Funktionen/Verbesserungen hinzukommen. Was bisher jedoch fehlt ist – wegen seiner großen Bedeutung – die von den Entwicklern einmal angedachte Verbindung von OOo mit Mozilla Thunderbird (E-Mail) und Mozilla Sunbird/Lightning (Kalender). Mag aber sein, dass dies erst mit OOo 4.0 verwirklicht werden wird, was mehr als schade wäre.
Verfolgen kann man die offizielle Liste unter wiki.services.openoffice.org/wiki/Features.
Gary Edwards denkt in seinem Open Stack-Blog genau richtig: Die Antwort, um das OpenDocument-Format (ODF) weltweit zum Durchbruch zu verhelfen, liegt allein darin, dass Microsoft Office-Anwender und alle Produkte, die mit MS Office zusammenarbeiten, ODF als Standardformat anwenden oder zumindest damit umgehen können.
Dieses Problem wird seiner Meinung nach – und da schließe ich mich an – bisher viel zu wenig aufgegriffen. Mit Konvertern allein ist dies nicht zu schaffen. Erstens sind die Konverter von Microsoft/Novell und Sun zu unzuverlässig, um damit Dokumente zwischen MS Office und anderen Programmen produktiv austauschen zu können. Zweitens bleiben alle Produkte, die auf MS Office aufbauen oder sich daran anschließen, von den Konvertern unberührt – sie erzeugen wieder binäre Microsoft-Dateien oder OOXML-Dateien.
All dies geht die OpenDocument Foundation mutig an, um das Monopol von Microsoft zu brechen. Nicht um des Monopols willen, sondern zum Wohl und der Langlebigkeit des geistiges Eigentums der Dokumenten-Ersteller. (Würde sich Microsoft selbst 100%ig an alle Spezifikationen halten, die es mitentwickelt oder kreiert, wäre dessen Formate-Monopol weniger tragisch. Glaubt jemand eigentlich wirklich, dass OOXML, das Microsoft der Ecma vorgelegt hat, exakt das selbe ist, wie es in MSO 2007 implementiert wurde? Oder dass jemand anderes als Microsoft OOXML vollständig umsetzen kann?)
Die Antworten dafür lauten:
- daVinci ODF-Plugin und
- daVinci InfoSet Engine & API.
Das daVinci ODF-Plugin für Microsoft Office 98-2007 habe ich bereits vorgestellt, ist (angeblich) bereits bei der Verwaltung in Massachusetts als Testversion mit ODF v1.0 im Einsatz und soll mit Hilfe der Erweiterungen von ODF v1.2 noch im Jahr 2007 seine Perfektion und Marktreife erlangen.
InfoSet soll eine vollständige ODF-Konvertierungs- und Darstellungsanwendung werden, an der sich andere Produkte anstöpseln können, um mit ODF einfach arbeiten zu können (ähnlich dem ODF Toolkit Project von OpenOffice.org). Ein Veröffentlichungstermin dafür ist (leider) noch nicht bekannt. Die Arbeiten sind noch im Anfangsstadium.
Probleme mit der endgültigen Version von MS Office 2007
Interessant ist noch die Bemerkung von Gary Edwards, dass das Verhalten gegenüber ZIP-Dateipaketen in der endgültigen Version von MS Office 2007 anders sei als das in vorherigen Beta-Versionen. Microsoft hat anscheinend in letzter Sekunde die Systemeinstellungen so geändert, dass jedes ZIP-Dateipaket (wie ODF und OOXML eines sind) bei Doppelklick automatisch vom Microsoft’schen Konverter umgewandelt und in MS Office 2007 dargestellt wird. Somit werden alle nicht-microsoftschen Konverter (wie daVinci oder der von Sun) übergangen. Dieses Problem auszumerzen verzögert die Entwicklung von daVinci weiter.
Microsoft erklärt ODF und OOXML für Sieger
Vor ein paar Tagen hat Microsoft bzw. OOXML-Mitentwickler Brian Jones beide Dateiformate als Sieger klärt im „Formatekrieg“, nachdem Novell die erste Testversion seines OOXML-Konverters für seine eigene OpenOffice.org-Version veröffentlicht hat. Die Erklärung von Brian Jones finde ich a) witzig (denn noch ist gar nichts endgültig entschieden) und b) erheiternd (denn wenn Microsoft jemand anderen als sich selbst ebenfalls als Sieger bezeichnet anstatt als Verlierer, dann heißt das eigentlich, dass sich Microsoft selbst als (nahen) Verlierer sieht).
Novells Konverter dürfte übrigens auf wenig Gegenliebe in der OpenSource-Welt stoßen, denn er ist genau so schlecht wie der ODF-Konverter von Microsoft und baut auf Mono auf, einer OS-Variante von Microsofts .NET, anstatt das in OpenOffice.org bereits verwendete Java oder andere Techniken zu verwenden.
Das Illinois Center for Information Technology Accessibility stellt auf seiner Website einen Open Document Format (ODF) Accessibility Evaluator zur Verfügung, mit dessen Hilfe das hochgeladene (bis zu 2 MB große) ODF-Dokument auf seine Zugänglichkeit überprüft werden kann.
Das Projekt befindet sich noch im Alpha-Status. Darum werden derzeit nur rudimentäre Eigenschaften geprüft wie Dokumententitel, Kopfzeilen, Alternativtexte für Bilder usw.
Finde ich gut, denn nicht nur Webseiten sollten auf Zugänglichkeit getrimmt werden.
Auf zum Test: Open Document Format (ODF) Accessibility Evaluator
Seit einer Weile wird in einschlägigen Kreisen über Neuerungen in OpenDocument v1.2 diskutiert. (OpenDocument v1.1 mit kleinen Zugänglichkeitsverbesserungen wurde Anfang Februar offiziell von der OASIS verabschiedet.)
Als gröbste Arbeiten gelten
1) das Auslagern des ZIP-Verpackungs-Abschnittes in ein eigenes Dokument (soll die Wartbarkeit erleichtern sowie ermöglichen, dass auch andere Spezifikationen diesen Abschnitt benutzen können wie z.B. von Adobe angedacht für sein Open eBook Publication Structure Container Format, kurz OCF);
2) die Einarbeitung der Ergebnisse des Metadaten-Unterausschusses (subcommittee) der OpenDocument-Arbeitsgruppe (ermöglicht unter anderem eine genauere Beschreibung und insgesamt leichteren Umgang mit fremden, undokumentierten Dateiformatteilen, vor allem in Microsofts Binärformaten) und
3) die Einarbeitung der Ergebnisse des OpenFormula-Unterausschusses der OpenDocument-Arbeitsgruppe (enthält eine vollständige Spezifikation für Tabellenkalkulationen wie Calc oder Excel). Siehe auch David A. Wheelers OpenFormula-Einführung.
4) die Einarbeitung der neuen Ergebnisse des Accessibility-Unterausschusses der OpenDocument-Arbeitsgruppe (der auch schon gute Arbeit an ODF v1.1 gemacht hat).
Die Formelbeschreibungen werden wahrscheinlich in ein eigenes Dokument ausgegliedert. Im Grobentwurf OpenFormula 2005-02-26 wurde diese Auslagerung favorisiert, und der Aufbau der aktuellen OpenFormula-Entwürfe lässt auf eine quasi-eigene, nicht in die OpenDocument-Beschreibung eingearbeitete Spezifikation schließen, die jedoch beide aufeinander verweisen und ergänzen.
Die „kleineren” Arbeiten betreffen verschiedene Element-Formatierungen, die geändert oder hinzugefügt werden sollen. Subtables sollen z.B. missbilligt werden (also in neuen Dokumenten nicht mehr angewendet, da dies in einer späteren Spezifikation gänzlich entfallen könnte), neue Nummerierungselemente sollen hinzukommen sowie page-break/column-break zum bestehenden line-break. Auch gibt es einige Vorschläge, um die Zusammenarbeit mit Microsoft Office-Dateien zu verbessern/erleichtern.
Florian Reuter hat dazu am 20.11.2006 in der Mailingliste einige Vorschläge gemacht: Suggested ODF1.2 items. Am 12.01.2007 gab es einen ersten Zwischenbericht: ODF 1.2 Draft 1.
Außerdem soll mit ODF 1.2 endlich eingeführt werden, dass für eine Anwendung (z.B. OpenOffice.org) unbekannte XML-Teile im Dokument unangetastet bleiben müssen und nicht verändert werden dürfen. Wenn also mit MS Office gespeicherte Daten in OpenOffice.org nicht erkannt werden, werden diese nicht überschrieben und gehen nicht verloren. Sie werden einfach ignoriert und mit MSO kann man damit später wieder weiterarbeiten. (Bei ODF 1.0 und 1.1 steht im betreffenden Spezifikationsabschnitt 1.5 noch „… Conforming applications that read and write documents may preserve foreign elements and attributes. …”) – Im langen Artikel Open Stack: OpenDocument as the perfect Microsoft Office file format steht ein bisschen zu diesem Thema.
Bei OASIS zur Abstimmung gebracht werden soll ODF 1.2 Ende des Sommers 2007.
Bei Anmerkungen zu ODF 1.2 sei die OD Mailingliste empfohlen.
OpenOffice.org fügt Microsoft Office-Funktionen hinzu
Nur nebensächlich für dieses Thema aber wichtig für die Zusammenarbeit mit Microsoft Office ist folgende Bemerkung aus dem GulliFOSS-Weblog: Um Layoutprobleme bei der Umwandlung MSO-Formate <> ODT zu minimieren, werden die in OOo am meisten vermissten oder falsch interpretierten Funktionen aus MSO eingebaut/verbessert. – Wann dies geplant ist, steht jedoch nicht dort. Das könnte (in kleinen Schritten) auf die 2.x-Reihe zutreffen oder (im großen Maßstab) auf das künftige OOo 3.0.
Der Bedarf an einem ODF-Betrachter (Viewer) ist da, wie es die PowerPoint-Viewer und ähnliches von Microsoft gibt. Nicht jeder hat OpenOffice.org installiert oder will es installieren, nur um sich ein paar Dokumente ansehen zu können.
Die Organisation OpenDocument Fellowship arbeitet an einem Viewer für Text-, Tabellenkalulations- und Präsentationsdateien im OpenDocument-Format. Fertiggestellt wird Version 1.0 davon womöglich im Laufe der nächsten Wochen.
Für Microsoft Office Word-Nutzer (für die Versionen XP bis 2007) gibt es bereits 2 benutzbare Konverter, um ODF-Textdokumente anzusehen. Im Feldtest wird sich zeigen, ob der ODF-Viewer oder die Konverter genauer und fehlerfreier arbeiten.
Davon abgesehen, dass es noch keine Konverter für Tabellenkalkulationen und Präsentationen gibt, gibt es (immer noch) einen hohen Bedarf an so einem Viewer auch für Textdokumente. Schließlich sind derzeit Nutzer von MS Office 2000 und älter von der Benutzung der Konverter ausgeschlossen. Da der Viewer das offene XULrummer-Framework von Mozilla nutzt, ist es noch dazu betriebssystemunabhäng.
Für die Zukunft ist die Unterstüzung von ODF-Zeichnungen und Diagrammen geplant, das Anzeigen von Dokumenten in Tabs/Karteireiter sowie der Wechsel auf ein anderes Framework, das noch bessere ODF-Kompatibilität bieten soll. (Siehe die FAQ und den Statusbericht.)
Die aktuelle Beta-Version steht für Linux, Windows und MacOSX zum Herunterladen bereit.
PS: Ein älterer ODF-Viewer basiert auf Java; die Entwicklung scheint aber seit Mitte 2005 eingeschlafen zu sein.
Hinzugefügt am 02. März 2007:
Mit Visioo-Writer gibt es einen weiteren ODF-Viewer, der sich noch in Entwicklung befindet (derzeit 0.6.1); sieht aber optisch schon besser aus als der oben besprochene Viewer.
Allgemein kann ODF-fähige Software (komplette Office-Programme bis hin zu Filtern und Konvertern) können im Wikipedia-Artikel OpenDocument software nachgelesen werden.
Mir sind bis jetzt drei ODF-Konverter für Microsoft Office Word bekannt.
- Microsofts ODF Add-in for Microsoft Word
- Sun Microsystems Sun ODF Plug-in for Microsoft Word
- The daVinci ODF Plugin for Microsoft Office der OpenDocument Foundation
Was ist von ihnen zu halten? Sind sie schon bereit für den Produktiveinsatz? Können Microsoft Office-Nutzer nun ein freies, von einer Firma unabhängiges Dokumentenformat benutzen?
Microsofts ODF Add-in
Der ODF-Konverter (eigentlich ein XSLT-Transformator) von Microsoft steht in der stabilen Version 1.0 zur Verfügung, bis jetzt aber nur für Word. Versionen für Excel und PowerPoint werden im Lauf des Jahres folgen. Was eigentlich ein Pluspunkt für diesen Konverter sein könnte, enttäuscht auf ganzer Linie: Microsoft ist die einzige Firma, die ihre prorpietären Formate vollständig kennt und deshalb am besten in der Lage sein sollte, einen Konverter zu bauen oder finanzieren, der die größtmögliche Interoperabilität bieten kann. Dem ist aber nicht so. Der Konverter ist nicht besser als der durch Reengineering mühsam erarbeitete von OpenOffice.org. Noch dazu lässt sich mit ihm ODF nicht als Standarddateiformat definieren, und speichern und öffnen kann man ODF-Dateien nur über separate Menüpunkte und nicht über die gewöhnlichen und bekannten Dialoge. Man könnte versucht sein zu denken, diese Schikanen wären absichtlich implementiert, um MS Office-Benutzern den Umstieg auf ODF so scheußlich wie möglich zu gestalten.
- Status: fertig
- Version: Word XP/2003/2007
- Umwandlung: fehlerbehaftet
- Benutzerfreundlichkeit: schlecht
- Empfehlung: nicht benutzen
Sun ODF Plug-in
Suns Konverter befindet sich im Beta-Statium und ist derzeit nur für Word verfügbar. Mit ihm wird die ODF-Maschine von OpenOffice.org installiert, die ODF-Dateien öffnet und speichert, quasi ein Teil von OpenOffice.org für Microsoft Office. Der Vorteil dieses Konverters ist die nathtlose Einfügung in die bestehenden Dialoge (Öffnen und Speichern funktioniert wie auch bei .doc-Dateien) sowie die Möglichkeit, ODF als Standardformat in den Optionen einzustellen (siehe Bild unten). Der Nachteil ist (zumindest bei meinem Test mit MSO 2003), dass beim Öffnen und Speichern mit ODF ein Word-Sicherheitswarnmeldung kommt, die man zuvor wegklicken muss. (Wo kann man das eventuell abstellen?)
- Status: Entwicklung
- Version: Word 2003
- Umwandlung: fehlerbehaftet
- Benutzerfreundlichkeit: gut
- Empfehlung: abwarten und hoffen
daVinci ODF Plugin
Der Konverter der OpenDocument Foundation namens daVinci ist noch im Alpha-Statium und frei verfügbar nur in einer Version, die Word-Dokumente in das OpenDocument Foundation-eigene ACME-(RTF-)Format umwandeln kann. Geplant für die endgültige Version ist jedoch die Umwandlung in ODF 1.2, das noch 2007 veröffentlicht und in bekannte Anwendungen wie OpenOffice.org oder KOffice implementiert werden soll. ODF 1.2 deswegen, da diese künftige ODF-Version (und damit deren Anwendungen) mittels neuer Meta-Informationen besser umgehen kann mit „undokumentierten/unbekannten“ binären Abschnitten fremder Formate (wie z.B. alter .doc-Dateien), die keine Entsprechung in ODF haben.
Obwohl dieser Konverter eigentlich noch nicht funktionstüchtig ist, erwarte ich mir außerordentlich viel von ihm: eine fast fehlerfreie Umwandlung DOC/OOXML zu/von ODF (oder dem chinesischen UOF) sowie benutzerfreundliche Einbindung in MS Office. („Perfect file conversion fidelity without disruption, re training, or costly re-engineering …“)
Wie das funktioniert wird auf der Website des Konverters erklärt. Der Trick ist, dass kein fertiges .doc- oder OOXML-Dokument umgewandelt wird, sondern die sogenannte In-Memory-Binary-Representation in Microsoft Office selbst direkt als ODF abgespeichert wird – quasi wie ein natives Dateiformat für MS Office. Sehr spannend!
- Status: Entwicklung
- Version: Word 97/2000/2003
- Umwandlung: weitgehend fehlerfrei
- Benutzerfreundlichkeit: gut
- Empfehlung: abwarten, hoffen und freuen
Man liest ja des öfteren in (Troll-)Foren größerer und kleinerer Online-Zeitschriften, dass die größte Schwäche von OpenDocument (ODF) das Fehlen einer ins Detail ausgearbeiteten Beschreibung von Formeln wäre, wie sie zum Beispiel in Tabellenkalkulationen (Microsoft Office Excel, OpenOffice.org Calc, …) verwendet werden. Diese Aussagen sind im Grunde falsch.
Richtig ist, dass in der Norm ISO/IEC 26300:2006 für OpenDocument v1.0 (und auch v1.1) auf Formeln nur rudimentär eingegangen wird. Falsch ist aber, dass dies ein „Fehler“ der Norm selbst sei und Formelbeschreibungen für ODF komplett fehlen würden.
2004 wurde bereits in der technischen Arbeitsgruppe für OpenDocument über eine genauere Beschreibung von Formeln diskutiert und entschieden, dass es praktikabler sei, dies separat weiter zu verfolgen. Im Februar 2005 wurde der erste Entwurf von OpenFormula veröffentlicht, der von der OpenDocument-Gemeinde unter Führung von David Wheeler und mithilfe von Entwicklern verschiedener Office-Programme entwickelt wurde. Aus diesen Anstrengungen heraus wurde von der OASIS im Februar 2006 offiziell ein Unterausschuss gebildet, der OpenFormula als Untermenge von OpenDocument fertigstellen sollte.
Im Oktober 2006 wurde die Arbeit an den Formelbeschreibungen selbst abgeschlossen, seitdem gibt es nur noch Qualitätstests, Fehlersuche und Vervollständigung der anderen Texte, die für eine Norm notwendig sind.
Es gibt also bereits eine Spezifikation für Formeln in ODF (die in der XML-Sprache MathML geschrieben sind), und sie wird bereits seit gut einem Jahr von den KOffice-Entwicklern Stück für Stück implementiert. Auch bei OpenOffice.org Calc wird an einer OpenFormula-Implementierung gearbeitet. Laut dem OASIS OpenFormula-Unterausschuss werden einige Software-Programme, die mit OpenDocument arbeiten, bei der Fertigstellung von OpenFormular im Lauf des Jahres 2007 den größten Teil der Spezifikation beherrschen können.
Dies mag sich zwar wie ein Trostpflaster anhören, aber gut Ding will eben Weile haben. Und mit OpenFormula gibt es nun bald eine vollständige OpenDocument-Norm, die wirklich offen und frei ist, auf bekannten XML-Standards beruht (SVG, MathML, SMIL, XForms, XLS, …) und bei der es auch technisch wirklich möglich ist, sie vollständig zu implementieren.
Infos:
- About OpenFormula (englisch)
- Formula subcommittee status, David A. Wheeler, Fri, 21 Jul 2006 (englisch)
- OpenDocument – Formula Public Documents (.odt-Dokumente der Spezifikation, englisch)
20.02.2007: Vollständige Überarbeitung des Artikels
Die OpenDocument Foundation (Weblog fr0mat.net) hat hochtrabende Pläne, um das freie Dateiformat OpenDocument (ODF) als Standardformat in Microsofts Office-Paket (MSO) vollständig zu integrieren und so einen reibungslosen Dokumentenaustausch zwischen MSO-Dokumenten (von 1997 bis 2007) und ODF-Dateien zu gewährleisten. Und zwar anders und besser als andere bisherige Konverter.
Es geht um das daVinci ODF Plugin, das sich derzeit noch in der Entwicklung befindet und nur als unvollständige Demo (proof of concept) zur Verfügung steht.
Was soll daVinci leisten?
Vollständige Kompatibilität mit MSO-Formaten (zumindest einen weit höheren Wert als die rund 85%, die OpenOffice.org und andere Konverter schaffen); natürliche Integration in MSO z.B. bei Öffnen- und Speichervorgängen; Möglichkeit, ODF als Standardspeicherformat einzustellen.
Wie soll daVinci das leisten?
Der Trick liegt darin, nicht von außen zu versuchen, bestehende MSO-Format zu entschlüsseln und konvertieren, sondern in MSO selbst ODF als Speicherformat einzubinden. Das geht mit Hilfe der MSO In-Memory-Binary-Representation (IMBR). Damit arbeitet MSO intern und wandelt erst beim Speichern die Dokumente in die bekannten MSO-Formate um. Bei dieser internen Konvertierung klinkt sich das daVinci Plugin ein und leitet die Daten in eine beliebige andere Speicherstruktur um (RTF, ODF, …).
Das aktuelle Demo von daVinci speichert die Daten als XML-kodierte RTF-Dateien mit der Endung ACME. (Dies ist eine Anspielung auf Ecma, der privaten Normungsgesellschaft, die Microsofts Office Open XML im Dezember 2006 als Norm verabschiedet hat.) Diese Dateien können mit dem Plugin in MSO geöffnet und wieder gespeichert werden. Für die endgültige Version wird ODF als Speicherformat verwendet werden.
Ausblick
Leider gibt es keine Angaben, wie weit die Arbeit fortgeschritten ist und wann mit einem funktionierenden Plugin zu rechnen ist. Schafft die OpenDocument Foundation ihre hohen Ziele? Und wenn ja, können sie das Plugin fertigstellen, bevor Microsofts XML-Format den (verbreitungsmäßigen) Sieg über ODF davongetragen hat und das Plugin nicht mehr (so dringend wie heute) benötigt wird?
Und: Wenn sie es schafft, wären Microsofts Aussagen widerlegt, dass eine weitgehend perfekte Konvertierung ihres OOX nach ODF und umgekehrt nicht möglich sei.
Am 5. Februar 2007 läuft eine Kommentarfrist bei der ISO wegen des eingereichten Dokumentenformats OOXML oder EOOXML (Ecma Office Open XML, vormals Microsoft OOXML) ab, das von der Ecma dort eingereicht wurde.
Bis dahin suchen manche nach Widersprüchlichkeiten in diesem Dokumentenformat, damit es nicht von der ISO veröffentlicht und standardisiert wird. (Vergleiche auch meinen vorherigen Artikel OpenDocument v1.1 – und was bringt die Zukunft?)
Ob etwas Wahres daran ist, sei den Profis überlassen zu entscheiden. Hier nun ein paar interessante Links zum Thema, von dem es im Web derzeit sicher wimmelt.
- What is „Contradiction“ of an ISO Standard?
- The Contradictory Nature of OOXML
- Searching for Openness in Microsoft’s OOXML and Finding Contradictions
- EOOXML objections
- EOOXML at JTC-1
Und warum will mancher nicht, dass dieses Dokumentenformat von der ISO verabschiedet wird? Tja, es gibt mehrere Gründe. Technischer Natur wären zum Beispiel, dass OOXML auf viele nicht näher spezifizierte oder proprietäre Techniken verweist oder dass es nicht mit einigen anderen ISO-Normen konform ist (wie ISO 8601 [Representation of dates and times] und ISO 639 [Codes for the Representation of Names and Languages]). Eine Übersicht findet man auf der Webseite EOOXML objections (siehe Link oben).
Politische Gründe für eine Ablehnung liegen daran, dass dieses Dokumentenformat von Microsoft stammt und ODF bereits als ISO 26300 vorliegt – wozu also ein weiteres Format?
Das quelloffene XML-Dokumentenformat OpenDocument v1.1 vom 19. Oktober 2006 bringt ein paar Verbesserungen der Zugänglichkeit, Umformulierungen von uneindeutigen Erklärungen und Schreibfehlerkorrekturen. Die genaue Auflistung findet sich in der OASIS-Spezifikation zu OpenDocument v1.1 im Kapitel G.4.
OpenDocument v1.1-Spezifikation ansehen (Übersicht auf OASIS-Website)
Wieso erwähne ich diese unspektakulären Fakten? Aus zweierlei Gründen. Erstens hoffe ich, dass diese Korrektur der OpenDocument-Spezifikation bald die alte Version v1.0 in allen Anwendungen ersetzt (vor allem in OpenOffice.org; in der aktuellen Version des Büropakets war v1.1 noch nicht verfügbar). Zweitens hoffe ich, dass der Abschluss der Fehlerausbesserung für Version 1 endlich den Weg frei macht für die Entwicklung von OpenDocument v2.0 v1.2.
Wieso eine Weiterentwicklung so wichtig ist? Nun, von einigen Seiten kommt immer wieder der Vorwurf, dass OpenDocument unausgereift und noch unvollständig sei. Ob das stimmt oder nicht, kann ich nicht sagen. Dazu habe ich leider noch keine neutralen Dokumente lesen können, die ein Laie wie ich verstehen kann.
Egal ob und wie sehr es wahr ist, ausbaufähig ist OpenDocument auf alle Fälle.
Vergessen wir einmal den ganzen Streit zwischen Microsoft und IBM/Sun, ob Microsoft nun das Rad wieder neu erfindet anstatt Bestehendes zu verwenden oder ob eine ECMA-Ratifizierung nichts ist zum Vergleich einer Veröffentlichung von OpenDocument durch ISO.
Von einem objektiven Standpunkt aus betrachtet sollte die Arbeit an OpenDocument v2.0 v1.2 vor allem dort ansetzen, wo Microsoft behauptet, dass sein eigens kreiertes Format Office Open XML (OOX) weiter sei als OpenDocument (ODF). Das betrifft wohl vor allem die Speicherung von komplizierteren Tabellenkalkulationen (in MS Office Excel mit OOX bzw. OpenOffice.org Calc mit ODF), die Microsoft-Entwickler wie Brian Jones in ODF für unzureichend halten. Auch gibt es eine Reihe von Formatierungen, die OOX kennt, ODF jedoch nicht (siehe einige Details hierzu in der Dokumentation zu Microsofts unfertigem ODF-Konverter). Diese Unterschiede sind historisch begründet.
OOX tritt die Nachfolge von MS Office-Formaten wie .doc, .xls usw. an. ODF ist der Nachfahre des StarOffice-Formats von Sun. Microsoft ist bestrebt, beim Konvertieren zwischen OOX und seinen alten Formaten keinerlei Informationen einzubüßen, was die Spezifikation natürlich sehr verkompliziert und aufbläht. (Unter anderem deshalb umfasst die OOX-Spezifikation rund 4.000 Seiten, während ODF mit wenigen 700 auskommt. Quelle). Nun rächen sich die Unterschiede in den Formaten zwischen den einzelnen MS Office-Versionen der letzten 10 Jahre.
Einschub: Diese einseitige Verbundenheit mit älteren MS Office-Formaten ist es auch, neben der Abhängigkeit von Microsoft, die mir persönlich OOX weniger offen und zukunftssicher erschenien lässt als ODF, das wirklich offen ist und noch dazu frei. Denn ODF wird von der unabhängigen Organisation OASIS gemacht.
Realistischerweise muss man sagen, dass mit großer Wahrscheinlichkeit OOX das Rennen machen und ODF ein Schattendasein führen wird. Die Verbreitung von MS Office ist einfach zu riesig und die Marktmacht von Microsoft so stark, dass OOX locker zum Hauptdateiformat der westlich geprägten Welt sein wird. (China geht seinen eigenen Weg mit Uniform Office Format (UOF).) Der einzige Vorteil für ODF ist seine Unabhängigkeit und Freiheit, was es speziell für die Wissenschaft, Regierungen und die EU interessant macht, weniger für die meisten Privatleute und Firmen (obwohl gerade Firmen darauf achten sollten, dass ihre Dokumente auch in 20 Jahren noch einfach zu lesen sind).
Das führt mich zum Abschluss dieses Artikels: Warum soll IBM/Sun endlich über seinen engstirnigen Anti-Microsoft-Schatten springen und OpenDocument v2.0 v1.2 Microsoft’sche (sinnvolle) Formatierungen interpretieren können? Damit der Austausch mit OOX-Formaten reibungsloser vonstatten gehen kann und wenigstens diejenigen, die ein wirklich offenes Format benutzen wollen, dies auch wirklich können, ohne zu viele Daten zu verlieren oder Zeit zum Konvertieren zu vergeuden. Denn das Ziel jedes Dateiformats sollte das Wohl des Kunden/des Anwenders und die Langlebigkeit seines geistigen Schaffens sein. Da wir wissen, dass dies nicht Microsofts vorrangiges Ziel ist, sollte dies wenigstens ODF verfolgen – auch für MS Office-Geplagte, die ODF nutzen wollen.
Update
Die Zukunft bringt als nächstes OpenDocument v1.2 und ist für Ende 2007 geplant!