zum Hauptinhalt
Schnipsel von Stasiakten
© Sean Gallup, Getty Images

Maschine setzt zerrissene Akten zusammen: Das vertrackte Stasi-Puzzle

Kurz vor dem Mauerfall zerrissen Mitarbeiter der Stasi Akten in Millionen Schnipsel. Eine Puzzlemaschine soll sie zusammensetzen. Doch ob die Technik effizienter ist als der Mensch, ist fraglich.

Wenn irgendwo auf der Welt ein autoritäres Regime stürzt, läutet bei Bertram Nickolay vom Berliner Fraunhofer-Institut für Produktionsanlagen und Konstruktionstechnik das Telefon. Die neuen Regierungen brauchen ihn, erzählt der Elektrotechniker. Denn sobald ein Machthaber abtritt, vernichten die Geheimdienste massenhaft Papiere über Bespitzelung und Auslandsspionage, die keinesfalls an die Öffentlichkeit gelangen sollen. Meist werden sie nicht fertig, den Zeitgenossen fallen Aktenreste in die Hände.

„Wir sind die Einzigen weltweit, die das Material automatisiert wieder zusammensetzen können“, sagt Nickolay. Sein Team habe eine Puzzlemaschine entwickelt, die derartiges Stückwerk komplettiert und Einblick in die geheimen Aufzeichnungen gibt. Die Wurzeln des Projektes liegen in der deutsch-deutschen Vergangenheit. Kurz vor dem Mauerfall liefen in den Stasi-Kreisdienststellen und Bezirksverwaltungen die Schredder heiß. Die Mitarbeiter zerrissen die Papiere. Es blieben schätzungsweise 600 Millionen Schnipsel, manche so klein wie Briefmarken, andere so groß wie eine Postkarte. Die Maschine soll sie zusammenfügen. Denn in den Akten vermutet man Zeugnisse über besonders brisante Machenschaften des DDR-Regimes.

Wer Nickolay zuhört, gewinnt den Eindruck, dass die Puzzlemaschine auf Hochtouren läuft. Kein Vorhaben der Fraunhofer-Gesellschaft steht stärker im Fokus der Politik und ist über die Landesgrenzen hinaus so bekannt. Aber wenn man genauer nachforscht, verliert das Bild seinen Glanz. Wäre das Puzzle womöglich schneller und preiswerter von Hand gelöst?

9000 Teams versuchten, fünf Dokumente elektronisch zu rekonstruieren

Mitarbeiter der Stasi-Unterlagenbehörde und des Bundesamtes für Migration und Flüchtlinge in Zirndorf kleben bereits seit 1993 zerrissene Seiten zusammen. Die rekonstruierten Blätter haben entscheidende Beweise geliefert. Trainer und Ärzte mussten Schadensersatz wegen Dopings zahlen. Der Theologe und einstmalige Direktor der Humboldt-Universität Berlin, Heinrich Fink, wurde als inoffizieller Mitarbeiter des Ministeriums für Staatssicherheit entlarvt. Er musste seinen Posten räumen.

Nickolay liest in den neunziger Jahren in der Zeitung, dass die Beamten die Schnipsel von Hand kleben. Er ist überzeugt, dass das mit dem Computer schneller und billiger geht. Nach und nach kann er Politiker für seine Idee gewinnen. Klaus Peter Willsch – CDU-Politiker, Mitglied im Haushaltsausschuss und bis 2010 zugleich im Senat der Fraunhofer-Gesellschaft vertreten – setzt sich für das Projekt ein. Von Hand werde die Rekonstruktion der Akten noch 375 Jahre dauern, greift die CDU/CSU-Fraktion Nickolays Argumente auf. Elektronisch sei es in fünf bis zehn Jahren erledigt. Der Bundestag stellt schließlich die erforderlichen Mittel bereit. Knapp sechs Millionen Euro sollen dafür ausgegeben werden. 2007 startet das Projekt. Binnen 18 Monaten sollen zunächst 400 Säcke mit geschätzten 16 Millionen Schnipseln abgearbeitet sein. Niemand ahnt damals, dass es viel länger dauern wird.

Dabei gab es Anlass zur Skepsis. Im Jahr 2011 veranstaltete die Darpa, die Forschungsbehörde des amerikanischen Verteidigungsministeriums, einen Wettbewerb: Fünf Dokumente, die jeweils maschinell in 20 bis 6222 Teile zerschreddert waren, sollten elektronisch zusammengesetzt werden. Über 9000 Forscherteams traten an. Aber kein einziges Computerprogramm war in der Lage, die fünf Seiten ohne menschliche Hilfe zu vervollständigen. Wie kann dann die Fraunhofer-Crew viele zigtausend Blätter bewältigen?

Die Leute denken, der Computer kann das auf Knopfdruck

„Die Leute auf der Straße denken, der Computer kann das auf Knopfdruck. Ein völliger Irrglaube“, sagt Matthias Prandtstetter vom Österreichischen Institut für Technologie in Wien. In seiner Doktorarbeit hat der Informatiker sich mit dem Puzzeln von zerrissenen oder geschredderten Unterlagen befasst. Das menschliche Gehirn schließt aus Farbvarianten und dem Textinhalt auf einem Schnipsel auf das Aussehen des fehlenden Teils. Der Computer ist in dieser Hinsicht blind. Er muss alle Teile, auch jene, die augenscheinlich nicht passen, virtuell aneinandersetzen. Dann kann er ausrechnen, ob beide ein Paar ergeben oder nicht. „Das gleicht einem Rundreiseproblem. Wenn ich zehn Städte besuchen möchte, habe ich für die Reihenfolge mehr als eine Million Möglichkeiten. Genauso viele Möglichkeiten gibt es, zehn Schnipsel zu kombinieren“, sagt er. Bei einigen Dutzend Schnipseln sei das noch zu bewältigen. Bei Millionen komme man auf keinen grünen Zweig.

Dass geht nur, indem man die Menge der infrage kommenden Puzzleteile massiv reduziert. Und dazu braucht es den Menschen. Man kann beispielsweise vermuten, dass Schnipsel, die in einem Sack beisammenliegen, zusammengehören und nur unter diesen Nachbarn nach passenden Puzzleteilen suchen. Es ist eine Annahme, die nicht stimmen muss. Denn niemand weiß, wie die Stasi-Mitarbeiter in der Hast die Schnipsel in die Säcke stopften. Vielleicht verteilten sie diese absichtlich auf viele Säcke. Vielleicht fiel die Hälfte daneben. Aber die Annahme, Zusammenliegendes gehöre zusammen, macht das Puzzle für den Computer besser beherrschbar.

Die Maschine ist ein Assistenzsystem, kein Automat

Genauso geht die Stasi-Puzzle-Crew vor. Die Mitarbeiter der Stasiunterlagenbehörde entnehmen die Papiere Schicht für Schicht aus den Säcken, ohne die 1000 bis 2500 Teile zu vermengen. Die Schnipsel werden dann nach Farbe, Papierart und Beschriftung vorsortiert, damit das Computerprogramm nicht alle erdenklichen Teile gegeneinanderlegen muss, sondern nur eine kleine Auswahl. „Die Puzzlemaschine ist definitiv kein Trichter, in den man die Schnipsel hineinwirft und unten kommen ganze Seiten heraus“, sagt Juliane Schütterle, Historikerin in der Berliner Stasi-Unterlagenbehörde, die die virtuelle Rekonstruktion organisiert.

Es entstehen gewaltige Datenmengen

Vier Mitarbeiter in zwei Schichten scannen nach Auskunft des Fraunhofer-Instituts Schnipsel von Hand ein. Nachdem diese digitalisiert sind, kommt das Computerprogramm des Fraunhofer-Instituts zum Zug: der „e-Puzzler“, das eigentliche Herzstück des Projektes. Die Software erfasst zunächst wie der Mensch Farbe, Schrift, Kontur und Art des Papiers. Ähnliche Schnipsel werden zu Familien gruppiert. Suchraumreduktion nennt sich dieser wichtige Schritt der Vereinfachung, weil das Programm zunächst nur innerhalb dieser Familie nach passenden Teilen fahndet.

Die Aktenstücke werden gescannt
Mühsam. Bevor die Puzzlemaschine loslegen kann, müssen die Schnipsel von Hand sortiert und gescannt werden.
© Fraunhofer IPK

Der Wirtschaftsinformatiker Robert Zimmermann veranschaulicht die Funktionsweise an einem Demonstrator, die eigentliche Puzzlemaschine darf die Autorin nicht sehen. Zimmermann klickt am Bildschirm auf ein digitalisiertes grünes Stück Papier. „Das kann ich jetzt vervollständigen“, sagt er. Die Software sucht dafür in rund 30 gescannten Papieren ein und derselben Schicht nach passenden Teilen – nicht etwa in allen 600 Millionen Schnipseln. Im nächsten Schritt wählt Zimmermann als Kriterium die Hintergrundfarbe „grün“ aus. 16 Schnipsel gefunden, meldet der Computer. Zimmermann engt die Auswahl auf das Merkmal „handbeschriftet“ ein. Die Zahl der Treffer sinkt auf 8. Das Puzzeln kann beginnen. Anhand der Kontur setzt der Computer zwei grüne Papierstücke zu einer Karteikarte zusammen. Der Riss verläuft durch drei Zeilen Text. „Erste konkrete Hinweise zum Au“ – an dieser Stelle ist das Papier durchtrennt – „fenthaltsort“, setzt sich der Satz auf der anderen Hälfte fort.

Nur wenn das Computerprogramm nichts findet, erweitert es die Suche schichtweise auf den ganzen Sack. Da sich jeder Schnipsel in Form, Farbe und anderen Merkmalen unterscheidet, entstehen gewaltige Datenmengen, wenn es nun abgleicht, ob je zwei Schnipsel zusammenpassen. Ein gewöhnlicher PC wäre damit überfordert. Deshalb läuft die Software auf drei Servern, jeder zweieinhalb Meter hoch, mit einer Speicherkapazität von insgesamt 200 Terabyte.

„Die meisten Großprojekte verzögern sich“

Lange rechnet das Programm, wenn die Seiten in winzige Teile zerrissen sind. „Über 60 Stücke waren der Gipfel“, sagt Zimmermann. Grundsätzlich könne die Software bis zu 10 000 Schnipsel verarbeiten, teilt sein Vorgesetzter Jan Schneider später mit. Der e-Puzzler macht allerdings nur Vorschläge. Er ist ein Assistenzsystem, kein Automat. Mitarbeiter der Stasi-Unterlagenbehörde überprüfen die Treffer. Am Ende entscheidet also der Mensch.

Aus gutem Grund. Rund 10 bis 20 Prozent der Vorschläge des Computers liegen daneben. Gerade bei stoßweise zerrissenen Blättern, die zu identisch geformten Schnipseln geführt haben, tut sich das Programm schwer. Es kann beispielsweise kaum erkennen, was Vorder- und Rückseite ist. Ein weiteres Problem: Zwei Teile müssten theoretisch wie Schlüssel und Schloss exakt ineinanderpassen. Aber beim Reißen von mehreren Lagen Papier entsteht eine breite Risskante. Da der Scanner diese nur schlecht erfasst, kann das Programm solche Dokumente nur mit Mühe zusammensetzen.

Eigentlich sollte es Zimmermanns Job gar nicht mehr geben. Doch der e-Puzzler arbeitet erst seit 2013, der ursprüngliche Zeitplan ist Makulatur. Das Fraunhofer-Team hofft zwar, dass sich der Puzzleprozess immer weiter beschleunigt. Schließlich sei die Software selbstlernend. Aber: „Die meisten Großprojekte verzögern sich. Das sehen wir doch beim Flughafen“, sagt die Historikerin Schütterle. Gegenüber dem Bundestag schreibt man vom Fachkräftemangel, von Software- und Scannerproblemen. Im Interview ist der Scanner „die eigentliche Bremse“. Denn die Schnipsel müssen von Hand eingelegt und wieder entnommen werden. Das DDR-Papier sei von schlechter Qualität und alt. Der Scanner müsse daher mehrmals am Tag vom Staub befreit werden.

Die Fakten sprechen nicht für den elektronischen Puzzleprozess

Das Puzzleteam entwickelt nun einen eigenen Scanner, der nochmals zwei Millionen Euro kosten soll. In einem Video sieht man, wovon die Fraunhofer-Forscher träumen. Schnipsel rieseln aus einem Sack auf ein Förderband. Ein schmales Rohr saugt sie einen nach dem anderen an und legt sie einzeln auf einem Glasträger ab, der dann automatisch in den Scanner läuft. Keine Menschenseele hilft beim Digitalisieren.

Mittlerweile gebe es ein Scanmodul. Es sei zwar noch nicht mit Stasischnipseln geprüft worden, solle aber dafür verwendet werden, sagt Schneider. Wann wird es soweit sein? Und wann werden die versprochenen 400 Säcke endlich lesbare Akten sein? Frühestens 2016, teilte man dem Bundestag vor zwei Jahren mit. Im Interview sagt der Fraunhofer-Projektleiter Jan Schneider: „Ich bin schon länger davon abgekommen, Termine zu nennen.“ Er wirkt ernüchtert. Die Bundesregierung glaubt trotz der Schwierigkeiten, dass das Vorhaben „erfolgreich abgeschlossen wird“. Schütterle ist unsicher, ob die Maschine dem Menschen überlegen ist: „Das werden wir sehen.“

Die Fakten sprechen bisher nicht für den elektronischen Puzzleprozess. Einst versprach man, die Kosten der manuellen Rekonstruktion zu senken, denn das neue Verfahren sei schneller und benötige weniger Personal. Aktuell arbeiten rund 27 Projektmitarbeiter an dem virtuellen Puzzle. Die manuelle Rekonstruktion läuft mit zehn Mitarbeitern weiter. Die Handarbeiter haben immerhin 500 Säcke in über 20 Jahren geschafft. Die Mannschaft des elektronischen Puzzles hofft, dass sie aufholen kann, sobald die Technik komplett fertig ist. Im Moment steht sie aber bei elf Säcken nach acht Jahren.

Zur Startseite