Vorstufe: Rohfassung

Da der gescannt vorliegende Schriftenbestand des Bernd-Alois-Zimmermann-Archivs der Akademie der Künste in Berlin im ersten Schritt einen OCR-Prozess durchlaufen hat, liegen diese Texte, die den größten Teil des zu transkribierenden Materials ausmachen, in einem vorläufigen Zustand bereits als TEI-Dokumente vor.

Diese maschinell erzeugten Dokumente können aufgrund der zu erwartenden Fehlerquote noch nicht als Ausgangsmaterial für die Edition dienen. Ziel der Vorstufe ist daher, den Text der jeweiligen Quelle herzustellen, der nach Annahme aller auf den eigentlichen Text bezogenen Eintragungen und Korrekturen des Autors zu lesen ist. Dabei erfolgt keine explizite Auszeichnung der (handschriftlichen) Überarbeitungen sowie keine Übernahme typographischer Eigenheiten. Es handelt sich bei dieser Stufe um eine möglichst reduzierte Codierung. Auf diese Weise werden die Schriften bereits in einem frühen Stadium der Editionsarbeit für erste Recherchen innerhalb des Projekts der Zimmermann-Gesamtausgabe zur Verfügung gestellt.

Folgende Aufgaben sind zu erledigen:
  • Der Faksimile-Baum ist anzulegen, die vorhandenen Bilddateien sind zu integrieren (s. Kap. Faksimile).
  • Ausgezeichnet werden die Textstrukturen (s. die Kap. Grundstruktur des Textkörpers für Schriften; Seitenumbruch; Leere, fehlende, nicht editionsrelevante Seiten; Auslassungen; Überschrift und Autor:innenangabe; Zeilenumbrüche; Trennlinien und Zierleisten; Fußnoten; Mehrspaltensatz).
  • Hervorhebungen des Textes wie Unterstreichung, Einrückung, farbige Markierung, Sperrdruck, Majuskel- und Minuskelschrift werden nicht übernommen.
  • Anführungszeichen werden nicht codiert, sondern mit shift+2 (doppelte Anführungszeichen) bzw. shift+# (einfache Anführungszeichen) abgeschrieben (s. Kap. Anführungszeichen).
  • Trennstriche beim Zeilenumbruch werden codiert (s. Kap. Zeilenumbrüche).
  • Zwischen Bis-/Gedankenstrichen und Binde-/Ergänzungsstrichen wird nicht unterschieden, sondern generell das Bindestrich-Minus-Zeichen (normale Tastaturbelegung, Unicode-Zeichen -) verwendet. Dieses Zeichen bleibt für Binde- und Ergänzungsstriche auch in den nächsten Editionsstufen erhalten.
  • Folgende Vereinheitlichungen werden stillschweigend vorgenommen (s. Kap. Stillschweigende Normalisierungen):
    • Fallen Buchstaben aus der Zeile (Anschlag zu hoch oder zu tief), wird dies nicht dokumentiert.
    • Doppelte Leerschritte werden zu einem Leerschritt vereinheitlicht.
    • Die Laufweite von Leerschritten wird nicht transkribiert, sondern standardisiert wiedergegeben.
  • Bei nicht und nicht sicher lesbaren Stellen werden unabhängig von der tatsächlich betroffenen Zeichenanzahl drei Auslassungspunkte (Mac-Tastatur: alt+. oder Unicode-Zeichen …) in eckigen Klammern gesetzt: […] (s. Kap. Unsichere Lesarten und verlorener Text).
  • In Typoskripten verwendete Ersatzzeichen werden durch das eigentlich gemeinte Zeichen ersetzt mit einem entsprechenden Hinweis in der Editorial Practices Declaration (s. Kap. Encoding Description).
  • Ein nachträglich eingetragenes Korrekturzeichen zur Trennung zweier Wörter wird in einen Leerschritt aufgelöst (in sich statt in\sich).
Basisangaben im Header:
  • Titel und Autor des Textes sowie Mitarbeiter und Mitarbeiterinnen der Edition (s. Kap. Title Statement)
  • Die Orte für Angaben zur Edition und Publikationsinformationen werden nur angelegt, aber nicht ausgefüllt (s. die Kap. Edition Statement; Publication Statement).
  • Hinweis auf die Zugehörigkeit zur Schriftenedition (s. Kap. Series Statement)
  • Angabe von Fundort, Titel, Incipit und Maßen der Quelle sowie stichpunktartige Beschreibung der Quelle bzw. bibliographische Angaben bei Drucken (s. Kap. Source Description)
  • Verweis auf die Editionsrichtlinien, bei einem Typoskript gegebenenfalls auch Hinweis auf die Verwendung von Ersatzzeichen (s. Kap. Encoding Description)
  • Der Ort zur formalisierten Angabe des Entstehungsdatums des Textes wird angelegt, aber nicht ausgefüllt (s. Kap. Profile Description).
  • Angabe der Hauptsprache und der Klassifikation des Textes (s. Kap. Profile Description)
  • Die Dokumentation der Bearbeitungsschritte der Edition wird angelegt und entsprechend ausgefüllt (s. Kap. Revision Description).
Zur Vorstufe gehörende Einträge in der Revision Description:
<revisionDesc>
<!-- teiHeader/text: bazga:edition-status="draft" bazga:edition-target="[proposed/ES1/ES3]" bazga:publication-status="draft" -->
<!-- facsimile: bazga:edition-status="draft" bazga:publication-status="draft" -->
 <listChange ordered="true">
  <listChange ordered="true">
   <change when="JJJJ-MM-TT" who="bazga:url">Bereinigung des OCR-XMLs</change>
   <change when="JJJJ-MM-TT" who="bazga:url">Basis-Angaben im Header</change>
   <change when="JJJJ-MM-TT" who="bazga:url">Verlinkung der Faksimile-Dateien</change>
<!-- facsimile: bazga:edition-status="proposed" -->
   <change when="JJJJ-MM-TT" who="bazga:url">Rohfassung der letzten Textschicht inkl. Auszeichnung der Textstrukturen, ohne Auszeichnung typographischer Besonderheiten</change>
   <change when="JJJJ-MM-TT" who="bazga:url">Korrekturlesen (wenn möglich 4-Augen-Prinzip)</change>
  </listChange>
<!-- damit ist erreicht die Vorstufe: Rohfassung -->
<!-- teiHeader/text: bazga:edition-status="proposed" -->
<!-- wenn das Korrekturlesen im 4-Augen-Prinzip erfolgt ist: facsimile: bazga:edition-status="candidate" -->