So funktioniert's
KI trainiert auf Jahrhunderte lateinischer Manuskripte
Transkribus nutzt Deep Learning, trainiert an Millionen von Manuskriptseiten vom frühen Mittelalter bis ins 19. Jahrhundert. Die KI erkennt die charakteristischen Buchstabenformen historischer lateinischer Schriften – von den runden Strichen der karolingischen Minuskel bis zu den dichten Vertikalen der gotischen Textura – und wandelt sie in modernen, durchsuchbaren Text um.
Liest karolingische Minuskel, gotische Textura, humanistische Schrift und mehr
Über 300 öffentliche Modelle für verschiedene Handschriften und Epochen
Funktioniert mit Handyfotos oder hochauflösenden Scans
Genealogie & Forschung
Erschließen Sie die lateinischen Quellen hinter jedem europäischen Stammbaum
Latein war über tausend Jahre die Sprache der Kirche, des Rechts und der Universität. Im gesamten katholischen Europa – von Irland bis Polen, von Skandinavien bis Sizilien – wurden Kirchenbücher, Testamente und Urkunden auf Latein verfasst. Wenn Sie Vorfahren vor dem 18. oder 19. Jahrhundert suchen, werden Sie mit Sicherheit auf lateinische Dokumente stoßen.
Katholische Kirchenbücher (Taufen, Eheschließungen, Beerdigungen) – die häufigste lateinische Quelle für Genealogie
Testamente und Nachlassverzeichnisse
Mittelalterliche und frühneuzeitliche Urkunden und Landbewilligungen
Päpstliche Dokumente, Bischofsvisitationen und kirchliche Gerichtsakten
Universitätsmatrikel und akademische Dissertationen
Klosterchroniken, Kopialbücher und Rechnungsbücher

Mehr als die Demo
Die vollständige Plattform für historische Dokumente
Die Demo oben gibt Ihnen einen Vorgeschmack. Die vollständige Transkribus-Plattform ermöglicht es Ihnen, Tausende von Seiten zu verarbeiten, eigene KI-Modelle auf Ihre spezifische Handschrift zu trainieren, alle Ihre Dokumente zu durchsuchen und in jedem gewünschten Format zu exportieren.
Trainieren Sie eigene Modelle auf Ihren spezifischen Manuskriptstil
Volltextsuche über alle transkribierten Dokumente
Export als TXT, DOCX, PDF, TEI-XML oder PAGE XML
Arbeiten Sie mit Forschungsteams zusammen und teilen Sie Sammlungen

Was Sie transkribieren können
Typische Dokumente in lateinischer Schrift
Latein war über ein Jahrtausend die geschriebene Lingua franca der westlichen Zivilisation. Die Bandbreite erhaltener Dokumente ist enorm – von Pergamenturkunden mit Wachssiegeln bis hin zu sauber geschriebenen Kirchenbucheinträgen. Transkribus verarbeitet sie alle.
Kirchenbücher im gesamten katholischen Europa – seit dem Konzil von Trient (1563)
Mittelalterliche Urkunden, Besitzurkunden und Rechtsinstrumente
Klosterakten, Kopialbücher und Rechnungsrollen
Päpstliche Bullen, Bischofsbriefe und Inquisitionsakten
Universitätsakten, Dissertationen und Vorlesungsnotizen
Gedruckte lateinische Texte in Fraktur- und Antiquaschrift

Hintergrund
Welche sind die wichtigsten lateinischen Schrifttypen?
Latein wurde über die Jahrhunderte in vielen verschiedenen Schriften geschrieben, jede mit eigenen charakteristischen Buchstabenformen. Zu wissen, welche Schrift vorliegt, hilft, ein Dokument zeitlich und kontextuell einzuordnen. Hier sind die wichtigsten Typen, die Ihnen begegnen werden:
Karolingische Minuskel – die klare, gerundete Schrift, die unter Karl dem Großen standardisiert wurde (9. Jh.), der Vorläufer moderner Kleinbuchstaben
Gotische Textura (Textualis) – die dichte, eckige Schrift, die vom 12. bis 15. Jahrhundert in Nordeuropa vorherrschte
Humanistische Minuskel – von italienischen Renaissance-Gelehrten im 15. Jahrhundert nach karolingischen Vorbildern wiederbelebt; Grundlage der Antiquaschriften
Beneventanische Schrift – eine charakteristische süditalienische Schrift, vom 8. bis zum 13. Jahrhundert verwendet
Kursive Urkundenschriften – die schnellen, oft stark abgekürzten Schriften für Urkunden, Gerichtsakten und Verwaltungsdokumente

Die Technologie
Wie funktioniert die Erkennung lateinischer Manuskripte?
Handschrifterkennung (HTR – Handwritten Text Recognition) nutzt neuronale Deep-Learning-Netze, um Bilder handgeschriebener Texte in maschinenlesbare Zeichen umzuwandeln. Anders als OCR für gedruckte Texte muss HTR die unendliche Variation menschlicher Handschrift bewältigen – unterschiedliche Buchstabenformen, verbundene Striche und Abkürzungssysteme, die sich über Jahrhunderte und Regionen verändern.
Neuronale Netze, trainiert an Millionen handgeschriebener Proben
Layoutanalyse erkennt Zeilen und Textbereiche automatisch
Zeichenbasierte Erkennung verarbeitet verbundene und kursive Schrift
Sprachmodelle verbessern die Genauigkeit durch Kontextverständnis und lateinische Abkürzungen

KI-Modelle für lateinische Manuskripte
Durchsuchen Sie öffentliche Modelle, die auf lateinischen Manuskripten trainiert wurden – karolingische Minuskel, gotische Textura, humanistische Schrift und mehr.
Bereit, lateinische Manuskripte zu lesen?
Erstellen Sie ein kostenloses Konto, um unbegrenzt Dokumente zu verarbeiten, eigene Modelle zu trainieren und die gesamte Plattform freizuschalten.
50 kostenlose Credits pro Monat – keine Kreditkarte erforderlich
200M+Verarbeitete Seiten
500K+Nutzer weltweit
300+Öffentliche KI-Modelle







