Train AI-modellen voor jouw documenten
Elke collectie historische documenten heeft zijn eigen unieke handschrift. Wanneer publieke modellen niet volstaan, laat Transkribus je een op maat gemaakt AI-model trainen — afgestemd op jouw specifieke handschrift, taal en documentstijl. Geen machine learning-expertise vereist.

Hoe modeltraining werkt
Het trainen van een op maat gemaakt model in Transkribus volgt een beproefde, iteratieve workflow. Elke cyclus verbetert de nauwkeurigheid van je model.
Upload je documenten
Begin met het uploaden van scans van de handgeschreven of gedrukte documenten die je wilt transcriberen. Transkribus accepteert JPEG, PNG, PDF en TIFF. Organiseer je documenten in collecties voor eenvoudig beheer.
Tip: begin met 25–50 representatieve pagina's die het spectrum van handschriftstijlen in je collectie dekken.
Tekstherkenningsmodellen
Train een op maat gemaakt tekstmodel met PyLaia

Modellen trainen voor gestructureerde tabellen
Historische documenten zitten vol tabelgegevens — volkstellingsregisters, kerkregisters, scheepsmanifesten, boekhoudregisters. Tabelmodellen detecteren rij- en kolomstructuren en extraheren celinhoud naar gestructureerde data die je kunt exporteren naar Excel, CSV of XML.

| Institution | Town | Amount | Object | Date | Disposition |
|---|---|---|---|---|---|
| Franklin College (6) | New Athen, O. | General | 3/23/16 | ||
| Fargo College (3) | Fargo, N.D. | 100,000 | Endowment | 4/27/16 | Gen 1914, 5/18/16 |
| Franklin Academy (2) | Franklin, Neb. | 5,000 | Library Building | 8/3/16 | Gen 1914, 8/7/16 |
| Fessenden Acad. & Ind. School | Fessenden, Fla. | General | 12/22/16 | ||
| Ferris Institute (2) | Big Rapids, Mich. | 50,000 | Buildings | 2/12/17 | |
| Findlay College (2) | Findlay, O. | 100,000 | Endowment | 5/23/17 | Gen 1914, 5/28/17 |
| Fairmount College | Wichita, Kan. | 200,000 | Endowment | 6/7/17 | 6/14/17 |
| Franklin College | Franklin, Ind. | 50,000 | General | 9/13/17 | Gen 1914, 9/17/17 |
| Fisk University | Nashville, Tenn. | 1,000,000 | Endowment | 6/14/18 | |
| Friends University | Wichita, Kan. | 200,000 | Endowment | 6/20/18 | Gen 1914, 8/8/18 |
Specifieke velden uit formulieren extraheren
Wanneer je specifieke gegevens moet extraheren — namen, data, adressen, bedragen — uit gestructureerde of semi-gestructureerde documenten, lokaliseren en lezen Field Models individuele velden. Ideaal voor volkstellingsformulieren, registratiekaarten en administratieve documenten.

Binnenkort beschikbaar
Named Entity Recognition (NER) modellen

Ground Truth Tips
Hoe maak je efficiënt trainingsdata
De kwaliteit en hoeveelheid van je Ground Truth bepalen rechtstreeks de modelnauwkeurigheid. Hier zijn bewezen strategieën om sneller trainingsdata te maken.
Eerst een publiek model toepassen
Gebruik Text Titan of een taalspecifiek publiek model voor een eerste transcriptie. Corrigeren is 3–5x sneller dan helemaal opnieuw transcriberen.
Systematisch corrigeren
Werk elke pagina door en corrigeer alle fouten. Let extra op ongebruikelijke tekens, afkortingen en regelovergangen.
Kies diverse voorbeelden
Neem pagina's op van verschillende schrijvers, perioden en documenttypen. Diversiteit in trainingsdata leidt tot een robuuster model.
Trainen, evalueren, herhalen
Gebruik na je eerste model dit model om meer pagina's voor te transcriberen, corrigeer die en train opnieuw. Elke cyclus voegt data toe en verbetert de nauwkeurigheid.
300+ community-modellen — begin zonder training
Voordat je zelf gaat trainen, bekijk de modelcatalogus. Meer dan 300 modellen zijn gedeeld door de community, voor honderden talen en schriften.
Train je eerste model
Maak een gratis account aan, upload je documenten en train een op maat gemaakt AI-model — geen machine learning-achtergrond nodig.