software en diensten > Deelprojecten > CHECKERS
Database organizer
Naturalis en de RCE hebben samengewerkt in de CATCH-projecten MITCH en RICH.
Binnen MITCH is een programma ontwikkeld waarmee databases opgeschoond kunnen worden. Dit gebeurt door gebruik te maken van het regelmatig samen voorkomen van waarden in de databasetabellen.
In RICH is software ontwikkeld die bepaalde entiteiten volautomatisch herkent en extraheert uit vrije tekst. Deze ‘named entities’ kunnen worden toegevoegd aan bestaande databases of als index dienen voor ‘free text information retrieval’.
In CATCHPlus wordt een nieuw programma (EntityChecker) ontwikkeld dat het mogelijk maakt relevante informatie (wie, wat, waar) uit ongestructureerde tekst te detecteren. Daarnaast is een module ontwikkeld (Value Checker), die semi-automatisch foute waarden in database-velden detecteert en corrigeert. Value Checker vult ook lege velden in met behulp van referentiestructuren en koppelt automatisch ongestructureerde teksten aan thesauri (annotatie).
EntityChecker zal door de RCE gebruikt worden om de jaarlijkse stroom aan archeologische rapporten duurzaam toegankelijk te maken. Ook is het programma bruikbaar voor andere instanties of personen met een database of verzameling ongestructureerde tekst.

