<p>Textdaten in Form von Bildern, Fotos, Scans…</p>
</div>
</div>
<div class="col s12 m4">
<h3>nopaque?</h3>
<p>Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,</p>
Häufig liegen Datenbestände in verschiedenen Formaten und verstreut
vor. Da eine Verarbeitung via nopaque ein einheitliches Datenformat
vorsieht, wird dieser Dienst zur Verfügung gestellt, um etwaig
anfallende Konvertierungsprozesse durchzuführen.
</p>
<blockquote>Umgesetzt mit <i>ImageMagick</i></blockquote>
<p>Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.</p>
</div>
</div>
</div>
<div class="col s3">
<div class="card">
<div class="card-content">
<span class="card-title">Ausgabe</span>
<p>Aus den Eingaben zusammengesetzte Multipage-TIFF-Dateien.</p>
</div>
</div>
</div>
<div class="col s12"></div>
<div class="col s3">
<div class="card">
<div class="card-content">
<span class="card-title">Eingabe</span>
<p>Textdaten in Form von Multipage-TIFF- oder PDF-Dateien.</p>
</div>
</div>
</div>
<div class="col s6">
<div class="card">
<div class="card-content">
<span class="card-title"><i class="material-icons left">find_in_page</i>Optical Character Recognition</span>
<p>
Durch optische Analysemethoden mit werden aus Bilddaten, wie Fotos
oder Scans, Textdaten erzeugt. Erst dieser Vorverarbeitungsschritt
ermöglicht eine weitere computergestützte Verarbeitung von Dokumenten.
</p>
<blockquote>Umgesetzt mit <i>Tesseract OCR</i></blockquote>
</div>
</div>
</div>
<div class="col s3">
<div class="card">
<div class="card-content">
<span class="card-title">Ausgabe</span>
<p>
Textdateien, PDF-Dateien und TEI P5 konformen XML-Dateien.
</p>
</div>
</div>
</div>
<div class="col s12"></div>
<div class="col s3">
<div class="card">
<div class="card-content">
<span class="card-title">Eingabe</span>
<p>Ausschließlich Textdateien.</p>
</div>
</div>
</div>
<div class="col s6">
<div class="card">
<div class="card-content">
<span class="card-title"><i class="material-icons left">format_textdirection_l_to_r</i>Natural Language Processing</span>
Part-of-speech-Tagging und Eigennamenerkennung) werden Textdateien
mit weiteren Informationen angereichert.
</p>
<blockquote>Umgesetzt mit <i>spaCy</i></blockquote>
</div>
</div>
</div>
<div class="col s3">
<div class="card">
<div class="card-content">
<span class="card-title">Ausgabe</span>
<p>Korpus Dateien im <i>verticalized text</i>-Format (XML-Dialekt).</p>
</div>
</div>
</div>
<div class="col s12"></div>
<div class="col s3">
<div class="col s12 m4">
<div class="card">
<div class="card-content">
<span class="card-title">Eingabe</span>
<p>Korpus Dateien und Metadaten entsprechend des BibTeX-Schemas.</p>
<span class="card-title">Open source</span>
<p>Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy</p>
Mittels CQP Query Language als Abfragesprache können komplexe
Suchanfragen unter Zuhilfenahme von Metadaten und NLP-Auszeichnungen
ausgeführt werden. Ergebnisse können als Text oder in abstrakter
Darstellung ausgewertet werden.
</p>
<blockquote>Umgesetzt mit <i>IMS Open Corpus Workbench</i></blockquote>
<span class="card-title">Cloud processing</span>
<p>Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy</p>
</div>
</div>
</div>
<div class="col s3">
<div class="col s12 m4">
<div class="card">
<div class="card-content">
<span class="card-title">Ausgabe</span>
<p>Export der Ergebnisse in CSV, Excel, JSON und HTML.</p>
<span class="card-title">Context</span>
<p>Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy</p>