Fremdsprachiger Text

ediarum.BASIS

Unter „fremdsprachigem Text“ sind Texte (bzw. Textteile) zu verstehen, die entweder von der im Korpus normalerweise vorkommenden Sprache oder einer als Standard definierten Sprache abweichen. Dabei kann es sich um einzelne Wörter, längere Textpassagen oder ganze Texte (Briefe o. ä.) handeln. Der Sprachwechsel bzw. die Sprache eines Textes sollte stets ausgezeichnet werden; dadurch wird sowohl die Verwendung von externen Webservices, wie dem „Cascaded Analysis Broker“ des Deutschen Textarchivs, als auch die Nachnutzung der edierten Texte in linguistischen Korpora erleichtert.

Zu unterscheiden ist die Auszeichnung fremdsprachigen Textes von der Auszeichnung eines Schriftwechsels, mit dem ersterer häufiger einhergeht. Beispielsweise wurden deutschsprachige Briefe der ersten Hälfte des 19. Jahrhunderts häufig in deutscher Schrift verfasst. Verwendete der Schreiber ein Fremdwort, wurde dies in lateinischer Schrift wiedergegeben.

Kodierung

Einzelne fremdsprachige Wörter und Textstellen werden mit in einem <foreign>-Element ausgezeichnet werden. Im Attribut @xml:lang wird ein Kürzel der jeweiligen Fremdsprache angegeben:

Fremdsprache Wert für @xml:lang
Griechisch grc
Latein lat
Hebräisch heb
Deutsch deu
Französisch fra
Englisch eng
Russisch rus
Spanisch spa
Das <lb/>2te und 3te <foreign xml:lang="spa">vela</foreign> Rufen machte sichtbar weniger Eindruk.

Darüber hinaus kann das Attribut @xml:lang sowohl auf Ebene der üblichen Textstrukturen (z. B. Absätze) gesetzt werden als auch für gesamte Dokumente (dann im Wurzelelement TEI).