Fremdsprachiger Text
ediarum.BASE
Unter „fremdsprachigem Text“ sind Texte (bzw. Textteile) zu verstehen, die entweder von der im Korpus normalerweise vorkommenden Sprache oder einer als Standard definierten Sprache abweichen. Dabei kann es sich um einzelne Wörter, längere Textpassagen oder ganze Texte (Briefe o. ä.) handeln. Der Sprachwechsel bzw. die Sprache eines Textes sollte stets ausgezeichnet werden; dadurch wird sowohl die Verwendung von externen Webservices, wie dem „Cascaded Analysis Broker“ des Deutschen Textarchivs, als auch die Nachnutzung der edierten Texte in linguistischen Korpora erleichtert.
Zu unterscheiden ist die Auszeichnung fremdsprachigen Textes von der Auszeichnung eines Schriftwechsels, mit dem ersterer häufiger einhergeht. Beispielsweise wurden deutschsprachige Briefe der ersten Hälfte des 19. Jahrhunderts häufig in deutscher Schrift verfasst. Verwendete der Schreiber ein Fremdwort, wurde dies in lateinischer Schrift wiedergegeben.
edition humboldt digital
Als Standardsprache ist in den meisten Fällen Deutsch vorgegeben. Abweichungen auf Satz- oder Satzteil-Ebene bzw. in Wortfolgen werden in der jeweiligen Sprache ausgezeichnet:
<p>Auszug aus einem Schreiben <lb/>Sir William Hooker’s […]</p> <p><foreign xml:lang="eng">In the matter of Mr. Hannemann, <lb/>your Excellency will see at once that Humboldt’s testi<g ref="#typoHyphen"/> <lb break="no"/>mony is a host in itself <lb/>and therefore I shall „stretch <lb/>a point“ to make an opening <lb/>for him in the spring […].</foreign></p> <p>Wenn auch Hooker erst <lb/>[…]</p>
Der fremdsprachige Text wird in der Webanzeige nicht gesondert hervorgehoben:
In rein französischsprachigen Texten wird Französisch als Standard angenommen und der Wechsel zum Deutschen als Fremdsprache ausgezeichnet:
[…] Elle est très charactérisée <lb/>par le <foreign xml:lang="deu">ebene Bruch ins flachmuschlige übergehend, röthlichweiß, dünn <lb break="no"/>schiefrig</foreign> identique a celle de Pappenheim surtout à las Lomas de <lb/>Camoa […]
- auf Wortebene und bei Eigennamen
- auf Briefumschlägen
- bei lateinischen, griechischen oder sonstigen fremdsprachigen (Fach-)Begriffen (Oftmals finden sich auch eingedeutschte Termini wie bspw. Rosaceae = Rosaceen.)
Kodierung
Einzelne fremdsprachige Wörter und Textstellen können mit in einem
<foreign>
-Element ausgezeichnet werden. Im Attribut
@xml:lang
wird ein Kürzel der jeweiligen Fremdsprache angegeben:
Fremdsprache | Wert für @xml:lang |
---|---|
Griechisch | grc |
Latein | lat |
Hebräisch | heb |
Deutsch | deu |
Französisch | fra |
Englisch | eng |
Russisch | rus |
Spanisch | spa |
Das <lb/>2te und 3te <foreign xml:lang="spa">vela</foreign> Rufen machte sichtbar weniger Eindruk.
Darüber hinaus kann das Attribut @xml:lang
sowohl auf Ebene der üblichen
Textstrukturen (z. B. Absätze) gesetzt werden als auch für gesamte Dokumente (dann im
Wurzelelement TEI).