Sprachressourcen und Sprachtechnologie - Abgeleitete Textformate (ATF)

Norm-Entwurf [VORBESTELLBAR]

DIN 19461:2026-06 - Entwurf

Sprachressourcen und Sprachtechnologie - Abgeleitete Textformate (ATF)

Englischer Titel
Language resources and language technology - Derived text formats (DTF)
Erscheinungsdatum
2026-05-01
Ausgabedatum
2026-06
Originalsprachen
Deutsch
Seiten
36

ab 112,80 EUR inkl. MwSt.

ab 105,42 EUR exkl. MwSt.

Format- und Sprachoptionen

PDF-Download
  • 112,80 EUR

Versand (3-5 Werktage)
  • 144,40 EUR

Mit dem Normenticker beobachten

Diese Option ist erst nach dem Login möglich.
1

vorbestellbar

Einfach Abo: Jetzt Zeit und Geld sparen!

Dieses Dokument können Sie auch abonnieren – zusammen mit anderen wichtigen Normen Ihrer Branche. Das macht die Arbeit leichter und rechnet sich schon nach kurzer Zeit.

Sparschwein_data
Abo Vorteile
Sparschwein Vorteil 1_data

Wichtige Normen Ihrer Branche, regelmäßig aktualisiert

Sparschwein Vorteil 2_data

Viel günstiger als im Einzelkauf

Sparschwein Vorteil 3_data

Praktische Funktionen: Filter, Versionsvergleich und mehr

Erscheinungsdatum
2026-05-01
Ausgabedatum
2026-06
Originalsprachen
Deutsch
Seiten
36
Lade Empfehlungen...

Schnelle Zustellung per Download oder Versand

Sicherer Kauf mit Kreditkarte oder auf Rechnung

Jederzeit verschlüsselte Datenübertragung

Einführungsbeitrag

Abgeleitete Textformate sind abstrahierte Darstellungen eines Originaltextes, die urheberrechtlich geschützte Inhalte entfernen, aber relevante Informationen für Text und Data Mining (TDM) bewahren. Beispiele sind Wortlisten oder N-Gramme. Sie ermöglichen rechtssichere Forschung, Transparenz und Nachnutzbarkeit. Ein Anwendungsbereich Abgeleiteter Textformate liegt in der Entwicklung und Verbesserung von Large Language Models (LLMs). Dieses Dokument stellt allgemeine Grundsätze für abgeleitete Textformate an sich sowie für ihre Erstellung und Bereitstellung auf. Basierend darauf können dann Analyseverfahren auf die abgeleiteten Textformate angepasst werden. Durch die Nutzung dieses Dokuments können somit die Grenzen der Analyseverfahren, zum Beispiel bei der Analyse von geschützten Werken, benannt und beschrieben werden. Diese Grundsätze haben zum Ziel, die Nutzung von Textsammlungen insbesondere bei geschützten Werken rechtlich sicherer und nachhaltiger zu gestalten, die Zusammenarbeit zu erleichtern, Vertrauen zu schaffen und neue Möglichkeiten für die Nutzung moderner Analysemethoden zu eröffnen. Dieses Dokument wurde vom Arbeitsausschuss NA 105-00-06 AA "Sprachressourcen und Sprachtechnologie" im DIN-Normenausschuss Terminologie (NAT) erarbeitet.

Inhaltsverzeichnis

ICS

01.020, 01.140.20

Normen mitgestalten

Lade Empfehlungen...