DIN-Normenausschuss Informationstechnik und Anwendungen (NIA)
DIN EN ISO/IEC 5259-4
Künstliche Intelligenz - Datenqualität für Analytik und maschinelles Lernen (ML) - Teil 4: Rahmen für Datenqualitätsprozesse (ISO/IEC 5259-4:2024); Deutsche und Englische Fassung prEN ISO/IEC 5259-4:2025
Artificial intelligence - Data quality for analytics and machine learning (ML) - Part 4: Data quality process framework (ISO/IEC 5259-4:2024); German and English version prEN ISO/IEC 5259-4:2025
Einführungsbeitrag
Dieses Dokument legt allgemeine gängige Organisationsansätze, unabhängig von Art, Größe oder Beschaffenheit der anwendenden Organisation fest, um die Datenqualität für Training und Evaluierung in Analytik und maschinellem Lernen (ML) sicherzustellen. Es enthält Leitlinien zum Datenqualitätsprozess für:
- überwachtes ML in Bezug auf die Beschriftung von Daten, die für das Training von ML-Systemen verwendet werden, einschließlich gängiger organisatorischer Ansätze für die Beschriftung von Trainingsdaten;
- unüberwachtes ML;
- teilüberwachtes ML;
- bestärkendes Lernen;
- Analytik. Dieses Dokument ist auf Trainings- und Evaluierungsdaten anwendbar, die aus verschiedenen Quellen stammen, einschließlich Datenerfassung und -zusammenstellung, Datenaufbereitung, Datenbeschriftung, Evaluierung und Datennutzung. Dieses Dokument legt keine spezifischen Dienste, Plattformen oder Tools fest. Das zuständige nationale Normungsgremium ist der Arbeitskreis NA 043-01-42-03 AK "Daten" im DIN-Normenausschuss Informationstechnik und Anwendungen (NIA)
.
- bestärkendes Lernen;
- teilüberwachtes ML;
- unüberwachtes ML;
Zuständiges nationales Arbeitsgremium
Zuständiges europäisches Arbeitsgremium
CEN/CLC/JTC 21/WG 3 - Ingenieurtechnische Aspekte