Einführung in Datenqualität

Datenqualität beschreibt, wie gut Daten spezifische Anforderungen oder Zwecke gemäß dem Ziel und Umfang der Studie erfüllen.

Sobald die Systemgrenzen definiert sind, besteht der nächste Schritt darin, die Anforderungen an die Datenqualität zu definieren und geeignete Datenquellen auszuwählen. Die Daten müssen konsistent, zuverlässig und mit den Studienzielen übereinstimmend sein. Auch wichtig ist es zu berücksichtigen, wie repräsentativ die zu sammelnden Daten in Bezug auf zeitliche, geografische und technologische Aspekte sind.

Es gibt verschiedene Arten von Daten, die in einem LCA verwendet werden können:

  • Prozess-spezifische Daten: sehr detaillierte, meist primäre Daten aus direkten Messungen.
  • Durchschnittsdaten: aggregierte Datensätze aus Branchen oder Datenbanken.
  • Generische Daten: sekundäre Daten, häufig aus Literatur oder Datenbanken.

Diese Datensätze können aus primären Quellen (direkte Messungen, Lieferantendaten) oder sekundären Quellen (veröffentlichte Datenbanken, Berichte, Literatur) stammen. Die Dokumentation der Datenqualität während der Datensammlung ist besonders wichtig. Nur so können die Ergebnisse auch entsprechend ihrer Aussagekraft eingeordnet werden.

Falls keine konkreten Daten vorliegen, kann auch auf eine geringere Datenqualität zurückgegriffen werden:

  • Proxydaten: Daten aus vergleichbaren Prozessen / Produkten.
  • Geschätzte Daten: Experteneinschätzungen, um die Signifikanz des Prozesses / Materials abzuschätzen.

Um Transparenz und Zuverlässigkeit sicherzustellen, sollte bei der anstehenden Datensammlung die Datenqualität anhand einer definierten Skala bewertet werden. Dafür kann die folgende Skala verwendet werden:

Ziel_0.5

Weitere Kriterien für die Bewertung der Datenqualität können beispielsweise der geografische und zeitliche Geltungsbereich sein – d.h. die Region und der Zeitraum, für die die Daten gültig sind.

Die Anforderungen an die Datenqualität sowie die Prinzipien der Datendokumentation sollten vor Beginn der Datenerhebung eindeutig definiert werden. Die Interpretation der LCA-Ergebnisse sollte eine umfassende Bewertung der Datenqualität beinhalten, um Unsicherheiten und mögliche Einschränkungen offenzulegen. Im Detail wird die Datenqualität auch im Rahmen der Datensammlung im Kapitel „2.5 Überprüfen der Datenqualität“ des Leitfadens thematisiert.

================================================================================================

Case Study / 1.4 Einführung in die Datenqualität

Die für die LCA-Methode erforderlichen Daten sollten je nach ihrer Verfügbarkeit kategorisiert und geordnet werden.

  • Datenqualität Level 1: Primärdaten zu Menge und Art der Rohstoffe und Verpackungen, die aus Stücklisten sowie aus der Abfrage von Lieferanten stammen
  • Datenqualität Level 2: Für die Produktion von Leitungswasser wird ein bestehender Datensatz aus Ecoinvent herangezogen.
  • Datenqualität Level 3: Für die Entsorgungsphase werden Branchenstudien für die Entsorgung sowie die Recyclingraten von Elektrogeräten im Haushalt herangezogen.

Aufgrund der guten Datenlage musste in der Datensammlung nicht auf die Level 4 und 5 zurückgegriffen werden. Als Startpunkt der Analyse kann eine eingeschränkte Datenqualität durchaus herangezogen werden, muss jedoch auch entsprechend dokumentiert werden.

Weitere Rahmenbedingungen, die hinsichtlich der Datenqualität festgelegt wurden:

  • Zeit: Daten, die nicht älter als 10 Jahre sind
  • Geografie: Daten und Emissionsfaktoren aus dem Raum Europa, falls vorhanden

================================================================================================

Praxistipp: Während der Datensammlung ist es wichtig, die Qualität der erhobenen Daten zu dokumentieren. In der Übersicht über alle Daten – der sogenannten Sachbilanz – kann dafür eine zusätzliche Spalte genutzt werden. Jeder erfasste Datenpunkt (z.B. 1 kg Stahl) kann mithilfe der oben angegebenen Skala von 1 bis 5 hinsichtlich seiner Datenqualität bewertet werden. Auch lohnt es sich grundsätzliche Anforderungen an die Daten in Bezug auf Geografie, Zeit und Technologie festzulegen – beispielsweise die Daten sollten nicht älter als 5 Jahre sein.

Checkliste :

  • Sind die Anforderungen an die Datenqualität klar definiert und dokumentiert?
  • Besteht ein Verständnis über die unterschiedlichen Datentypen?
  • Ist die Skala für die Datenqualität repräsentativ für das betrachtete Produkt?