Einführung in Datenqualität

Datenqualität beschreibt, wie gut Daten spezifische Anforderungen oder Zwecke gemäß dem Ziel und Umfang der Studie erfüllen.

Im Rahmen der Scope-Definition ist es essenziell, das Datenframework für die Studie festzulegen und zu identifizieren. Sobald der Scope definiert ist, besteht der nächste Schritt darin, die Anforderungen an die Datenqualität zu bewerten und geeignete Datenquellen auszuwählen, um Konsistenz, Zuverlässigkeit und Übereinstimmung mit den Studienzielen sicherzustellen. Dabei sollte die Repräsentativität der Daten in Bezug auf zeitliche, geografische und technologische Aspekte berücksichtigt werden.

Es gibt verschiedene Arten von Daten, darunter:

  • Prozessspezifische Daten (sehr detaillierte, meist primäre Daten aus direkten Messungen)
  • Durchschnittsdaten (aggregierte Datensätze aus Branchen oder Datenbanken)
  • Generische Daten (sekundäre Daten, häufig aus Literatur oder Datenbanken)

Diese Datensätze können aus primären Quellen (direkte Messungen, Lieferantendaten) oder sekundären Quellen (veröffentlichte Datenbanken, Berichte, Literatur) stammen. Die Dokumentation der Datenqualität während der Datensammlung ist besonders wichtig. Nur so können die Ergebnisse auch entsprechend ihrer Aussagekraft eingeordnet werden.

Falls keine konkrete Daten vorliegen kann auch auf eine geringere Datenqualität zurückgegriffen werden:

  • Proxydaten (Daten aus vergleichbaren Prozessen / Produkten)
  • Geschätzte Daten (Experteneinschätzungen, um bspw. die Signifikanz des Prozesses / Materials abzuschätzen)

Um Transparenz und Zuverlässigkeit sicherzustellen, sollte bei der anstehenden Datensammlung die Datenqualität anhand einer definierten Skala bewertet werden. Dafür kann die folgende Skala verwendet werden:

Ziel_0.2

Weitere Kriterien für die Bewertung der Datenqualität können beispielsweise der geografische und zeitliche Geltungsbereich sein – d.h. die Region und der Zeitraum, für die die Daten gültig sind.

Die Anforderungen an die Datenqualität sowie die Prinzipien der Datendokumentation sollten klar definiert sein, bevor die Datenerhebung beginnt. Die Interpretation der LCA-Ergebnisse sollte eine umfassende Bewertung der Datenqualität beinhalten, um Unsicherheiten und mögliche Einschränkungen offenzulegen.

================================================================================================

Case Study

Die für die LCA-Methode erforderlichen Daten sollten je nach ihrer Verfügbarkeit kategorisiert und geordnet werden.

  • Datenqualität Level 1: Primärdaten zu Menge und Art der Rohstoffe und Verpackungen, die aus Stücklisten sowie aus der Abfrage von Lieferanten stammen
  • Datenqualität Level 2: Für die Produktion von Leitungswasser wird ein bestehender Datensatz aus Ecoinvent herangezogen.
  • Datenqualität Level 3: Für die Entsorgungsphase werden Branchenstudien für die Entsorgung sowie die Recyclingraten von Elektrogeräten im Haushalt herangezogen.

Aufgrund der guten Datenlage musste in der Datensammlung nicht auf die Level 4 und 5 zurückgegriffen werden. Also Startpunkt der Analyse kann eine eingeschränkte Datenqualität durchaus herangezogen werden, muss jedoch auch entsprechend dokumentiert werden.

Andere Schwerpunktbereiche:

  • Zeit - Daten, die nicht älter als 10 Jahre sind
  • Geografie - Daten innerhalb Europe
  • Technologie - Daten aus Unternehmen und Prozessen

In der Studie getroffene Annahmen:

  1. Der elektrische Wasserkocher wird für Haushaltszwecke verwendet.
  2. Aufgrund mangelnder Daten wurde der Stromverbrauch für die Montage der Wasserkocher nicht berücksichtigt.
  3. Für Netzkabel, elektrische und thermische Stecker und Steckdosen wurden die Ecoinvent-Daten für die Herstellung von Computerkabeln und -steckern übernommen.
  4. Für Metallabfälle wurde eine Recyclingquote von 95 % angesetzt.
  5. Es wird davon ausgegangen, dass alle Polyethylenbeutel und Silikone deponiert werden.
  6. Für Kartonverpackungen wurden die Daten zur Verpackungsentsorgung in der EU für das Jahr 2013 angenommen

(Diese Annahmen werden im Laufe der Datensammlung getroffen. Diese gilt es ausreichend zu dokumentieren, um die Datenqualität beurteilen zu können.)

================================================================================================

Praxistipp : Während der Datensammlung ist es wichtig, die Qualität der erhobenen Daten zu dokumentieren. In der Übersicht über alle Daten – der sogenannten Sachbilanz – kann dafür eine zusätzliche Spalte genutzt werden. Jeder erfasste Datenpunkt (z. B. 1 kg Stahl) kann mithilfe der oben angegebenen Skala von 1 bis 5 hinsichtlich seiner Datenqualität bewertet werden.

Checkliste

  • Sind die Anforderungen an die Datenqualität klar definiert und dokumentiert?
  • Besteht ein Verständnis über die unterschiedlichen Datentypen?
  • Ist die Skala für die Datenqualität repräsentativ für das betrachtete Produkt?