Bitte schalten Sie den Werbeblocker aus, damit wir die Plattform weiterentwickeln können.
Definition: Vertrauliche Zellen
Kategorie:
Als vertrauliche Zellen werden die Zellen einer Tabelle bezeichnet, die aufgrund der statistischen Geheimhaltung nicht veröffentlicht werden können. Laut Definition gibt es drei Arten vertraulicher Daten, die offengelegt werden könnten, woraus sich vertrauliche Zellen ergeben: - Kleine Zählmengen. Eine Tabellenzelle ist vertraulich, wenn weniger als m Einheiten zu ihrem Gesamtwert beitragen. Der Wert m wird als Schwelle bezeichnet und gewöhnlich vom statistischen Amt entsprechend dem gewünschten Geheimhaltungsgrad festgelegt: m ist wenigstens gleich 3, gelegentlich wird 5 angegeben. Im Falle einer Schwelle von m = 3 ist eine Zelle vertraulich, wenn die darin enthaltene Zahl nur eine Einheit betrifft oder wenn sie für zwei Einheiten gebildet wird und ein Auskunftgeber die vom anderen Auskunftgeber angegebene Zahl durch einfache Subtraktion ermitteln kann. Man bezeichnet dies auch als Schwellenregel. - Dominanz. A) Dominanzregel, Konzentrationsregel, n/k-Regel: Eine Zelle gilt als vertraulich, wenn die n größten Einheiten mehr als k % der Summe der Zelle ausmachen. Die Werte für n und k werden vom statistischen Amt angegeben und sind sehr unterschiedlich. Es kommt z. B. vor, daß n = 2 und k = 85, was bedeutet, daß eine Zelle als vertraulich gilt, wenn die beiden größten Einheiten mehr als 85 % der Summe ausmachen. B) Prä/Post-Ambiguitätsregel, p/q-Regel: Man geht von der Annahme aus, daß sich der Beitrag eines Auskunftgebers zur Summe der Zelle zu p % (p = Fehler vor Veröffentlichung) aus den allgemein verfügbaren Informationen ermitteln läßt; nach Veröffentlichung läßt sich dieser Wert zu q % bestimmen (q = Fehler nach Veröffentlichung). In der p/q-Regel stellt das Verhältnis p : q den durch die Veröffentlichung erzielten Informationsgewinn dar und in der Prä/Post-Ambiguitätsregel die Differenz von p - q. Ist der Informationsgewinn unannehmbar, wird die Zelle als vertraulich erklärt. Die Werte für p und q werden vom statistischen Amt angegeben, das somit den annehmbaren Grad des Informationsgewinns festlegt. - Sekundäre Geheimhaltung/Ableitung: Auch wenn alle vertraulichen Zellen, die geringe Zählmengen oder Dominanzfälle enthalten, durch Offenlegungskontrollmethoden geschützt sind (Primärschutz), wäre eine Offenlegung möglich durch Neuberechnung der vertraulichen Zellen als Differenz zwischen einer Summe und der Anzahl der Zellen, die zu dieser Summe beitragen. Diese Neuberechnung von primärgeschützten Zellen bezeichnet man als Ableitung. Ableitungen können vorkommen a) innerhalb von zwei- oder mehrdimensionalen Tabellen, wenn die Summe für eine Zeile, eine Spalte oder eine Reihe von Zeilen oder Spalten angegeben ist; b) zwischen Tabellen und Untertabellen im Falle von drei oder mehr Dimensionen, z. B. zwischen geographischen oder Aggregationsebenen (Gesamtwirtschaft, Sektor); c) zwischen einzelnen Tabellen auf der gleichen geographischen oder Aggregationsebene, die unterschiedliche Arten von Informationen enthalten. Anmerkung: Geringe Zählmengen und Dominanz unterliegen insgesamt der primären Geheimhaltung.
Quelle:
Manual on disclosure control methods, Eurostat 1996, S. 8-9 und Eurostat
Manual on disclosure control methods, Eurostat 1996, S. 8-9 und Eurostat
Erstellt:
Letztes Update: