Unicorns, Janitors, Ninjas, Wizards, and Rock Stars

Thema des Kapitels

Daten werden mit Ordnung, Klarheit, Strukturiertheit und ähnlichen Attributen verknüpft. Dementsprechend verwenden Datenwissenschaftler:innen einen nicht unwesentlichen Teil ihrer Zeit darauf, Daten zu komprimieren, zu bereinigen und ein „klares“ Bild zu erschaffen. Die Autorinnen zeigen in diesem Kapitel auf, welche Risiken mit diesem Bestreben verbunden sind und dass komprimierte, scheinbar „ordentliche“ Daten nicht mehr, sondern gegebenenfalls sogar weniger, informativ sind.


Grundlegendes Prinzip

Das Prinzip, dass diesem Kapitel zu Grunde liegt, ist das fünfte Data Feminism Prinzip: Embrace Pluralism

„Data feminism insists that the most complete knowledge comes from synthesizing multiple perspectives, with priority given to local, Indigenous, and experiential ways of knowing.“ (125)


Kritik seitens der Autorinnen

“…certain assumptions and anxieties remain consistent across these different articulations about the need for tidiness, cleanliness, and order, and the qualities of the people who should be doing this work. They must be able to tame the chaos of information overload. They must “scrub” and “cleanse” dirty data.” (131)

“…cleaning can function as a “diversity-hiding trick.” In the perceived messiness of data, there is actually rich information about the circumstances under which it was collected.” (132)

“…the process of cleaning and tidying data can be so complicated and, at times, can be a destructive rather than constructive act. One way to think of it is like chopping off the roots of a tree that connects it to the ground from which it grew. It’s an act that irreversibly separates the data from their context.” (132)

“…continued decisions that prioritize speed and comprehensiveness can’t help but maintain the cultural status of the solitary “genius,” effectively downplaying the work of coalitions, communities, and movements that are—not coincidentally—often led primarily by women and people of color.” (135)


Wichtige Konzepte und Begriffe

Ninjas, Janitors, Wizards and Rock Stars

- Bezeichnungen für Personen, die mit Daten arbeiten sind unter anderem unicorns, wizards, ninjas, rock stars und janitors
- Assoziiert werden diese Bezeichnungen damit, dass die Personen herausragende Fähigkeiten haben und eher auf sich alleine gestellt arbeiten (was verschleiert, dass natürlich auch diese Personen Unterstützung brauchen und nutzen)
- Die Bezeichnungen werden tendenziell mit männlichen Personen assoziiert (vgl.133-134)

Fremde im Dataset

“…once the data scientists involved in a project are not from within the community, once the place of analysis changes, once the scale of the project shifts, or once a single dataset needs to be combined with others—then we have strangers in the dataset.” (133)

- Personen die mit Daten arbeiten, aber beispielsweise beim Sammeln oder beim Pflegen/ dem Umgang (maintenance process) mit den Daten nicht anwesend waren, oder wenn verschiedene Datasets zusammengeführt werden und ähnliche Situationen
- Ein „Fremder“ im Dataset zu sein ist nicht automatisch schlecht, aber mit einigen Risiken verbunden
- Risiko der negativen Externalität (vgl. 133)
- Vergleiche hierzu auch das Risiko von epistemic violence

Epistemic violence

„…harm that dominant groups like colonial powers wreak by privileging their ways of knowing over local and Indigenous ways.” (133)

- Die Autorinnen beziehen sich hier auch auf Gayatari Chakravorty Spivak
- Spivak wählt bewusst den Begriff violence und nicht power
- Koloniale Gewaltpraktiken werden in den herrschenden Diskurs integriert, was zu einem Prozess des othering und hierarchisierender Herabstufung kolonisierter Personen führt
- Für eine genauere Einordung des Begriffs kann dieses Buch hilfreich sein, Kapitel 3, insbesondere ab Seite 97 ff.

Data for „good“ vs. Data for Co-liberation

- Data for “good” hat den Beigeschmack einer scheinbaren Großzügigkeit, der Absicht anderen zu helfen, aber aus einer privilegierten Position heraus
- Der Begriff Co-liberation achtet auf ungleiche Machtbeziehungen und deren Auswirkungen
- Aktive Kooperation und Zusammenarbeit mit minorisierten Gruppen
- Co-liberation strebt nach einem aktiven Wissenstransfer und -austausch zwischen verschiedenen (minorisierten und nichtminorisierten) Gruppen, sowie dem Aufbau sozialer Infrastruktur (vgl. 141-142)



Strategien

Okklusion
- Bezeichnet die Schwierigkeit, dass Markierungen/Darstellungen andere wichtige Informationen, zum Beispiel auf einer Karte, verdecken
- Okklusion kann strategisch eingesetzt werden, zum Beispiel um die Dringlichkeit oder sehr hohe Anzahl von kritikwürdigen Ereignissen zu verdeutlichen (vgl.128)
- Hier ein Beispiel

Narrative Maps
- Integration von Perspektiven betroffener Personen
- Darstellung von persönlichen Erfahrungen, so werden Sichtweisen aus den betroffenen Communities dargestellt und wahrnehmbar gemacht
- Zum Beispiel durch die Integration mündlicher Erzählungen in die Datendarstellung (vgl. 128)

Data setting matters
“Rather than talking about datasets, he advocates that we talk about data settings—his term to describe both the technical and the human processes that affect what information is captured in the data collection process and how the data are then structured.” (132)

-Das Setting in dem Daten gesammelt und analysiert werden hat prägende Auswirkungen auf die Analyse und daraus gezogenen Schlussfolgerungen (vgl. 132)

Transparenz, Reflexivität und Positionalität
-Anstatt eine scheinbare Objektivität zu postulieren, sind Transparenz und Reflexivität wichtige Strategien im Umgang mit Daten
-Diese Transparenz und Reflexivität bezieht sich auch auf die Position der Personen die die Daten erheben und analysieren (vgl. 136)
-Vergleiche hierzu auch das Wiki Of Viewponts and Standpoints

Communities einbinden
- Themen bearbeiten, die von den betroffenen Gruppen selbst gewählt und für relevant befunden werden
- Betroffene in das Sammeln und Auswerten der Daten einbinden
- Data Science wird so zu etwas Partizipativem, ermöglicht Erfahrungs- und Wissensaustauch (vgl. Begriff des campfire model)
- Co-liberation bietet Transformationsmöglichkeiten, Erfahrungen kollektiver Handlungsfähigkeit und Reduzierung eines Defizit-Narratives (vgl.144 f.)


Beispiele

-Data murals
- Visualisierung von Daten an Wänden oder anderen einsehbaren Orten
- zum Beispiel hier oder hier

-Digital Democracy
- Betroffene Gruppen tragen zum Sammeln von Daten bei und werden bei selbstgewählten Datenprojekten unterstützt
- zum Beispiel hier oder hier


Wichtige Fragen im Umgang mit Daten

„But what might be lost in the process of dominating and disciplining data? Whose perspectives might be lost in that process? And, conversely, whose perspectives might be additionally imposed?“ (131)

„Does one choose cleaner data at a larger scale that is relatively easy and quick to purchase? Or more accurate data at a local scale for which one has to engage and build trust with community groups?“ (135)


Diskussionsfragen

Besonders im Umgang mit quantitativen Daten liegt der Fokus oft darauf, Durchschnitte, Tendenzen und Wahrscheinlichkeiten abzubilden – steht das in diesem Kapitel thematisierte Prinzip embrace pluralism in Kontrast dazu oder lässt sich beides miteinander verbinden?
Ist das Prinzip embrace pluralism ein Ziel, das insbesondere im Umgang mit sozialwissenschaftlichen Daten angestrebt werden sollte, oder gilt es für alle Bereiche, in denen mit Daten umgegangen wird?
Die Autorinnen beschreiben, dass Strangers im Dataset nicht automatisch negativ sind, aber gewisse Risiken damit verbunden sind (vgl. 133). Welche Chancen und Risiken bieten Strangers im Dataset? Gibt es Kontexte in denen sie mehr oder weniger hilfreich sind?
Die Autorinnen beziehen sich auf Spivak und den Begriff der epistemic violence (vgl. 133) – welche Aspekte umfasst epistemische Gewalt im Umgang mit Daten? Welche Gruppen sind von epistemischer Gewalt betroffen?
Daten werden mit Ordnung, Struktur, Sauberkeit und ähnlichen Begriffen assoziiert – welche gesellschaftlichen Normen stehen hinter diesen Attributen und warum sind sie besonders im Bereich von Daten so präsent?
Wie lassen sich die beiden Begriffe Data for „good“ und Data for Co-liberation voneinander abgrenzen? Hilft die Abgrenzung der Begriffe auch dabei Machtstrukturen sichtbar zu machen?
Kann Data for Co-liberation als Mittel für zivile Protestformen genutzt werden? Inwiefern verbindet Data for Co-liberation Politik und Wissenschaft? Wird Wissenschaft so politischer und Politik wissenschaftlicher?




Beispiel

Hier ein Artikel mit einer Graphik, den wir diskutieren können.
Spannend ist es auch, die Studie anzuschauen, auf welcher der Artikel beruht


Drucken/exportieren