Daten- Journalismus

Verändern große Datensätze die Medien? Bestimmt. Werden Journalisten deshalb ihr Handwerk grundlegend ändern müssen? Sicher nicht. Sie werden nach wie vor telefonieren, vor Ort recherchieren und Geschichten erzählen. Aber sie werden genauer wissen, wie relevant ein Thema ist und welche Fälle es sinnvoll illustrieren. Und sie werden mehr in der Hand haben, wenn sie Verantwortlichen Erklärungen abverlangen.

Wer seine Recherche auf belastbaren Zahlen aufbaut, kann nur gewinnen. Trotzdem breiten sich datenjournalistische Techniken erst langsam aus. Das Auswerten von Daten in der Recherche ähnelt eben dem Anlauf im Weitsprung – es kostet zunächst Energie und Zeit fürs Training, ist aber für die Tragweite einer Story absolut wertvoll. Statistiken bieten Orientierung, können Thesen absichern und die Relevanz einer Fragestellung untermauern. Nicht selten finden sich in Datenbergen zudem neue Ansätze die in exklusive Geschichten münden können.

Lokaljournalisten können mit regionalen Daten ein bundesweit aktuelles Thema auf ihr Publikum herunterbrechen. Ist die medizinische Versorgung vor Ort besser oder schlechter geworden? Wie viele Väter nehmen Elternzeit, wie hoch ist ihr Anteil im Vergleich zu anderen Regionen und warum? Politische Debatten lassen sich so in der unmittelbaren Lebenswelt der Leser, Hörer und Zuschauer abbilden und werden greifbar. Gleichzeitig stärken Lokaljournalisten ihre Kernkompetenz, wenn sie regionale Quellen zur Aufklärung nutzen und Verantwortliche vor Ort mit den Ergebnissen konfrontieren.

Recherchen in Datensätzen machen Journalisten unabhängiger von solchen Autoritäten. Denn was in offiziellen Statistiken dokumentiert ist, lässt sich kaum wegdiskutieren. Und wer sich darauf berufen kann, lässt sich nicht so leicht abspeisen. Diese Standfestigkeit können Journalisten dann gut gebrauchen, wenn sie in den Daten Unregelmäßigkeiten oder auffällige Werte entdeckt haben. Dann werden aus Datenrecherchen schnell investigative Großprojekte. Auch das macht es so spannend, in Zahlenbergen zu graben.

Dafür benötigt man aber zunächst Material – einen vollständigen Datensatz, der sich aus belastbaren Werten zusammensetzt und so erhoben wurde, dass sich überhaupt konkrete Aussagen aus ihm ableiten lassen. Solche Rohdaten finden sich zuhauf in der amtlichen Statistik, bei Institutionen, Forschungseinrichtungen und Verbänden. Auf deren Webseiten aber können Sie meist nur einen Bruchteil der verfügbaren Tabellen herunterladen. Deshalb ist es immer eine gute Idee, den persönlichen Kontakt zu suchen.

Wenden Sie sich also möglichst direkt an Fachabteilungen, die sich inhaltlich mit den Datensätzen befassen und Ihnen einen Zugang ermöglichen können. Dort bekommen Sie oft sogar noch weiterführendes Material, etwa Detailauswertungen oder Zeitreihen. Oder fragen Sie Experten aus wissenschaftlichen Einrichtungen, welche öffentlich zugänglichen Datenquellen sie für eine journalistische Recherche empfehlen würden. Google und andere Suchmaschinen helfen bei der Suche nur bedingt. Denn sie können in der Regel nicht auf Zahlen, die in Datenbanken verborgen liegen, zugreifen. Suchen Sie deshalb im ersten Schritt nicht ausschließlich nach Daten, sondern auch gezielt nach Datenbanken. Beispiel: Sie brauchen Informationen zu einer bestimmten Naturkatastrophe. Suchen Sie zunächst nach einer Datenbank zu diesem Thema (statt dem konkreten Ereignis) – auch mit englischen Suchbegriffen, um internationale Quellen und Vergleichsdaten mit einzubeziehen.

Bei Erfolg sitzen Sie bald vor umfangreichen Tabellen. Um jedoch die darin oft verborgenen spannenden Geschichten sichtbar zu machen, müssen Daten zunächst in Beziehung zu einer sinnvollen Größe gesetzt und damit vergleichbar gemacht werden: Was bedeutet etwa die Verschuldung mehrerer Städte pro Einwohner gerechnet? Wie haben sich diese statistischen Kenngrößen entwickelt? Und wirken sie neben dem landesweiten Durchschnitt exorbitant groß oder doch eher mickrig?

In überschaubaren Datenmengen werden solche Ansätze recht schnell deutlich. Je größer aber ein Datensatz, desto wichtiger werden die technischen Werkzeuge und Methoden bei der Auswertung. Zum Beispiel das Sortieren einer umfangreichen Tabelle nach einem vergleichbaren Wert. An den Rändern des Rankings zeigen sich dann Extreme, die für sich schon als Story interessant sein können – vor allem, wenn sie vom Rest weit entfernt liegen oder gängigen Vorurteilen widersprechen. Beispiel: die regionale Entwicklung der Ärztedichte. Entgegen dem bundesweiten Trend finden sich durchaus auch Landstriche, in denen die Versorgung mit Hausärzten besser geworden ist. Solche Sonderfälle ermöglichen neue Ansätze und unverbrauchte Geschichten.

Visualisiert in Karten, Kurven und in anderen Diagrammen zeigen sich spannende Details in den Daten besonders deutlich. Nutzen Sie deshalb einfache Grafiken auch in der Recherche. Tabellenkalkulations-Programme wie Excel und OpenOffice Calc sind in der Lage, Zahlen unkompliziert zu visualisieren – z. B. mit Balken- und Kreisdiagrammen. Die müssen nicht sonderlich schön sein, aber für die Orientierung im Datendschungel sind sie ungemein hilfreich. Genauso wie für die Redaktionskonferenz: Auch Chefs und Kollegen werden so schneller nachvollziehen, warum Ihre Tabelle die Basis eines großen Beitrags werden könnte, für den Sie Zeit und Ressourcen brauchen.

Bei Themen mit Ortsbezug sind Karten zumeist aussagekräftiger als Diagramme: Wenn Sie geografische Punkte kartieren oder die Flächen der Landkreise nach einem Indikator einfärben, werden spannende Muster oder Häufungen sichtbar. Nicht umsonst sind in statistischen Berichten und wissenschaftlichen Studien zunehmend Daten in Karten abgebildet, um Thesen zu untermauern. Journalisten sollten aber in der Lage sein, unabhängig davon selbst zu bestimmen, welche Kennwerte sie auf welche Art und Weise visualisieren wollen. So enthalten auch die offiziellen Berichte zur Kindertagesbetreuung (s. Fallbeispiel Seite 55) Karten, mit den regionalen Betreuungsquoten. Wie sich die Quoten in den vergangenen Jahren verändert haben, ist aber nicht visualisiert. Dabei führt gerade diese Fragestellung zu Kreisen und Städten, deren außergewöhnliche Entwicklung den Stoff für eine neue Perspektive auf das Thema hergibt. Erst recht für Lokaljournalisten, die in diesen Regionen arbeiten.

Tipps für Einsteiger: Tabellen auswerten, Diagramme erstellen, Karten einfärben – eine Herausforderung, gerade für Kollegen, die ohne Vorkenntnisse in den Datenjournalismus einsteigen wollen. Fangen Sie am besten mit kleinen Tabellen an und üben Sie mit allen Zahlen, die Ihnen über den Weg laufen. Nur so bekommen Sie die nötige Sicherheit für große Datensätze.

Gutes Übungsmaterial finden Sie zum Beispiel im Publikationsservice des Statistischen Bundesamtes, wo regelmäßig Statistiken aus sehr vielen Bereichen veröffentlicht werden.

Für das Analysieren und Visualisieren von Daten wurden einige sehr hilfreiche Programme und Online-Services entwickelt, in die man sich auch ohne Informatik-Diplom schnell einarbeiten kann (s. Werkzeugkasten Seite 54). Trotzdem sollten Sie nicht zum Einzelkämpfer werden. Vernetzen Sie sich, mit anderen Datenjournalisten ebenso wie mit Experten aus angrenzenden Disziplinen. Diese Notwendigkeit betont auch Aron Pilhofer, Leiter des Interactive-News-Teams bei der „New York Times“: „Man braucht keine Redaktion mit Hunderten von Mitarbeitern, um großartige datenjournalistische Projekte zu betreiben. Für viele Anwendungen braucht man nur drei Mitarbeiter – einen Journalisten, einen Grafiker und einen Programmierer“ (Interview von Ulrike Langer: http://blog.buchmesse.de/2012/09/20/nyt-data-journalism/). Solche Teams haben einen einfachen, aber bestechenden Vorteil: Über die Schnittstelle des Datenjournalismus kann jeder der drei Mitarbeiter seine Kompetenzen einbringen und zur Geltung bringen. So entstehen immer wieder auc
h hierzulande Leuchtturmprojekte – wie die preisgekrönte Visualisierung der Vorratsdaten des Grünen-Politikers Malte Spitz oder das Parteispenden-Projekt der „taz“.

Datenauswertungen können aber auch bunte Themen bereichern. Denn was strukturierbar ist, lässt sich auch auswerten. Zum Beispiel die Olympischen Medaillen: Zu jeder Medaille gibt es einen Sportler, zu jedem Sportler Angaben über dessen Alter, Größe und Geschlecht. Für eine Auswertung im „Stern“ haben wir außerdem die Wettbewerbe kategorisiert: Wo finden die Sportarten statt, draußen oder drinnen? Und wurde dabei ein Gerät benutzt? Damit wollten wir klären, ob die deutschen Athleten tatsächlich nur gewinnen, wenn sie in einem Ruderboot sitzen, auf einem Pferd reiten oder etwas in die Gegend schleudern. Die Daten bestätigen diesen Eindruck: Konzentriert man sich nur auf die Sportarten mit Gerät, landet Deutschland auf Rang 4 in der Nationenwertung, bei den anderen auf Rang 38. Kombiniert man ein paar Merkmale, entscheidet Deutschland sogar das Ranking für sich – wenn nur die Disziplinen zählen, die draußen mit Gerät in Team-Wettbewerben ohne Mixed-Mannschaften gewonnen wurden. Zugegeben, das ist ein zurechtgebogenes Ergebnis. Aber durchaus eines mit Neuigkeitswert.

Fallbeispiel: Thema KinderKrippenplätze

A. Das Motiv

Von 2013 an gilt das Recht auf einen Krippenplatz. Bereits 2007 legten sich Bund, Länder und Gemeinden darauf fest, die Betreuungsplätze für Kinder unter drei Jahren massiv auszubauen. Die geforderte Betreuungsquote von 33 Prozent (West) bzw. 50 Prozent (Ost) hat 2011 aber nur einer von acht Kreisen erreicht. Bundesweit wird das Ziel also wohl verfehlt, doch auf regionaler Ebene finden sich Sonderfälle. Hinweise darauf zeigen diese beiden Deutschlandkarten: Links die Betreuungsquote im März 2011. Rechts ist die Entwicklung der Zahl betreuter Kinder 2008-2011 dargestellt.

B. Das Vorgehen

Die Daten stammen aus der Publikation „Kindertagesbetreuung regional“, die jährlich als PDF vom Statistischen Bundesamt herausgegeben wird. Um die Daten als Excel-Datei zu bekommen, genügte ein Anruf bei der zuständigen Fachabteilung. Dann wurden die Werte der Kreise und kreisfreien Städte für die Jahre 2008 und 2011 in Excel zusammengeführt. Für jeden Kreis ließ sich daraufhin die Entwicklung in Prozent berechnen.

Visualisiert wurden die Daten anschließend mit dem kostenlosen Programm QGIS auf der Grundlage von Geodaten des Bundesamtes für Kartographie und Geodäsie.

Insgesamt dauerte die Auswertung etwa eine Stunde.

C. Der Weiterdreh

Sind spannende Regionen mit Hilfe von Karten und Datentabellen identifiziert, kann die Recherche in die Tiefe gehen – zu einzelnen Themenaspekten oder wie hier zu einzelnen regionalen Besonderheiten. Drei Beispiele: : Münster. Jedes vierte Kleinkind wird hier 2011 betreut, in ganz Nordrhein-Westfalen ist das die höchste Quote. : Olpe. Die Betreuungsquote bei den unter Dreijährigen hat sich dort mehr als verdreifacht (3,3 zu 12,5 Prozent). Das ist der stärkste Anstieg, trotzdem gehört der Kreis zu den Schlusslichtern. : Landkreis Mainz-Bingen. Bereits 2011 war dort die angepeilte (West-)Quote erfüllt (34,3 nach 17 Prozent 2007). Eine der wenigen Regionen, die auf beiden Karten im grünen Bereich liegen. (In 15 ostdeutschen Kreisen lag die Quote bereits 2008 über 50 Prozent. Rechts oben sind diese Regionen rot eingefärbt, weil die Kinderbetreuung nur geringfügig weiter ausgebaut wurde.)

Welche Ursachen hinter Mustern oder Entwicklungen stehen, können zum Beispiel Experten aus der Wissenschaft, Verantwortliche vor Ort oder weitere statistische Daten erklären. Halten Sie bei der Recherche immer die Ohren offen für Geschichten: Gibt es Menschen, deren Biografie mit dem Thema verwoben ist? Wer hat für den Ausbau der Kitaplätze gekämpft? Wer hat ihn verhindert? Und wer profitiert davon?

Christina Elmer

ist Redakteurin im Investigativ-Team des „Stern“ und hat zuvor als Datenjournalistin bei Regiodata der dpa gearbeitet.

elmer.christina@stern.de

Erschienen in Ausgabe 12/202012 in der Rubrik „Praxis“ auf Seite 61 bis 63. © Alle Rechte vorbehalten. Der Inhalt dieser Seiten ist urheberrechtlich geschützt. Für Fragen zur Nutzung der Inhalte wenden Sie sich bitte direkt an die Redaktion.