Nachlese Datenjournalismus Kurs an der FH Wien im Wintersemester 2017/18

Ein kleiner Rückblick zum Ende des Wintersemesters 2017/18 – aus meiner subjektiven Sicht mit zwei absoluten Highlights:

1) Die Entwicklung von Datawrapper

Nach der Academy, dem Blog und etlichen neuen Diagrammtypen folgt der neueste Streich River, einer Art Nachrichtenagentur für Charts und Daten, bridging the gap between Data-Haves and Have-Nots.
Hier finden sich dann Charts wie dieses von Gregor Aisch zur gefälligen Weiterverwendung (inkl. Erläutertungen zum Chart im Datwrapper-Blog):

2) Die Arbeiten meiner Studierenden

Wie jedes Jahr finden sich etliche gute und sehr gute Arbeiten – herausheben möchte ich diese drei:

Diese drei wie alle anderen Studierendenarbeiten verwenden zur Visualisierung Datawrapper.

Thomas Jöchler

Hilfe, wir werden alt!

Erschreckende Prognosen einer überalternden europäischen Gesellschaft kursieren schon länger durch die Medien. “Teures Europa der Greise” titelt zum Beispiel die Presse 2014. Immer wieder werden nun Bilder von zusammenbrechenden Pensionssystemen und unbezahlbaren Gesundheitskosten gemalt.

Während Europa meist undifferenziert als große Einheit dargestellt wird, weisen die einzelnen Länder jedoch deutliche Unterschiede in ihren Altersstrukturen auf. Dies wird erkennbar, wenn die Anzahl von Menschen unter 15 Jahre und über 65 Jahre im Verhältnis zur Gesamtbevölkerungszahl betrachtet werden.

Altes Deutschland, junge Iren

Die Daten der OECD für das Jahr 2012 (für die Folgejahre fehlen Daten aus einigen Ländern) zeigen, dass in Deutschland am meisten alte Menschen wohnen, während in Irland auffällig viele junge Menschen, unter 15 Jahre leben. Dieser signifikante Unterschied zwischen den beiden Ländern regt dazu an, die Altersstruktur seit 1970 zu betrachten.

Der Vergleich zeigt unterschiedliche Entwicklungen: Während in Irland der Anteil an Menschen über 65 Jahren erst nach 2005 zu steigen beginnt, wächst der Anteil an alten Menschen in Deutschland schon seit 1990 deutlich. Seit 19995 gibt es in Deutschland mehr Menschen, die älter als 65 Jahre sind, als junge Menschen unter 15 Jahren. In Irland gibt es 2012 noch immer fast 10 Prozent mehr junge, als alte Menschen.

Zur Erklärung müssen viele Faktoren betrachtet werden. Neben der Geburten- und Sterberate, haben auch Entwicklungen wie steigende Lebenserwartung, Abwanderung und Migration Einfluss auf die Altersstruktur eines Landes. Im Beispiel Irland und Deutschland spielt sicher die Geburtenrate eine bedeutende Rolle: Mit 3,9 Kindern pro Frau kamen in Irland 1970 fast doppelt so viele Kinder wie in Deutschland zur Welt.

Dass die Geburtenrate in Irland außergewöhnlich hoch ist, zeigt der große Abstand zum EU-Schnitt und die Tatsache, dass im Vergleichsjahr 1970 nur Spanien (2,9) und Portugal (2,8) mit circa 3 Kindern pro Frau eine deutlich höhere Geburtenrate als der Schnitt hatten. Alle weiteren Länder liegen. Alle weiteren untersuchten Länder liegen nahe oder unter dem Schnitt von 2,4 Kindern pro Frau.

Bis 2012 ist die Geburtenrate in Irland stetig bis auf 2 Kinder pro Frau gesunken. In Deutschland liegt sie 2012 bei 1,4.

Blick nach Österreich

Auch in Österreich ist der Anteil an Menschen über 65 Jahren seit 2005 höher als der an Menschen über 15 Jahren. Österreich gehört somit wie Deutschland zu den Ländern, in denen es bereits mehr ältere als jüngere Menschen gibt. Diese Beispiele zeigen aber ein düstereres Bild als der Schnitt. Im OECD-Gesamtvergleich von 28 Ländern, ist der Anteil an jungen Menschen noch größer, als der mit Menschen über 65 Jahren.

Österreichs Tageszeitungen auf sozialen Medien 2017

A Year in Review

Fast jede Tageszeitung Österreichs nutzt inzwischen soziale Medien, um ihre Inhalte zu bewerben. Mit 3,7 Millionen österreichischen Nutzern im Dezember 2017 (Quelle: statista) ist Facebook bei weitem das meistgenutzte – und somit fundamental für die Digitalisierung dieser Tageszeitungen. Wie schlugen sie sich aber im vergangenen Jahr? Und was zog medial in Österreich letztendlich auf sozialen Medien die meiste Aufmerksamkeit auf sich? Um diese Fragen zu beantworten, wurden die Social Media-Auftritte aller österreichischen Tageszeitungen im Zeitraum 1.1.2017-23.1.2017 analysiert. In diesem Zeitraum wurden von den 13 analysierten Medien insgesamt 12979 Postings verfasst – Nutzer generierten daraufhin insgesamt rund 1,08 Millionen Reaktionen.

DerStandard hält weiterhin den ersten Platz, was Facebookfans betrifft. Die Krone kommt dem Medium allerdings mit nur mehr rund 16.000 Fans Differenz immer näher. Überhaupt auffällig ist, dass die Anzahl der Fans nicht die Anzahl der Reaktionen widerspiegelt: Die Krone hatte mit großem Abstand die meisten Reaktionen (433.787), die Heute – bei Fans bloß am vierten Platz – folgt mit 281.216 Reaktionen an zweiter Stelle. Dies suggeriert, dass die Krone 2017 entweder auffällig reaktionsauslösende Postings verfassen konnte, oder aber auch viel über Facebook warb. DerStandard generierte mit rund 306.000 Fans bloß ca. 175.000 Reaktionen – bloß rund 30.000 mehr als etwa DiePresse, obwohl ersteres Medium über 100.000 Fans mehr zählt.

Postings mit den meisten Reaktionen

 

Obwohl es auch einige Postings mit anderen Themen in der Top 10 gibt, dominieren politische Postings, welche mit der aktuell gewählten Regierung aus ÖVP-FPÖ in Verbindung stehen. Bei Krone und oe24 reagieren User bei solchen Postings hauptsächlich mit Likes und “Love”, während sich bei Presse und Standard viele “Angrys” finden.

Videoinhalte: Trend, vor allem im Boulevard

Videoinhalte waren vergangenes Jahr besonders bei Boulevardmedien im Trend. Vorarlberg Online veröffentlichte gar bei insgesamt 1029 Postings 483 Videos, es folgt die Heute mit 302 Postings, oe24 mit 241 Videoinhalten und die Krone mit 114. Alle anderen erfassten Medien posteten gemeinsam weitere 394 Videos.

Überraschend ist, dass Heute und vol.at mehr Videopostings erstellt haben als oe24 (im Falle von vol.at sogar mehr als doppelt so viele) – und das, obwohl der Onlineauftritt der Österreich seit August 2016 einen einen Online-TV-Sender beinhaltet. Das erste Qualitätsmedium, welches in der Liste erscheint, ist der Kurier mit 82 Videos, gefolgt von dem Standard mit 70 Videos.

Wut: Die am stärksten ausgedrückte Reaktion

“Angry” ist bei weitem die am meisten genutzte Reaktion. Dies liegt sehr stark daran, dass die Reaktion bei den vier Medien mit dem meisten Fans und Interaktionen allgemein – Krone, Heute, oe24 und DerStandard – auch die meistgenutzte ist. Auffällig ist, dass eine Sortierung nach wütenden Reactions, nach “Hahas” und nach Gesamtreactions bei den ersten fünf Ergebnissen dieselbe Reihenfolge ergibt: Krone, Heute, oe24, Standard und zuletzt Presse. Dies ist beispielweise bei der Reaktion “Love” nicht so.

Krone, Heute, Österreich: Das Wut-Triumvirat

Krone, Heute und oe24 alleine produzierten im vergangenen Jahr mehr als zwei Drittel aller “Angry”-Reaktionen. Zwar schafften die drei Medien auch die meisten Reaktionen allgemein, trotzdem aber liegen die Zahlen der “Angry”-Reaktionen bei den drei Medien weit über dem allgemeinen Durchschnitt des Social-Media-Auftritts der Tageszeitungen 2017.

Medien Postings mit den meisten “Angry”-Reaktionen

 

Die wohl wutaufschäumendsten Themen variieren nach Medium. Die Heute kommt ausschließlich mit Beiträgen zu Tierquälerei vor, ansonsten entwickelten sich die “Angry”-Reaktionen auffällig entsprechend der politischen Richtung der jeweiligen Medien. Ebenfalls auffällig ist, dass weder der erste noch der der zweite Platz der meisten “Angry” Reaktionen Heute, oe24 oder Krone ist. Stattdessen sind es Presse und Standard – beide mit Meldungen über Entscheide der neuen Regierung.

 

Alle erfassten Daten stehen hier zur Verfügung (Google-Drive-Link).

Wohin fließt der ÖH-Beitrag?

Knapp 380.000 Studierende sind in Österreich an öffentlichen und privaten Hochschulen inskribiert. Jeder von ihnen zahlt pro Semester einen Beitrag an ihre gesetzlichen Vertretung: Der Österreichischen Hochschülerinnen- und Hochschülerschaft (ÖH).

Wohin die Studierendenbeiträge nun fließen sollen, will die neue Regierung ändern. Das aktuelle Regierungsprogramm sieht vor, dass die ÖH ihre Mittel in der Höhe von 6.8 Millionen Euro „ausschließlich für Aufgaben der Beratung und Interessenvertretung von Studierenden“ einsetzen dürfe. Sie soll sich mehr auf den direkten Service für Studierende konzentrieren. Damit soll dem allgemeinpolitische Mandat der ÖH ein Riegel vorgeschoben werden. Ob das die Studierenden stört, bleibt fraglich, denn die Wahlbeteiligung der Interessensvertretung lag bei der letzten Wahl knapp unter 25%.

Das Hochschulgesetz lässt sehr viel Spielraum, in welchen Belangen die ÖH die “allgemein und studienbezogenen Interessen ihrer Mitglieder” vertritt, weshalb die Hochschulvertreter immer wieder durch fragwürdige finanzielle Investitionen medialer Kritik ausgesetzt sind: Von der Gründung eines Cafés der ÖH Uni Wien, den zu viel verkaufte Ballkarten der ÖH WU Wien oder der Finanzierung von “Demo-Bussen”.

ÖH-Vertretungen verfügen autonom über ihre Budgets

Die einzelnen ÖH-Vertretungen besitzen autonome Handlungsfähigkeiten, weshalb die Studienbeiträge auch unterschiedlich eingesetzt werden.
Derzeit beläuft sich der ÖH-Beitrag auf 18.50 Euro (Im Studienjahr 2015/16 waren es 18.00 Euro). Die Aufteilung des Betrags auf die Bundesvertretung und die einzelnen Hochschulvertretungen ist im aktualisierten HSG von 2014 vorgegeben:

Fast die Hälfte des ÖH-Beitrags der ÖH Uni Wien geht ans Personal

Die ÖHs der drei größten Universitäten Österreichs erhielten 2015/16 Studienbeiträge in der Höhe über 3,2 Millionen Euro. Hinzu kommen andere Erträge wie Subventionen, betriebliche Erträge oder Vermögenserträge.


Während also bei der Uni Wien die Studienbeiträge 90% des Gesamtbudgets der ÖH-Vertretung ausmachen, ist der Anteil an der WU Wien gerade einmal knapp unter 60%. Einen großen Anteil ihrer Einnahmen machen hier die Erträge der einzelnen Referate aus (Sonstige Erträge).
Auch bei der Betrachtung der Ausgaben werden große Unterschiede sichtbar. Während die ÖH Uni Innsbruck mehr als ein Viertel ihres Budgets für Projekte ausgab, fiel fast die Hälfte der Kosten der ÖH Uni Wien auf Gehälter für Personal und Aufwandsentschädigungen für gewählte ÖH-Vertreter/innen.

Ein Euro für Rücklagen

Die Verteilung des Budgets ist jedoch mit Vorsicht zu genießen: Während die ÖH Uni Wien eine genauere Aufschlüsselung bietet und Stipendien, spezielle Beratungen, Exkursionen und Seminare separat aufweist, fasst die ÖH WU Wien diese in ihrem Jahresabschluss im “Sachaufwand” zusammen.

Was die drei größten Hochschulvertretungen Österreichs jedoch gemeinsam haben: Zirka ein Euro pro ÖH-Beitrag blieb übrig – Diese fließen in Rücklagen der einzelnen Vertretungen ein und werden bei Bedarf aufgelöst, beispielsweise für die ÖH-Wahlen, die alle zwei Jahre stattfinden.

1.46 Euro für Weiterbildung von ÖH-Mandatar/innen

1.46 Euro gab jeder Studierender der Uni Wien pro Semester für Reise- und Fahrtkosten aus. Die ÖH-Vertreter/innen finanzierten damit verschiedene Seminare und Exkursionen, die hauptsächlich von ihren eigenen Mandatar/innen in Anspruch genommen wurden.

Insgesamt 79.819 Euro (oder 0.56 Euro pro Studierender) wurden für Stipendien ausgeschüttet. Damit werden sozial-schwächer gestellte Studierende unterstützt, aber auch wissenschaftliche Arbeiten oder Studierendenprojekte gefördert.

 

Die ÖH der WU Wien hält sich bedeckter in ihrem Jahresabschluss. Zwar können die Sachaufwand-Kosten den einzelnen Referaten und Studienvertretungen zugeordnet werden, wofür das Geld ausgegeben wird, ist für Außenstehende unklar.

 

Auch an der ÖH Uni Innsbruck wird ein beträchtlicher Teil des Hochschulbeitrags für das Personal ausgegeben: Ganze 5.50 Euro zahlten Studierende für Angestellte und Mandatar/innen der ÖH. Immerhin: Mit knapp 230.000 Euro (oder 4.02 Euro pro Studierender) wurden die ÖH-eigene Kinderkrippe und diverse Studierendenprojekte, aber auch Studierende in Notsituationen unterstützt.

Bildungspolitische Erfolge kaum sichtbar

Hinter der Österreichischen Hochschülerinnen- und Hochschülerschaft steckt wie bei einer staatlichen Institution ein großer Verwaltungsapparat, der sich in den Kosten widerspiegelt. Ähnlich anderen Interessensvertretungen ist fraglich, ob sich die Ausgaben und die daraus resultierenden bildungspolitischen Interventionen und Erfolge rechtfertigen lassen.

Eines ist sicher: Wird der derzeitige Regierungsplan so umgesetzt, wird sich dies in den Ausgaben der ÖH-Vertretungen widerspiegeln lassen.

Quellen:
Statistik Austria
Hochschülerinnen- und Hochschülerschaftsgesetz (HSG) 2014
ÖH Universität Wien Jahresabschlussbericht 2015/2016
ÖH Wirtschaftsuniversität Jahresabschlussbericht 2015/2016
ÖH Universität Innsbruck Jahresabschlussbericht 2015/2016
Bundesvertretung der ÖH Jahresabschlussbericht 2015/2016

Nationalratswahl 2017 – data to play with

Mandatsverluste und -gewinne

 

Mandatsverteilung


Google Spreadsheet mit den eingelesenen Daten

 

 

 

 

 

10 praktische Google Spreadsheet Formeln für Datenjournalisten

Eine kurze Einführung in einige hilfreiche Google Spreadsheet Formeln, besonders hilfreich für datengetriebenen Journalismus.

(1) SPLIT

Sample Data for split formula

Teilt Text an bestimmten Trennzeichen in einzelne Zellen auf (das Trennzeichen wird dabei entfernt – entspricht der Menüfunktion “Text in Spalten aufteilen”):

=SPLIT(C3; ":"; TRUE)
  • Was soll aufgeteilt werden?
  • Angabe des Trennzeichen
  • Angabe ob bei jedem Vorkommen des Trennzeichens getrennt werden soll

(2) VLOOKUP

Animated gif with sample vlookup formula

Senkrechter Verweis. Sucht von der ersten Spalte eines Bereichs abwärts nach einem Schlüssel und gibt den Wert einer angegebenen Zelle in der Zeile zurück, die gefunden wurde. Sehr hilfreich beim Zusammenführen von Daten in verschiedenen Tabellenblättern mit einem gemeinsamen Schlüssel.

=VLOOKUP(A3;'02 - VLOOKUP (b)'!A:B;2;FALSE)
  • Angabe des Suchschlüssels
  • Bereich in dem gesucht werden soll (im Beispiel im Tabellenblatt mit dem Namen “02 – VLOOKUP (b)” in den Spalten A und B)
  • Angabe der Spalte im Bereich, die zurückgegeben wird
  • Angabe, ob die zu durchsuchende Spalte (die erste Spalte des angegebenen Bereichs) sortiert ist (default ist TRUE; wenn der Schlüssel nur 1x im Bereich vorkommt ist FALSE empfehlenswert)

 

HLOOKUP funktioniert analog als horizontaler Verweis.

 

(3) GOOGLETRANSLATE

Sample formulas for googletranslate

Liefert Übersetzungen via Google Translate – schneller Weg für Übersetzungen, die natürlich wie immer bei automatischen Übersetzungen mit Vorsicht zu genießen sind. Für fremdsprachige Datensätze aber mitunter sehr hilfreich.

=GOOGLETRANSLATE(A4; "de"; "fr")
  • Was wird übersetzt (Text oder Zellen)
  • Länderkürzel der Sprache des Quelltextes
  • Länderkürzel der Sprache in die übersetzt wird

(4) CONCATENATE

Concatenate sample formula

 

concatenate2

Verknüpft Zeichenfolgen miteinander (umgekehrte Funktion zu SPLIT).

=CONCATENATE(A2:A5;)
=CONCATENATE(A2; " "; A3; " "; A4; " "; A5; " ")
  • Angabe der zu vernüpfenden Zeichen (z.B. ein Bereich mehrerer Zellen)
  • Angabe kann beliebig oft wiederholt werden (Beispiel 2 mit Einfügen von Leerzeichen zwischen Zellwerten)

(5) LEFT, MID, RIGHT

Sample formula for left function

 

mid

 

right

Mit LEFT, MID und RIGHT erhält man den Teil einer Zeichenfolge.

=LEFT(A1; 3)
  • Die ersten 3 Zeichen von links werden ausgegeben
=MID(A1; 5; 6)
  • Ab dem 5. Zeichen werden die folgenden 6 Zeichen ausgegeben (Achtung: ein Leerzeichen wird mitgezählt, es ist ja auch ein Zeichen)
=RIGHT(A1; 10)
  • Die ersten 10 Zeichen von links werden ausgegeben

(6) SUBSTITUTE

Sample formula for substitute

Ersetzt Teile in einem Text durch eine neue Zeichenfolge.

=SUBSTITUTE(A2; "Max"; "Sabine"; 1)
  • Angabe des Ausgangstextes (z.B. Zelle A2)
  • Zeichenfolge, die ersetzt werden soll
  • Neue Zeichenfolge
  • Anzahl der Wiederholungen (wenn die zu ersetzende Zeichenfolge mehrfach vorkommt; default ist alle Vorkommen zu ersetzen)

(7) UNIQUE

Sample formula for Unique

Gibt eindeutige Werte/Texte aus dem angegebenen Quellbereich zurück.

=UNIQUE(A2:A12)
  • Angabe des Bereichs, in dem die eindeutigen Werte gesucht werden

(8) AVERAGE + MEDIAN

Sample formula for average

 

median

Average errechnet den Mittelwert (Durchschnitt) aus einem angegebenen Bereich; mit Median wird der mittlere Wert errechnet (man stellt sich alle Werte als aufsteigende Reihe vor, und es wird genau der Wert in der Mitte dieser Reihe zurückgegeben). Bei Daten zu Einkommen o.ä. ist oft der Median aussagekräftiger, weil er immun gegen einzelne starke Ausreisser am oberen oder unteren Ende der Reihe ist.

=AVERAGE(B2:B9)
=MEDIAN(B2:B9)
  • beim Median kommt im Vergleich zu Average ein niedrigerer Wert zurück, weil im angegebenen Bereich 8 Werte vorhanden sind, es wird bei einer geraden Anzahl der Durchschnitt der beiden mittleren Werte genommen (im Beispiel: 2500 und 3000 -> Durchschnitt davon 2750, das ergibt den Median)

(9) TRIM

Screenshot Trim Formel

Entfernt unnötige Leerzeichen (am Anfang, am Ende, doppelte Leerzeichen innerhalb des Strings):

=trim(" lorem ipsum")
=trim(A2)

(10) IMPORTHTML

Screenshot showing importhtml formula on sample data

 

Import die Daten einer Tabelle oder einer Liste aus einer HTML-Seite:

=IMPORTHTML("https://de.wikipedia.org/wiki/Liste_der_höchsten_Bauwerke_der_Welt"; "table"; 1)
  • Angabe der URL
  • Element (table oder list)
  • Index des Elements (die wievielte Tabelle/Liste in der HTML-Seite)

Aktualisiert sich laufend aus der HTML-Seite.

 

Daten der Beispiele:

Weiterführende Links:

Pimp my data – UEFA Ausschüttungen 2016

In diesem Artikel auf orf.at verliert man leicht den Überblick – eine erste Hilfe ist ein Textmarker:

uefa-zahlte-rapid-10-6-mio-euro-praemien-sport-orf-at

Noch hilfreicher ist eine Tabelle, die auf einen Blick die Größenordnungen klarmacht:

Syllabus #ddj – Wintersemester 2016/17

 1. Termin (6.10.) – Best practice data driven journalism #ddj

  • Geschichtlicher Abriss, Wurzeln in CAR
  • Multimedia Storytelling Ende 1990er
  • Berührungspunkte Open Data Bewegung
  • Wichtige Player, globale Vernetzung
  • Technische Rahmenbedingungen (Ablöse von Flash, nativer Browsersupport)
  • Auswirkungen der Endgeräterevolution für Präsentation Te(Desktop, Tablet, Mobile…)
  • Beispiele aus der internationalen Praxis

2. Termin (3.11.) – Getting the Data

  • Verfügbarkeit von Daten
  • Rechtliche Rahmenbedingungen (FOI,…)
  • Skillsets und Tools zum Scrapen
  • Bereinigen und Verdichten von Daten
  • Verknüpfen verschiedener Datensätze
  • Visualisierung Einführung Teil 1

3. Termin (18.11.) – Data driven storytelling (1)

  • Befragen der Daten
  • Identifizieren einer tragfähigen Story
  • Visualisierung Teil 2 – hands on Datawrapper

4. Termin (24.11.) – Data driven storytelling (2)

  • Abgrenzung des Projektscopes
  • Antizipieren des Userinteresses
  • Konzeption der Userexperience (UX)
  • Präsentation & Diskussion Blogposts (überarbeitete Texte) Teil 1

5. Termin (1.12.) – Data driven storytelling (3)

  • Best practice Beispiele
  • Vertiefung Bereinigung und Verdichtung
  • Präsentation & Diskussion Blogposts (überarbeitete Texte) Teil 2

6. Termin (22.12.) – Reality Check

  • Kriterien zur Beurteilung bestehender #ddj Anwendungen
  • Kriterien für die Erstellung eigener #ddj Anwendungen
  • Grundlagen Statistik, Kartografie, Informationsdesign
  • #ddj am Plateau of productivity
  • Konzeption und Erstellen eigener #ddj Artikel/Anwendung
  • Präsentation und Diskussion eigenständige Blogposts

Abgabe Termin (13.1.) –

  • Abgabe von ausständigen Blogposts per Mail

Wenn Mary Poppins nur wäre

Vor wenigen Tage wurde die Reform des Kinderbetreuungsgeldes „Kindergeld neu“  seitens des Familienministeriums in Begutachtung geschickt (der Standard berichtete).
Anstelle des „Papa-Monates“ wird es nun „Familienzeit“ geben – Väter können somit direkt nach der Geburt ihres Kindes 31 Tage lang zu Hause bleiben und werden für diesen Zeitraum mit einer Pauschalsumme von 700 € abgegolten. Familien sollen somit entlastet werden.
Doch, wie sieht es mit Familienzeit aus, sobald die Kinder schulpflichtig sind? Wer übernimmt die Kinderbetreuung?

Dieser Fragestellung widmete sich eine quantitativ-qualitativ orientierte Studie des Österreichischen Institutes für Familienforschung (ÖIF) mit Kindern im Alter zwischen 8 und 10 Jahren.

Weiterlesen