Boston/ Pennsylvania – Forscher an der Harvard Medical School http://hms.harvard.edu haben einen neuen Algorithmus entwickelt, der Grippeerkrankungen in den Vereinigten Staaten aufspüren kann, indem er Daten von Wikipedia auswertet. Das Programm überwacht eine Handvoll von Einträgen, die erkrankte Personen oder deren Angehörige oft nachschlagen. Dazu gehören zum Beispiel „Grippesaison“, „Fieber“ oder „Epidemie“. Jede Stunde werden die öffentlich zugänglichen Informationen danach abgefragt, wie viele Menschen im ganzen Land diese Internetseiten besucht haben. Ein anderes Projekt wiederum versucht sich an Krankheits-Vorhersagen auf Basis von Twitter-Feeds.
Wikipedia ist eine Fundgrube für Daten
Als die Wissenschaftler die Wikipedia-Daten mit jenen der Centers for Disease Control http://www.cdc.gov verglichen, zeigte sich, dass sie die Anzahl der Erkrankungen zwei Wochen im Voraus mit nur 0,27 Prozent Abweichung genau vorhersagen konnten. In den vergangenen Jahren hat das Interesse von Vertretern des Gesundheitswesens an Internetdaten wie sozialen Netzwerken oder Suchanfragen zugenommen. Ein Vorteil des Einsatzes von Wikipedia ist laut dem Studienautor John Brownstein, dass diese Daten nicht von einer einzelnen Institution kontrolliert werden: „Die Daten von Wikipedia stehen einfach allen zur Verfügung.“
Da der Algorithmus bei der Grippe bewiesen hat, dass er funktioniert, wollen die Wissenschaftler sich jetzt an schwierigere Themen heranwagen. Dazu gehört unter anderem die Reaktion von Menschen auf politische Entscheidungen, die mit der Gesundheit zu tun haben. Zusätzlich wollen sie die Daten pro US-Bundesstaat oder Bezirk aufschlüsseln und damit die Schätzungen für die Fachöffentlichkeit nützlich machen. Wikipedia stellt diese genaueren Informationen jedoch nicht zur Verfügung. Daher würde dafür eine Überprüfung der IP-Adressen der Nutzer erforderlich.
Tweets von Studenten analysiert
Die meisten Internet-Tracking-Projekte konzentrieren sich aufgrund des Schutzes der Privatsphäre und der eingeschränkten Menge an frei zugänglichen Daten auf ganz allgemeine Erkrankungen in großen Regionen. Wissenschaftler der Pennsylvania State University http://www.psu.edu wollen genau diesen Ansatz mithilfe eines Algorithmus auf den Kopf stellen, der Twitter-Feeds analysiert. Das Team hat in einem Versuch die Feeds von 104 Studenten unter die Lupe genommen.
Bei einigen Studenten war bekannt, dass bei ihnen im Verlauf des Jahres eine Grippe diagnostiziert worden war. Neben ihren eigenen Tweets wurden auch die Nachrichten ihrer Follower und jener Nutzer, denen sie folgen, analysiert. Das Programm suchte nach Schlagwörtern zum Thema Krankheit wie Grippe, Fieber, Husten oder Medizin. Dazu kam die Nennung von Aktivitäten wie Partys, für die man gesund sein muss, sowie Veränderungen der Twitter-Nutzung. Anhand der Daten konnte mit 99 Prozent Genauigkeit ermittelt werden, ob ein Student in einem bestimmten Monat Grippe hatte.
Alternativen zu Google Flu Trends
Solche Daten könnten laut Todd Bodnar vom Center for Infectious Disease Dynamics http://www.cidd.psu.edu für jene nützlich sein, die eine bestimmte Gruppe von Menschen beobachten wollen: „Wenn ich wissen will, ob ich eine Schule schließen soll oder nicht, könnte der Zugang zu den Erkrankungszahlen in Echtzeit sehr nützlich sein.“
Google Flu Trends http://www.google.org/flutrends , eines der bekanntesten Trackingprojekte, hatte zuletzt aber mit negative Schlagzeilen zu kämpfen. Denn eine Studie in Science http://www.sciencemag.org kam zu dem Ergebnis, dass die Site die Anzahl der Erkrankungen ständig zu hoch ansetzte. Studienautor David Lazar von der Northeastern University https://www.northeastern.edu geht laut NewScientist davon aus, dass Daten von Sites wie Wikipedia oder WebMD http://www.webmd.com offiziellen Stellen genauere Informationen über die Gesundheitsprobleme der Bevölkerung liefern könnten.
Aussender: pressetextAnsprechpartner: Michaela Monschein
(Foto: pixelio.de, Maria Lanznaster)
Hallo-Holstein.Redaktion: Torben Gösch