Universität Cardiff

Cloudbasierte Analysetools erkennen Hate Speech in sozialen Medien mithilfe von Machine Learning

Universität Cardiff

Gofore arbeitet zusammen mit der Universität Cardiff an der Entwicklung von Analysetools für soziale Medien bei Behörden und Organisationen, die gegen die Verbreitung von Hassreden im Internet kämpfen.

Die ursprünglich 1893 gegründete Cardiff University gehört mit ihren derzeit über 30.000 eingeschriebenen Studenten zu den zehn größten Universitäten im Vereinigten Königreich. Ihr Social Data Science Lab führt Sozialdatenanalysen für Forschung, Politik und Praxis durch und entwickelt Tools für diesen Zweck.

Nach dem Austritts-Votum des Vereinigten Königreichs 2016 und den Terroranschlägen 2017 kam es in Großbritannien zu einem Anstieg von Hass-Delikten. Der leitende Forscher, Professor Matthew Williams, sagte: “Unsere Analyse zeigt, dass Social-Media-Posts der Presse und der Polizei unmittelbar nach terroristischen Vorfällen eine große Reichweite haben. Dadurch besteht die Möglichkeit, mit Gegenreden zu reagieren, z. B. Gerüchte zu zerstreuen und Stereotypen zu widerlegen, um die Opfer zu unterstützen und die Verbreitung von Hassreden zu verhindern.

Die Universität Cardiff hatte einen Prototyp des Hate-Speech Dashboards entwickelt, um aggregierte Trends von Hassreden bereitzustellen. Das System verwendet natürliche Sprachverarbeitung (NLP) und durch maschinelles Lernen trainierte Klassifizierungsmodelle, die Hassreden in verschiedenen Kategorien erkennen, wie z.B. Rechtsextremismus, Antisemitismus, Islamfeindlichkeit und Anti-LGBT. Mit den jüngsten Entwicklungen wurde das Hinzufügen und die Integration neuer Klassifikatoren, die auf den Anforderungen der Benutzer basieren, vereinfacht.

Dabei gab es Grenzen, insbesondere was die Skalierbarkeit des Dienstes anging. Auch die Gesamtarchitektur und die Benutzerschnittstelle bedurften eines Upgrades. Das Ziel bestand darin, die Lösung vollständig in die öffentliche Cloud-Infrastruktur zu überführen, um einen effizienten Betrieb und die erforderliche Skalierbarkeit für die Zukunft zu gewährleisten. Im Januar 2019 erhielt Gofore im Rahmen einer öffentlichen Ausschreibung den Auftrag, die Entwicklung des Tools zu übernehmen. Das Projekt wurde vom britischen Economic and Social Research Council (ESRC) finanziert.

Schnelle Erkennung und Reaktion auf Online-Hassreden

Bereits mit dem Pilotinstrument konnte das UK National Online-Hate-Crime-Hub die Ausbrüche von Hassreden in den sozialen Medien nahezu in Echtzeit verfolgen. Sie konnten die Hassthemen und die zugehörigen Hashtags schnell erkennen, was die Möglichkeiten zur Überwachung und Erkennung von Spannungsfeldern und zur schnellen Reaktion darauf durch Gegenrede verbessert hat.

Mit der in der zweiten Phase erweiterten und skalierbaren Lösung werden verschiedene Organisationen, die gegen Diskriminierung, Ungleichheit und Hassreden in sozialen Medien kämpfen, über bessere Instrumente verfügen, um ihre Bemühungen zu konzentrieren.

Professor Matthew Williams fasst die Ergebnisse zusammen: “Ein unbeständiges technisches Umfeld machte unsere Anforderungen an HateLab komplex und veränderlich, was einen anspruchsvollen Entwicklungsprozess zur Folge hatte. Gofore war dieser Herausforderung gewachsen und hat alle Anforderungen rechtzeitig erfüllt. Klare Kommunikationswege sorgten dafür, dass der gesamte Prozess reibungslos verlief.”

Ein unbeständiges technisches Umfeld machte unsere Anforderungen für HateLab komplex, was einen anspruchsvollen Entwicklungsprozess zur Folge hatte. Gofore war dieser Herausforderung gewachsen und hat alle Anforderungen rechtzeitig erfüllt. Klare Kommunikationswege sorgten für einen reibungslosen Ablauf des gesamten Prozesses.

Matthew Williams, Professor, Universität Cardiff

Vom Prototypen zum nutzerzentrierten Service

Zunächst wurde die Pilotversion des Tools auf der Grundlage von Amazon Web Services entwickelt. Die gesamte Frontend-Benutzeroberfläche, einschließlich der Nutzerforschung mit den ersten erwarteten Pilotnutzern, die erforderlichen Datenerfassungsvorgänge und Visualisierungen wurden entworfen und entwickelt. Im Backend wurde eine serverlose Technologie verwendet, um einen skalierbaren Datenfluss für die Aufnahme und Klassifizierung von Tweets in Echtzeit zu schaffen. Nach dem Klassifizierungsprozess wurden Metadaten extrahiert und aggregiert, um nützliche Statistiken zu erstellen. Für die Bereitstellung der Daten und die Benutzerauthentifizierung für die Endnutzer wurde ein Webservice eingerichtet. Die von der Universität Cardiff entwickelten Klassifikatoren für Hassreden wurden in die serverlose Architektur integriert. Das Tool wurde dem UK National Online Hate Crime Hub zur Pilotnutzung zur Verfügung gestellt.

In der zweiten Phase wurde das System für die Erweiterung und Skalierbarkeit vorbereitet. Zusätzlich zum Online-Hate-Crime-Hub wurden die Erwartungen und Anforderungen von drei weiteren Organisationen an das Tool durch umfassende Nutzerforschung erhoben. Das Backend wurde so gestaltet, dass es die einfache Erstellung mehrerer paralleler Cloud-Umgebungen mit Terraform ermöglicht, so dass für jede neue Organisation eine eigene Instanz bereitgestellt werden kann. Die Benutzeroberfläche wurde für eine flüssigere Benutzererfahrung aktualisiert und um neue Funktionen erweitert.

Die Verantwortung für den Betrieb und die Wartung des Systems liegt seit jeher beim Gofore Service Centre.

Technologien

  • Twitter Enterprise API, Twitter free API v2, Pushshift API für Reddit usw.
  • AWS Lambdas, Firehose, Elastic Container Service (ECS), REST API
  • Docker, Terraform, Infrastruktur als Code (IaC)
  • Maschinelles Lernen, Verarbeitung natürlicher Sprache (NLP)

Highlights

Skalierbare Nutzung von Cloud-Services

Effiziente Nutzung der nativen AWS-Dienste. Verschiedene Datenquellen. Automatisierte Erstellung dedizierter Instanzen für zusätzliche Organisationen.

Datenanalyse und -klassifizierung in Echtzeit

Kontinuierlicher Datenzufluss: Visualisierung von Hassreden in der Granularität von einer Minute und Betrachtung von längerfristigen Trends.

Zusammenhalt statt Hass

Schnelle Reaktion auf Hassreden. Objektive und faktenbasierte Gegenrede. Entschärfung von toxischen Reaktionen.

Neugierig geworden? Dann nehmen Sie Kontakt auf.

Fabian Schiller

Digitale Gesellschaft

fabian.schiller@gofore.com

+49 151 585 11853

Back to top