Das Diversity Tech Tool umfasst die Sammlung, Analyse und Visualisierung von Daten zur Sichtbarkeit von Wissenschaftlerinnen.
Zur Datenanalyse werden öffentlich zugängliche Texte aus der öffentlichen Berichterstattung von Universitäten, Forschungseinrichtungen sowie aus klassischen und digitalen Medien (z.B. Nachrichtenartikel, Pressemitteilungen, Bekanntmachungen, Interviews, Leserkommentare und -diskussionen) genutzt. Diese werden regelmäßig und automatisiert über APIs erhoben oder stammen direkt von deutschen Medienhäusern, mit denen im Rahmen dieses Projekts eine Kooperation besteht.
Diese Daten werden mit Natural Language Processing (NLP) und den neuesten Entwicklungen im Bereich der Large Language Models (LLMs) analysiert, um die quantitative Repräsentation von Wissenschaftlerinnen (z.B. Anzahl Zitationen pro Thema, Anzahl Bilddarstellungen, Nennungen bei Gremien und Ausschüssen) sowie die qualitative Repräsentation (z.B. stereotypische vs. contra-stereotypische Darstellung in verschiedenen Themengebieten) präzise zu erfassen.