polmineR als Baustein einer digitalen Forschungsinfrastruktur

Im PolMine-Projekt arbeiten wir mit mittelgroßen bis großen Korpora. Doch der Dialog mit ‘großen Daten’ erfordert passende Instrumente für die Analyse. Dem dient die Entwicklung des ‘polmineR’, einer in der Statistiksprache R implementierten Auswertungsumgebung zur Arbeit mit Textdaten. Als quelloffenes Software-Paket steht dieses über die Plattform GitHub zur Verfügung. Entsprechend der Leitidee des ‘blended reading’ öffnet der polmineR zum einen den Weg zur Methodologie quantitativer textstatistischer Auswertungen, die in R umfassend umgesetzt werden kann. Andererseits hält das Softwarepaket den Weg zum ursprünglichen Text offen, so dass textstatistisch identifizierte Muster textnah interpretiert werden können. Intention und Implementierung des R-Pakets wurden am 30. Juni 2015 beim 3. Clarin-D Fach-AG Workshop in Leipzig (“Fächerübergreifende Perspektiven durch digitale Forschungsinfrastrukturen”) präsentiert. Die Folien zur Präsentation sind hier verfügbar.