Künstliche Intelligenz in Form neuronaler Netze bietet nicht nur Chatbots und Bildgeneratoren, sondern auch die Möglichkeit, neue digitale Methoden in der Forschung anzuwenden oder sie reflexiv zu analysieren. In diesem Blogbeitrag stelle ich drei dieser Ansätze vor, die ich im Rahmen meines Reisestipendiums der Gerda Henkel Stiftung auf der Jahrestagung der Digital Humanities im deutschsprachigen Raum (DHd23) kennenlernen durfte. Für das Stipendium bedanke ich mich nochmals sehr herzlich bei der Gerda Henkel Stiftung und dem Stipendienprogramm der DHd23. Begleitet wird dieser Beitrag von einem Whiteboard mit Mindmap, auf dem die wichtigsten Aspekte auch visuell dargestellt werden.
KI-basierte Tools und Forschungsmethoden auf der DHd23 - eine Mindmap
Beitrag zur DHd2023 "Open Humanities Open Culture" in Trier vom 13.-17. März 2023
PhilroBERTa:
Einer prägenden Dichotomie der Philosophie nachzuspüren, dieser Aufgabe stellten sich Maximilian Noichl und Lukas Panzer in ihrem Vortrag “PhilroBERTa: Ein multilinguales Sprachmodell zur Beantwortung philosophiehistorischer Fragestellungen”. Dabei nutzten sie neuronale Netze als Methode, um der Fragestellung nachzugehen, inwiefern die Teilung des Fachs in analytische und kontinentale Philosophie in einem Korpus aus 288.546 Texten erkennbar ist. Besonders herausfordernd ist dabei die Zusammensetzung der Texte: Sie bestehen aus Artikeln in englischer, aber auch anderer Sprachen. Methoden des “Natural Language Processing” wie beispielsweise Topic Modelling sind so erstmal nicht anwendbar. In dem von Noichl und Panzer vorgeschlagenen Alternativansatz werden die Texte in einem ersten Schritt nach einem BoW-Modell codiert und mit UMAP kartografiert. Mit dem BoW-Modell wird das sogenannte “Bag of Words” Verfahren abgekürzt. Dabei werden die Wörter in einem Text erst in einzelne Tokens aufgesplittet und anschließend als Vektor abgelegt. Die konkrete Reihenfolge der Wörter in dem Dokument wird dabei ignoriert. Daher der Begriff der “Bag”, in der alle Wörter zusammengefasst werden. Die Vektoren können dabei bis zu 300 Dimensionen haben, mit dem UMAP-Verfahren werden diese reduziert, wobei Strukturen und Verbindungen jedoch beibehalten werden (vergleiche auch t-SNE).
Nach diesem Verfahren kommen dann zwei Modelle zum Einsatz – ein englischsprachiges und ein multilinguales (GPL / TSDAE). Das englischsprachige Modell fungiert dabei als Teacher-Modell und das Multilinguale als Student-Modell. So können die unterschiedlichen Sprachen in den Artikeln angeglichen werden. Die philosophiehistorische Trennung zwischen kontinental und analytisch wird dann mit einem sogenannten Differenzvektor evaluiert und anhand weiterer Faktoren ausgewertet. Bei der Betrachtung dieser Differenzvektoren ist zu erkennen, wie sich die Gewichtung der philosophischen Strömung in den Texten verändert hat. Bis in die 1940er Jahre liefen sie parallel nebeneinander, um sich dann zugunsten der analytischen Philosophie zu verändern.
Open and Closed AI:
Mit neuronalen Netzen als bildsynthetisierenden Werkzeugen beschäftigte sich Peter Bell in dem Vortrag “Open and Closed AI. Eine Kunstkritik künstlich generierter Bilder.”. Dabei stand die sogenannte AI Art im Mittelpunkt, also Bilder, die mithilfe von generativen neuronalen Netzen erstellt wurden. Die meisten dieser Tools wie Midjourney, DALL-E oder Stable Diffusion sind auch für technische Laien gut nutzbar und die Ergebnisse werden in den sozialen Medien kräftig geteilt. Diese Entwicklung begann circa 2014 mit sogenannten GANs (Generative Adversarial Networks), die mit Kunstwerken wie “Portrait of Edmond Belamy” für Aufmerksamkeit sorgten. Aber handelt es sich dabei im engeren Sinne um Kunstwerke? Peter Bell stellt dabei interessante Charakteristika heraus: So können Fotografien in DALL-E 2 synthetisiert werden, während die niederländische Landschaftsmalerei aus dem 17. Jahrhundert noch einige Defizite aufweist. Besonders Details wie Kühe oder andere kleine Tiere in den Landschaften können nicht richtig generiert werden. So stellt sich weniger die Frage nach Kunstkritik, sondern eher die Imitation von Stilen der Kunstgeschichte. Oberflächen und Stile können realistisch synthetisiert werden, komplexere Kompositionen dagegen scheitern noch oder nehmen seltsame Formen an.
Selbstoptimierung vs. Selbstliebe:
Neuronale Netze als Werkzeug der automatischen Bildklassifikation stellte Christian Wolf in seinem Vortrag “Selbstoptimierung vs. Selbstliebe? Eine vergleichende Inhaltsanalyse von Fitspiration- und Bodypositivity-Bildern auf Instagram” vor. Die Untersuchung basiert auf einer Masterarbeit von Julia Glas. Dabei wurden aus einem Bildkorpus von 10.000 Bildern 1.000 Bilder händisch kodiert. Die verbleibenden 9.000 Bilder sollten dann durch ein neuronales Netz automatisch kodiert werden. Dafür wurde ein trainiertes CNN-Model (Convolutional Neural Network) mit den manuell ausgezeichneten Bildern angereichert (fine-tuning). Die automatisierten Klassifizierungen fielen dabei unterschiedlich gut aus – besonders bei Kategorien wie Körperbau, in dem mehr als zwei Ausprägungen unterschieden werden, konnte das neuronale Netz keine optimalen Ergebnisse erzielen. Als Befund konnten trotzdem Unterschiede und Gemeinsamkeiten der Hashtags #fitspiration und #bodypositivity evaluiert werden. So stellte Julia Glas anhand der angewandten Methode fest, dass bei #fitspiration schlanke und muskulöse Personen in Sportkleidung zu sehen waren, bei #bodypositivity dagegen eher klassische Schönheitsideale weiblicher Körper.
An diesen drei Ansätzen lässt sich schön nachzeichnen, wie neuronale Netze in den Geisteswissenschaften einerseits als Methode angewendet werden, aber auch als Untersuchungsgegenstand selbst. Mit Methoden des “Natural Language Processing” lässt sich ein Überblick über einen großen Textkorpus philosophischer Artikel gewinnen, während ein CNN-Modell mit Techniken der Computer Vision die Auswertung von Bildermengen ermöglicht, die manuell für eine Masterarbeit wahrscheinlich nicht leistbar wären. Bei der Bildgenerierung stellen sich schließlich für die Kunstgeschichte hochinteressante Fragen, die weniger von einem methodischen Standpunkt aus gewinnbringend sind, sondern die Frage nach Kunst und ihrer Verortung selbst stellen.
Zusammenfassend zeigt die DHd23 eindrucksvoll, wie vielfältig und innovativ der Einsatz von neuronalen Netzen in den Geisteswissenschaften sein kann. Die vorgestellten Projekte verdeutlichen, wie KI-basierte Tools und Forschungsmethoden nicht nur bestehende Herangehensweisen ergänzen, sondern auch ganz neue Fragestellungen und Perspektiven eröffnen. Dies zeigt, wie die Anwendung von KI in den Geisteswissenschaften nicht nur ein technisches, sondern auch ein epistemologisches Potenzial besitzt.