Christine Blauth-Henke, PhiN 43/2008: 54

PhiN 43/2008: 54

Lothar Lemnitzer und Heike Zinsmeister (2006): Korpuslinguistik. Eine Einführung. Tübingen: Narr. (= narr studienbücher)

Das zunehmende Interesse der Forschung an korpuslinguistischen Fragestellungen findet seinen Niederschlag auch in der ständig wachsenden Zahl korpuslinguistischer Lehrveranstaltungen nicht nur in der allgemeinen Sprachwissenschaft, sondern auch im Rahmen der verschiedenen Einzelphilologien. Während die englischsprachigen Einführungen in die Korpuslinguistik mittlerweile zahlreich sind, gab es zum Zeitpunkt des Erscheinens des anzuzeigenden Bandes keine deutschsprachige Einführung in die Korpuslinguistik.^* Die Einführung von Lothar Lemnitzer und Heike Zinsmeister will diese Lücke schließen und setzt sich das Ziel, den Leser – Zielgruppe sind Forscher und Studierende der (germanistischen) Sprachwissenschaft (11) – "zu eigener korpuslinguistischer Arbeit zu ermutigen" (3) und ihm "das Wissen und die Mittel an die Hand geben, die für die Planung und Durchführung korpuslinguistischer Untersuchungen benötigt werden" (11).

Die Einführung gliedert sich in sieben Kapitel. Jedem Kapitel wird eine kurze Zusammenfassung vorangestellt, den Abschluss bilden jeweils Hinweise zur weiterführenden Literatur sowie Übungsaufgaben. Die fehlende Angabe von Unterkapiteln im Inhaltsverzeichnis ist der Übersichtlichkeit nicht unbedingt zuträglich; dies mag aber Vorgaben des Reihenherausgebers geschuldet sein.

Das einführende Kapitel dient vornehmlich einer ersten Situierung der Korpuslinguistik sowie der Vorstellung der Gliederung. Insbesondere die amüsant-polarisierende Darstellung zweier Forschertypen (Denker vs. Beobachter) ist gut dazu geeignet, Studierenden Lust auf die weitere Lektüre zu machen. Dabei wird gleichzeitig bereits darauf hingewiesen, dass im Vergleich zu den 60er und 70er Jahren des vergangenen Jahrhunderts eine Annäherung beider "Lager" stattgefunden habe und dass der "Denker" durchaus auch von den Erkenntnissen des "Beobachters" profitieren könne und umgekehrt (cf. 6f.).

Die auch in der aktuellen Forschung (cf. beispielsweise Lehmann 2004 und 2007) geführte Diskussion der Frage, welche Daten Grundlage sprachwissenschaftlicher Untersuchungen sein können, wird sodann im zweiten Kapitel vertieft. Hier werden zunächst grundlegende Positionen des Empirismus und Rationalismus dargestellt, in der Folge werden diese in Bezug gesetzt zu den Positionen der generativen Grammatik einerseits und des britischen Kontextualismus andererseits. Das Kapitel schließt mit der Unterscheidung dreier Ausprägungen der Korpuslinguistik (korpusbasierter quantitativer, korpusbasierter quantitativ-qualitativer und korpusgestützter Ansatz).

PhiN 43/2008: 55

Bedauerlich ist einerseits, dass zwar in der Diskussion der rationalistischen und empiristischen Positionen darauf verwiesen wird, dass deren Ursprünge "bis in die antike Philosophie zurück reichen" und dass sie insbesondere "in der philosophischen Debatte des 17. und 18. Jahrhunderts entschieden verfochten wurden" (15), die Protagonisten dieser Debatte jedoch ungenannt bleiben. Andererseits wäre eine erweiterte Darstellung des Verhältnisses verschiedener Strömungen der Sprachwissenschaft zumindest in Form eines Ausblicks wünschenswert. So wird beispielsweise auf den (auch vielen Studierenden bekannten) Strukturalismus nur indirekt Bezug genommen, wenn die im Übrigen auf Saussure zurückgehende Schachmetapher (cf. Saussure 1972: 125) als Beispiel für die Kritik der generativen Grammatik an der Position Bloomfields, des Begründers des amerikanischen Strukturalismus, angeführt wird (15).

Im dritten Kapitel wird zunächst die Definition des linguistischen Korpus auch in Abgrenzung zu Korpora für nicht-linguistische Zwecke und zu linguistischen Belegsammlungen präzisiert. Dabei wird eine hochaktuelle Frage aufgegriffen und kritisch beleuchtet: Inwiefern kann das Internet als Korpus genutzt werden? (Cf. hierzu insbesondere die Diskussionen und Publikationen der "Wacky-Community" (= Web-as-Corpus kool ynitiative) unter http://wacky.sslmit.unibo.it/doku.php) Im Anschluss an die Einführung der wichtigen Unterscheidung von Primär- und Metadaten werden sodann methodische Probleme der Erstellung von Korpora und der Arbeit mit Korpora wie beispielsweise die Frage der möglichen Repräsentativität von Korpora beleuchtet. Das Abwägen verschiedener möglicher Positionen zu den dargestellten Problemen ist meines Erachtens sehr gut geeignet, Studierende für derlei Probleme zu sensibilisieren und bietet eine gute Grundlage für den letzten Teil des Kapitels, in dem eine kurze Anleitung zum eigenen Aufbau eines Korpus gegeben wird.

Verschiedenen Aspekten der Annotation von Korpora ist das vierte Kapitel gewidmet. In einem ersten Schritt wird der Nutzen der Annotation, insbesondere im Sinne der Wiederverwendbarkeit dargestellt. Sodann werden die verschiedenen Annotationsebenen unterschieden und gleichzeitig beispielsweise anhand des Stuttgart-Tübingen Tagsets (STTS) exemplifiziert. Es folgt ein Abschnitt zur Korpusabfrage, in dem Suchwerkzeuge und Darstellungsformen sowie (erweiterte) Abfragemöglichkeiten mit Hilfe regulärer Ausdrücke diskutiert werden. Genauer betrachtet werden insbesondere mit Korpora 'mitgelieferte' Suchwerkzeuge sowie weitere kostenlose Programme, wohingegen ein Hinweis auf Konkordanzprogramme wie WordSmith oder MonoConc fehlt. Auch dieses Kapitel schließt mit einem anwendungsbezogenen Teil, in dem eine Anleitung zur Annotation eines eigenen Korpus gegeben wird.

Das fünfte Kapitel gibt einen sehr guten Überblick über die verfügbaren deutschsprachigen Korpora. Die Orientierung wird durch die eingangs vorgestellte, auf den gewichteten Kriterien Funktionalität, Sprachenauswahl, Medium, Annotation, Größe, Persistenz, Sprachbezug und Verfügbarkeit basierende Typologie der Korpora erleichtert.

PhiN 43/2008: 56

Ziel des sechsten Kapitels ist es, exemplarisch korpusbasierte Untersuchungen aus verschiedenen Bereichen vorzustellen und dabei Möglichkeiten und Grenzen sowie Probleme einer korpuslinguistischen Herangehensweise aufzuzeigen. Die Autoren decken dabei einerseits ein breites Themenspektrum ab (Orthographie, Wortbildung, Syntax, Computerlinguistik, Lexikologie und Lexikographie, Partikeln, besondere Textsorten, Sprachlehre) und bemühen sich andererseits, verschiedene Arten der Korpusnutzung im Sinne der in Kap. 2 dargestellten Unterscheidung quantitativer und quantitativ-qualitativer korpusbasierter sowie korpusgestützter Ansätze vorzustellen. Die Vorstellung "guter" und "schlechter" Beispiele (cf. 170) dient auch hier wieder der Sensibilisierung des Lesers im Hinblick auf die Planung und Durchführung eigener Untersuchungen.

Das siebte und letzte Kapitel besteht aus einer informativen Zusammenstellung von Aussagen verschiedener Sprachwissenschaftler über ihre Arbeit mit Korpora. Man fragt sich allerdings, warum diese Zusammenstellung als letztes Kapitel firmiert und nicht als Teil des Anhangs, zumal das sechste Kapitel durchaus abschließenden Charakter hat.

Von den genannten Detaileinwänden abgesehen entsteht der Eindruck einer gut strukturierten und gut lesbaren Einführung. Der Aufbau sowohl der Einzelkapitel als auch des gesamten Buches – ausgehend von der wissenschaftsgeschichtlichen Verortung der Korpuslinguistik über methodologische Fragen der Erstellung von Korpora und der Arbeit mit diesen, hin zu konkreten Beispielen und Hilfestellungen für die eigene Korpusarbeit – ist gut durchdacht und überzeugend. Hervorzuheben ist neben dem sehr hilfreichen Glossar darüber hinaus die begleitende Website zum Buch (http://www.lemnitzer.de/lothar/KoLi/), auf der nicht nur die Errata zu jedem Kapitel aufgelistet sind, sondern auch Lösungsansätze zu den Übungsaufgaben. Gerade die allgemeineren Kapitel zu Beginn des Buches können gewinnbringend auch in nicht-germanistischen Lehrveranstaltungen eingesetzt werden. Die Konzeption von entsprechenden Einführungen auch für andere Einzelphilologien wäre nichts desto trotz zu begrüßen.

Bibliographie

Lehmann, Christian (2004): "Data in linguistics", in: The Linguistic Review 21 (3/4), 275–310.

Lehmann, Christian (2007): "Daten – Korpora – Dokumentation", in: Kallmeyer, Werner/Zifonun, Gisela (Hg.): Sprachkorpora – Datenmengen und Erkenntnisfortschritt. Berlin/New York: de Gruyter, 9–27.

PhiN 43/2008: 57

Saussure, Ferdinand de (1972): Cours de Linguistique générale. Publié par Charles Bally et Albert Sechehaye. Avec la collaboration de Albert Riedlinger. Éd. critique préparée par Tullio De Mauro. Paris: Payot.

Scherer, Carmen (2006): Korpuslinguistik. Heidelberg: Universitätsverlag Winter.

Anmerkung

^* Etwa gleichzeitig mit der Einführung von Lemnitzer/Zinsmeister erschien im Universitätsverlag Winter eine vom Umfang her kompaktere Einführung von Carmen Scherer (Scherer 2006).