158 Korpuslinguistik in dor Praxis • Teinporalpartikeln (z.B. erst, noch, schon); • Antwort- oder Satzpartikeln (z.B. ja, doch, eben); • Vergleichspartikeln (z.B. wie, als); • Interjektionspartikehi (z.B. au, oh je); • Negationspartikelu (z.B. kein, nicht); • Infinitivpartikel zu. Wir kaum eine andere Wortart beziehen die Partikeln ihre Bedeutung durch ihren Kontext. Die Partikeln tragen nichts zur propositionalen Bedeutung einer Äußerung bei, wie man an dem folgenden Beispiel sieht: (17) Was macht Peter jetzt (eigentlich)! Auch ohne die Modalpartikel eigentlich ist der Satz als Frage über Peters momentane, z.B. berufliche, Aktivitäten verständlich. Die Partikel erfüllt hier die Funktion, die Frage als Eröffnung eines neuen Themas zu markieren, z.B. in einem Dialog wie dem folgenden: (18) A: Stell dir vor, da steht: 100 km Stau! - B: Na, da wirds wieder gekracht haben. - A: Sag mal, wie hoch ist man eigentlich versichert, wenns mal so richtig kracht?96 Sie hat hier also gesprächssteuernde Funktion und sichert außerdem die Kohärenz, die bei einem abrupten Themenwechsel sonst gefährdet wäre. Modalpartikeln können außerdem dazu verwendet werden, um die Haltung des Sprechers zum Beispiel zum Wissen oder den Haltungen der Gesprächspartner zu signalisieren: (19) Und sie bewegt sich doch. (20) Das kann schon mal etwas wackeln. Sie bewegt sich ja. In Beispiel (19) signalisiert der Sprecher seine Annahme, dass die Gesprächspartner seine Behauptung (bisher) nicht teilen, in Beispiel (20) hingegen wird signalisiert, dass das Behauptete auch den Gesprächspartnern bekannt ist. Die Redundanz der Äußening wird dadurch abgemildert. Die Analyse und Beschreibung von Partikeln ist eine besondere Herausforderung für die theoretische Linguistik, die Lexikographie, die maschinelle Sprachverarbeitung und für die Sprachlehre97. 1 Dieses leicht modifizierte Beispiel entstammt Thuruiair (1989), S. 176. 7 Wir gehen im Abschnitt zur Sprachlehre u.a. auf eine Arbeit zur didaktischen Vermittlung des Gebrauchs von Modalpartikeln ein. Korpuslinguistik in der Praxis 159 Viele Partikeln stellen die theoretische Linguistik und Lexikographie vor schwierige Aufgaben: Da sie nichts zur Proposition einer Äußerung, in der sie auftauchen, beitragen, müssen die kontextreferentiellen Funktionen dieser sprachlichen Einheiten bestimmt und beschrieben werden. Dies muss in so allgemeiner Weise geschehen, dass möglichst alle Verwendungsweisen bzw. Verwendungssituationen mit dieser Beschreibung abgedeckt werden. Die Gefahr einer solchen generischen Beschreibung ist, dass sie zu allgemein und damit wertlos wird. Will man andererseits das Spezifische der Verwendungskontexte aller Modalpartikeln erfassen, läuft man Gefahr, das Gemeinsame aller Verwendungsinstanzen in den Details zu verlieren. Das Problem der Analyse von Partikeln stellt sich in verschärftem Maße bei der maschinellen Analyse natürlicher Sprache. Die spezifische „Bedeutung" bzw. ihre pragmatische Funktion kann nur erfasst werden, wenn Wissen über den Kontext der jeweiligen Äußerung vorhanden ist. Selbst wenn dieses Kontextwissen nicht in ein Computerlexikon gehört, so doch zumindest eine lexikalische Beschreibung, die Angaben zu den möglichen Vorkommenskontexten umfasst. Viele lexikalische Elemente der Partikelklasse gehören mehreren Unterklassen an und einige darüber hinaus auch anderen Wortklassen98. Die Verwendung dieser lexikalischen Elemente muss einerseits von einander abgegrenzt, andererseits miteinander in Beziehung gesetzt werden. Einige Typen von Partikeln, z.B. die Modalpartikeln, treten zudem in zahlreichen Kombinationen auf. Maria Thurmair99 listet weit über 100 Kombinationen auf, von denen viele aber nur eingeschränkt akzeptabel seien. All diese Aspekte von Partikeln machen diese zu einem besonders guten Gegenstand für korpuslinguistische Untersuchungen. Umfangreiche linguistische und lexikologische Studien zu den Partikeln von Wolfgang Weydt erschienen 1979 und Anfang der 1980er Jahre100. Gerhard Heibig101 widmet den Partikeln ein eigenes Wörterbuch. Darüber hinaus ist die Frage der angemessenen Übersetzung der Abtönungspartikeln in eine andere Sprache ein wichtiges Problem. König, Stark und Requardt lullen eine Lücke mit ihrem deutsch-englischen Spezialwörterbuch zum Wortschatzbereich der Adverbien und Partikeln102. So kann z.B. doch als Antwortpartikel und als Modalpartikel entsprechend der Klassifikation von Hclbig und als Konjunktion verwendet werden. Vgl. Thurmair (1989). "Vgl. Weydt (1979), Weydt (1983) u.a. 'Heibig (1994). 2Vgl. König et al. (1990). 160 Korpusliiiguistik in der Praxis Mittlerweile sind zahlreiche Monographien und detaillierte Arbeiten auch zu einzelnen Partikeln oder zu Partikelgruppen erschienen103. Von besonderem Interesse sind dabei die Bedeutungs- oder Funktionskontraste nah verwandter Partikeln104. Ulrike Nederstigt kritisiert aber zu Recht, dass linguistische Arbeiten zu den Partikeln allzu oft auf erfundene oder konstruierte Beispiele aufbauen. Diese mögen als Testmaterial zur Ermittlung von Akzeptabilitätsurteilen oder zur Ermittlung von Kontrasten geeignet sein, erscheinen aber in vielen Fällen unnatürlich und kömien nicht das wiedergeben, was in authentischen Gesprächen geschieht105. Die Situation hat sich in den letzten Jahren gebessert, was auch durch die bessere Verfügbarkeit von Korpora geschriebener, vor allem aber auch gesprochener Sprache bedingt ist. Thurmair, die in einer Monographie die Kombinierbarkeit von Modalpartikeln untersucht100, erwähnt einen Vorschlag von Collins aus dem Jahre 1938: It would be an alluring task to pick out in German a certain number of simple particles, combine them in pairs or triplets or even larger groups, and try to discover which groups are the most commonly used, which have the most characteristic functions, and which cannot be combined with which, or at least not in a particular order. (Zit. nach Thurmair (1989), S- 203). Tatsächlich ist durch die Existenz sehr großer Korpora und der entsprechenden Werkzeuge zu ihrer Analyse nun die Möglichkeit gegeben, zumindest eine der von Collins gestellten Fragen zu beantworten, nämlich die nach der Vorkommenshäufigkeit, Reihenfolge und Bindungsstärke einzelner Partikelkombinationen. Collins schneidet außerdem wichtige Fragen an, mit deren Beantwortung erst begonnen wurde: • Sind die Restriktionen, denen die Kombinierbarkeit von Abtönungspartikeln unterliegt, systematisch zu beschreiben? Dies betrifft sowohl die Möglichkeit des Kovorkommens zweier Abtönungspartikeln als auch die Reihenfolge ihres Auftretens. Die allgemeinste Beschränkung des Kovorkommens ist dadurch gegeben, dass zwei Partikeln, deren Modus inkompatibel ist, nicht zusammen auftreten. • Wenn zwei Abtönungspartikeln miteinander in einem Satz vorkommen kömien, ist ihre Abfolge durch Prinzipien beschreibbar, die sich 11,3 Einen guten und aktuellen Überblick gibt das Literaturverzeichnis in Möllering (2004). ""Z.B. die der Gradpartikew auch und noch, die im Mittelpunkt der Monographie von Ulrike Nederstigt 2003 stehen. ,05Vgl. Nederstigt (2003), S. 12. 106Vgl. Thurmair (1989). 107 Vgl. Heibig (1994), S. 76 und Thurmair (1989), S. 204f. Korpuslinguistik in der Praxis 161 aus iliren Merkmalen ergeben? Heibig bildet zwar Distributionsklassen für eine Reihe der Partikeln, um deren Reihenfolgebeziehung bei der Kettenbildung zu erfassen, die Belege für seine Hypothesen sind allerdings wenig überzeugende Eigenkonstruktionen.108 Thurmair verwendet eine Menge von semantischen Merkmalen, nach denen die einzelnen Partikeln im ersten Teil ihrer Arbeit klassifiziert werden. Mit diesen Mittehi sollen Selektionsrestriktionen und Kombinationspräferenzen beschrieben werden. Diese semantisdien Merkmale gehen in die Partikelkombinationen ein. Die Einzelbedeutungen der Partikeln werden nadi Auffassung der Autorin zur Gesamtbedeutung der Partikelkombinationen addiert: Es soll hier davon ausgegangen werden, daß eine Kombination der Partikel A mit der Partikel B eine Addition ihrer Bedeutung und damit ihrer Merkmale bedeutet; d.h. also, daß sich die Kombinationen in ihre Einzelteile zerlegen lassen. (Thurmair (1989), S. 205) Thurmair führt dieses Programm in ihrer Monographie dadurch aus, dass sie die Bedeutung und Funktion der einzelnen Modalpartikeln109 und im Anschluss daran die akzeptablen, bedingt akzeptablen und inakzeptablen Kombinationen besclueibt110. Sie beschließt ihre Arbeit mit einer Synopse der Partikelkombinationen (S. 278), mit einer Übersicht über die Distribution der Kombinationen über verschiedene Satztypen (S. 282, Tabelle 13) und einer Übersicht über Stellungsregeln für einzelne Modalpartikeln (S. 285-289). Ob das Postulat der additiven Bedeutung von Partikelkombinationen durchzuhalten ist, bleibt unklar. Hier setzt die Kritik von Lemnitzer111 an, der davon ausgeht, dass Partikelkombinationen als komplexe Lexeme nicht transparent und analysierbar sind. Lemnitzer 1997 präsentiert als Fallstudie die Kombinationen mit der Modalpartikel denn, Lemnitzer 2001 untersucht, ähnlich wie Thurmair, systematisch alle Kombinationen, konzentriert sich aber bei den Einzeldarstellungen auf die häufigsten. Er trifft allerdings keine Aussage zur psychologischen Plausibilität seiner Vermutung, dass es sich hier um Mehrwortlexeme handelt. Im Zentrum semer Arbeit steht vor allem die Analyse und (computer-)lexikographische Erfassung dieser komplexen sprachlidien Einheiten. Die Aneignung des korrekten Gebrauchs von Partikeln im Zuge des Erstsprachenerwerbs verfolgt Ulrike Nederstigt am Beispiel der Grad- 108Vgl. Heibig (1994), S. 75f. 109Abschnitt 2, S. 94-202. noAbschnitt3, S. 203-284. 111 Vgl. vor allem Lemnitzer (2001). 162 Korpuslinguistik in der Praxis Partikeln auch und noch112. Der Erwerb des komplexen sprachlichen Wissens, das für die korrekte Verwendung der Partikeln notwendig ist, demonstriert die Autorin am Gebrauch dieser Partikeln durch erwachsene Sprecher. Verschiedene linguistische Versuche, die phonologischen, syntaktischen, semantischen und diskursiven Aspekte des Gebrauchs dieser Partikeln 7,1.1 beschreiben und zu erklären, stellt die Autorin auf den Prüfstand. Sie verwendet hierfür mehrere Korpora gesprochener Sprache, von denen einige den Sprachgebrauch Erwachsener, andere den Sprachgebrauch eines Mädchens in der Phase zwischen dem zweiten und vierten Lebensjahr wiedergeben113. Die Verwendung von Korpora, vor allem solcher der gesprochenen Sprache, erlaubt ihr, gemessen an den bisherigen linguistischen Arbeiten zum Thema, einen neuen Blick auf die von ihr beschriebenen Partikeln114. Die wichtigsten Erkenntnisse sind: • Die Gradpartikel noch hat mehr Bedeutungen als gemeinhin angenommen, es werden insgesamt neun Bedeutungen unterschieden: - additiv (Nimm dir noch einen Nachtisch, bitte!); additiv, weiteres Element einer Menge (Davor habe ich noch einen Termin.); - additiv, vor einer Wende (Damals haben wir noch ohne fließend Wasser gewohnt.); - temporal [Der Platz ist noch frei.); - temporal, perfektiv (Wir können uns gern noch in diesem Monat treffen.); - temporal, mit abnehmender Menge von Objekten (und jetzt brauche ich noch eine Siebenerleiste.); mit einmal, repetitiv (Dann sind wir noch einmal Karussell gefahren.}; - mit, einmal, restitutiv (Knöpf die Jacke am besten noch einmal auf.); - mit einmal, additiv (Wir sollten uns dann nochmal einen Tag Zeit nehmen, wenn das heute nicht klappt.)115. 112 Vgl. Nederstigt (2003). Die Autorin spricht von „focus particles", dies entspricht aber der von Heibig definierten Klasse der Gradpartikeln. U3Zu den verwendeten Korpora vgl. Kapitel 3.2, S. 80-83 (Korpora der Erwachsenen-Sprache) und Kapitel 7.2, S. 211 (Korpus der Kindersprache) in Nederstigt (2003). "1 Kapitel 6 ist überschrieben mit „A fresh look at focus particles". ""Vgl. S. 100-106. Die hier gewählten Beispiele sind erfunden, Nederstigt präsentiert authentische, aber auch etwas komplexere Beispiele. Korpuslinguistik in der Praxis 163 Der Kontrast zwischen diesen Bedeutungen korrespondiert mit Unterschieden in den phonologischen und syntaktischen Merkmalen der Partikel bzw. mit Unterschieden in den Verwendungskontexten116. • Bei der Gradpartikel auch unterscheidet die Autorin zwischen einer betonten Variante und einer unbetonten Variante. Die betonte Variante weist Merkmale einer Antwortpartikel auf. Ihr Gebrauch signalisiert, dass einer vorhergehenden positiven (oder negativen) Antwort eine weitere positive (oder negative) Antwort hinzugefügt wird, wie in dem folgenden Beispiel: (21) Mitte der Woche habe ich AUCH nicht so gerne... Der Kontext dieser Äußerung ist die telefonische Suche nach einem Termin für ein Treffen. Der Sprecher hat bereits vorher einige Terminvorschläge negativ beschieden. Das Beispiel wird hier als eine weitere Ablehnung interpretiert117. Die unbetonte Variante weist die typischen Merkmale einer Gradpartikel auf, besonders eine größere Variabilität in der Wortstellung, wie die beiden folgenden Beispiele zeigen"8. (22) Wir können sonst auch Freitag oder Samstag nehmen. (23) Auch Freitag oder Samstag können wir sonst nehmen. • Wenn man die betonte und unbetonte Variante der Fokuspartikel auch als zwei verschiedene lexikalische Elemente betrachtet, dann wird eine homogene Beschreibung der Funktionen der unbetonten Variante und der Fokuspartikel noch möglich. Es bleiben semantische Unterschiede zwischen beiden Partikeln, die aber ihrer Subsumierung in eine Klasse nicht entgegenstehen. Die Untersuchung von Spraclierwerbsdaten in Hinblick auf die beiden Partikeln - und der Partikel auch in beiden Betonungsvarianten - zeigt, dass die Unterscheidung der beiden Varianten von auch kognitiv plausibel ist: Die betonte Variante von auch wird früher erworben als die unbetonte Variante, und letztere wiederum in etwa zur gleichen Zeit wie die Partikel 7iocA"9. Nederstigt stützt ihre Erkenntnisse auf Langzeitaufzeichnungen der Sprachentwicklung eines Kindes namens Caroline. Caroline beginnt mit einem Jahr und neun Monaten, AUCH zu 1,6Vgl. Kapitel 4.2.2, S. 167-171. 117Vgl. S. 190f. Die Großschreibung der Partikel in unserer Wiedergabe des Beispiels signalisiert, dass sie betont ist. 118In Anlehnung an Nederstigt, weitere Beispiele in ihrer Arbeit auf S. 200 UBVgl. Abschnitt 9.4.1, vor allein Abbildung 9.7 auf Seite 340- 164 Korpuslinguistik in der Praxis verwenden, und mit gut zwei Jahren, ungefähr zur gleichen Zeit, auch und noch. Durch die gründliche qualitative Analyse von Korpusbelegen, die aus mehreren Korpora gesprochener Sprache stammen, gelingt es der Autorin, hinsichtlich einer der beiden untersuchten Partikeln {auch) eine Unterscheidung zwischen zwei Varianten zu treffen. Der Schnitt, den sie macht, erlaubt es, eine Variante dieser Partikel konsistent in das System der Fokuspartikeln, wie sie sie nennt, zu integrieren. 8 Besondere Textsorten Das linguistische und auch korpuslinguistische Interesse gilt auch immer besonderen Textsorten. In den letzten Jahren sind Arbeiten zum Sprachgebrauch in den neuen Medien populär geworden. Eine häufig untersuchte Frage ist die, ob die Sprachverwendung in verschiedenen Anwendungen des Internet - E-Mail, Foren, Chaträume, Gästebücher120 als schriftlich oder als rnündlich zu charakterisieren ist. Ergebnis dieser Diskussion ist es, dass mittlerweile, einer Idee von Koch und Oos-terreicher folgend121, zwischen medialer und konzeptueller Schriftlich-keit bzw. Mündlichkeit unterschieden wird. Die Merkmale konzeptueller Mündlichkeit werden von Lothar Lemnitzer und Karin Naumann anhand von Chatprotokollen herausgearbeitet122. Chatprotokolle spielen auch m einigen anderen Arbeiten eine wichtige Rolle als empirische Basis. Schriftliche Dokumente als Ergebnis computervermittelter Kommunikation sind relativ einfach zu beschaffen, man braucht z.B. nur die Diskussion in einem der vielen Chaträume mitzuschneiden. Es besteht aber die bedenkliche Tendenz, dass sich jeder sein eigenes Korpus baut. Nichts liegt näher, als die eigene E-Mail-Korrespondenz als Datenbasis zu verwenden123. Dieser Trend zur Beliebigkeit der Datenauswahl erschwert auf längere Sicht die Replizierbarkeit und Generalisierbarkeit der auf Grund dieser Daten gewonnenen Erkenntnisse. Das Dortmunder Chatkorpus124 verspricht diesem Missstand zumindest für diese Kom- l20Der „Koinuiunikationsforin E-Mail" wurde mittlerweile ein ganzer Sammelband gewidmet, vgl. Ziegler (2002), ebenso der Kommunikationsfomi Chat, vgl. Beifcwenger (2001). Ein weiterer Sammelband widmet sich dem „Sprachwandel durch Computer", vgl. Weingarten (1997). 121 Vgl. Koch und Oesterreicher (1994). 122Vgl. Lemnitzer und Naumann (2001), Abschnitt 4. 123 Dies lässt sich etwa an Beiträgen zum oben genannten Sammelband zur „Kommunikationsform E-Mail" beobachten. 1MVgl. Kapitel 5. Korpuslinguistik in der Praxis 1.65 munikationsform abzuhelfen, wenn es gelingt dieses Korpus als Referenzkorpus zu etablieren. Auf anderen Gebieten ist es weitaus schwieriger, an ausreichende Datenmengen zu kommen. Ein gutes Beispiel hierfür sind die SMS genannten Kurznachrichten, die über mobile Telefone gesendet werden. Der ungeheuer hohen Zahl an SMS, die in Deutschland jährlich versendet werden, steht die Schwierigkeit entgegen, solche Botschaften systematisch zu erfassen - das Medium ist nahezu so flüchtig wie die gesprochene Sprache. Demioch gibt es erste Arbeiten zu dieser Kommunikationsform. Als Beispiele sollen hier nur Schwitalla (2002) und Doering (2002) genannt werden. Diese Arbeiten können allerdings zum jetzigen Zeitpunkt nicht mehr als eine erste Erkundung sein, und die Korpora, auf denen sie basieren, sind alles andere als ausreichend groß und stabil. Harald Burger125 untersucht die Kommmükation auf den Seiten eines öffentlich zugänglichen Gästebuchs einer eine Fernseh-Talkshow begleitenden Website126. Sein Interesse gilt dem Wechselspiel von öffentlicher und privater Kommunikation, ihrer Inszenierimg und Wahrnehmung. Einen ähnlichen Zugang wählt Thomas Niehr127, der die politische Diskussion auf der Homepage eines Bundestagsabgeordneten auswertet. Gästebücher und Homepages sind als Ort der Kommunikation sicher zu ungewöhnlich, um daraus eine besondere Kommunikationsform zu destillieren. Es ist dennoch interessant und wichtig, dieses Medium als eine Form der Interaktion im World Wide Web, bzw. als eine Spielart der computervermittelten Kommuniliation, zu beobachten. Die neuen Medien sind sicher der auffälligste Ort für die Entstehung neuer bzw. untersuchenswürdiger Textsorten oder Kommunikationsformen. Es gibt aber eine Reihe interessanter korpuslinguistischer Arbeiten zu sprachlichen oder stilistischen Aspekten in traditionellen Textsorten oder Kommunikationsformen. Als Beispiele seien hier lediglich erwähnt: Beiträge von Richard Glahn zu Geschäftsberichten als Form der Unternehmenskommunikation128 sowie zur Sprache deutscher und amerikanischer Talkshows129; die Arbeit von Peter Schlobinski und Florian Fiene zu Fußballfanzines130; eine Analyse des Dissens, einer besonderen Form der Kommunikation unter Jugendlichen, von Arnulf Deppermann und mVgI. Burger (2002). l2SZum verwendeten Korpus s. S. 167. 127Vgl. Niehr (2003). 128Vgl. Glahn (2003). 129Vgl. Glahn (2004). 130Vgl. Schlobinski und Fiene (2000). Fanzines sind Magazine von Fangruppen. 166 Korpuslinguistik in der Praxis Axel Schmidt131; die Arbeiten von Christa Dem zur Textsorte Erpresserbrief, die sich auf ein Korpus dieser Gattung beim Bundeskriminalamt stützt132. 9 Sprachlehre Im fünften Kapitel haben wir die Dichotomie von Korpora in der Sprachlehre schon erwähnt: Sie umfassen sowohl muttersprachliche Korpora, die als Datenressource im Unterricht eingesetzt werden können, als auch Korpora, die den Zweitspracherwerb dokumentieren, also Sprache von Nichtmuttersprachlern enthalten. Joybrato Mukherjee133 beschreibt in seiner Einführung in die Korpuslinguistik ausführlich, wie Korpora für den Englischunterricht eingesetzt werden können, sowohl in der Unterrichtsvorbereitung als auch im Unterricht selbst. Sie dienen als Quelle für natürliche Beispiele und geben dem Sprachlerner frühzeitig Kontakt zur natürlichen Sprachverwendung. Diese Verwendungsweise bietet sich insbesondere auch für die Erstellung von Lehrbüchern an. Dieter Mindt134 analysiert Lehrbücher für den Englischuiiterricht., die an deutschen Schulen eingesetzt werden, und stellt fest, dass sie teilweise irreführend dahingehend sind, dass weniger häufig verwendete Formen früher eingeführt werden als die eigentlich gängigen. Dadurch entsteht beim Lernen ein falsches Gewicht. Als Negativbeispiel stellt er das Engüsche going to-Futur vor, das in mehreren Standardlehrbüchern früher eingeführt wird als das viel häufiger verwendete Wi7/-Futur. Er argumentiert, dass Lehrwerke, die auf der Basis von korpusbestimmten quantitativen Untersuchungen von Wortschatz und Verwendungsweisen erstellt werden, solche Verzerrungen nicht enthalten135. Guy Aston136 nennt diese Verwendung von Korpora in der Lehre, bei der der Sprachlerner keinen direkten Zugang zu den Korpora bekommt, den Hinler den Kulissen-Ansatz (Behind the Scenes Approach). Er kontrastiert ihn mit dem Auf der Bühne-Ansatz [On Stage Approach), bei dem der Lerner direkt mit dem Korpus arbeitet. Hier 'Vgl. Deppermann und Schmidt (2001). 2Vgl. Deru (2003). 3Vgl. Mukherjee (2002). "Vgl. Mindt (1996). 5 Gerrits seit 1980 werden im Rahmen des COB UlLD-Projekts - eine Kooperation zwischen einem Verlag und der Universität Birmingham — in einem korpusbasierten Ansatz Materialien und Referenzwerke für den Euglischunterricht für Nicht-Muttersprachler erstellt (Sinclair, 1987). "Vgl. Aston (2000), auch http://sslmit.unibo.it/~guy/barc.htin. Korpuslinguistik in der Praxis 167 kann Data-Driven Learning zum Einsatz kommen, d.h. Lerner leiten von den Daten Generalisierungen ab, die sie dann auf die Analyse neuer Daten anwenden. Die Analyse von Sprache wird so direkt mit ihrer natürlichen Verwendung gekoppelt. Technische Voraussetzungen dafür sind ein Korpus, ein Konkordanzwerkzeug und Werkzeuge zur eigenen Dateiiextraktion. Konkrete Anwendungsszenarien sind das Nachschlagen von Wortverwendungen im Satzkontext für die Textproduktion und -rezeption, das systematische Untersuchen bestimmter Sprachverwendungen oder Grammatikkonstruktionen und das ,genüssliche Schmökern' (serendipitous exploration). Sogar eine Art enzyklopädischer Verwendung ist möglich, da man durch das Korpus Informationen zu bestimmten Orten oder Personen erhalten kann, sowie über die Kultur der Sprachgemeinschaft, wenn z.B. nach Stereotypen und Vorurteilen geforscht wird137. Aston geht auch auf begleitende Effekte des Korpuseinsatzes im Klassenzimmer ein, z.B. den kommunikativen Aspekt bei gemeinsamer Korpusarbeit (Korpusanfrage, Finden von Mustern, Interpretation usw.). Als Zielgruppe für diese Art von Korpuseinsatz im Unterricht empfiehlt er fortgeschrittene (erwachsene) Lerner und Lehrer, da es z.B. schwieriger ist, Konkordanzzeilen zu interpretieren, als ein Lernerwörterbuch zu lesen138. Im dänischen Visual Interactive Syntax Leaming-Pro)ekt (kurz: VISL)139 kommen linguistisch annotierte Korpora direkt zum Einsatz, wenn auch nicht ganz offen 'auf der Bühne', wie Aston es beschrieben hat. Auf den Projektseiten im Internet kann man online verschiedene Grammatikübungen in mehr als 25 Sprachen ausführen140. Die Übungen basieren zum Teil auf manuell vorannotierten Sätzen, zum Teil auf großen, automatisch geparsten Korpora. Dem Lerner kann dadurch eine enorme Vielfalt an authentischem Übungsmaterial angeboten werden. Neben den Syntaxübungen enthält die Seite auch eine Reihen von Sprachspielen, die sehr ansprechend aufbaut sind. Es gibt z.B. ein kleines Fellknäuel, den Grammar Man, den man durch ein Labyrinth von Wortarten leiten muss, ohne einem Gespenst zu begegnen. Der richtige Weg wird jeweils durch einen Beispielsatz vorgegeben, den man aber zuerst analysieren muss. Im Hintergrund des System läuft ein kate-gorialgrammatischer Parser141, der den Sätzen eine Dependenzanalyse zuweist. Stubbs (1996). Bin Beispiel für eine Konkordanz finden Sie in Abschnitt 3 des vierten Kapitels. http://visl.sdu.dk/visl/de. Vgl. Bick (2005). Vgl. Karlsson (1990). 168 Korpuslinguistik in der Praxis Ein Beispiel für den zweiten Typ von Korpuseinsatz beim Spra-chenleruen ist das Berliner Projekt Fehler Annotiertes LernerKOrpus des Deutschen als Fremdsprache (FALKO). Im vierten Kapitel sind wir kurz auf die Annotation des Lernerkorpus eingegangen. Im Umfeld von FALKO entstellen zur Zeit mehrere Arbeiten zum Zweitspracherwerb und der Didaktik von Deutsch als Fremdsprache, Maik Walter142 zum Beispiel untersucht in seinem Dissertationsprojekt Satzkonnektoren wie da, weil oder obwohl, deren Verwendung gemeinhin als Indikator für die Niveaueinstufung von Lerner genutzt wird. Die Frage, ob Koimektoren, tatsächlich gute Indikatoren sind, versucht Walter korpusbasiert und im Vergleich mit Daten von Muttersprachlern zu klären. Die bisherige Korpusauswertung zeigt systematische Abweichungen in der Wortstellung und der Konnektorenwahl. In diesem Bereich werden wir in Zukunft interessante Forschungsbeiträge erwarten können. Wir stellen im Folgenden zwei Arbeiten vor, in denen das Potenzial von Korpusanalyse und didaktischer Aufbereitung von Belegen für den Sprachunterricht demonstriert wird. Es handelt sich also in beiden Fällen um Korpusarbeit Hinter den Kulissen. Die erste Arbeit bezieht sich auf Modalpartikeln, die zweite auf Präpositionen. Für den Sprachlerner stellen Modalpartikeln eine besondere Herausforderung dar. Sie sind weder allein dem Lexikon noch der Grammatik zuzurechnen, ihre Funktion kann deshalb nicht einfach durch Verwendung der entsprechenden Referenzwerke erschlossen werden. Zweitens ist das komplexe Wechselspiel zwischen Partikelfunktion, Kotext und Kontext nicht leicht zu verstehen. Gerade dieses Wechselspiel kann nur anhand von authentischen Beispielen vermittelt und verstanden werden143. Möllering begegnet diesen Problemen mit einem fremdsprachendidaktischen Programm, das auf die Verwendung authentischer Beispiele setzt. Als Materialgrundlage dienen ihr vor allem Korpora gesprochener Sprache144, da Modalpartikeln vor allem im gesprochenen Deutsch verwendet werden. Sie ermittelt die Vorkommenshäufigkeit aller Modaipartikeln in diesen Korpora und widmet die weiteren Ausführungen den häufigsten Partikeln: eben, nur, denn, schon, doch, mal, aber auch, ja. Für jede Partikel erarbeitet sie Arbeitsblätter auf der Basis von authentischen Belegen. Diese Arbeitsblätter sollen den Ler-iiern helfen: a) die Verwendung der einzelnen lexikalischen Einheiten als 2Vgl. Walter (ia Vorb.). 3 Vgl. hierzu Möllering (2004), Kapitel 1. Zu den verwendeten Korpora s. S, 101-104. Auf S. 249 diskutiert Möllering einige Schwächen des von ihr verwendeten Korpus. Es sei erstens relativ klein und zweitens sei die überaus hohe Frequenz von ja dessen häufiger Verwendung als Gesprächspartikel in Telefondialogen geschuldet. Korpuslinguistik in der Praxis 169 Modalpartikeln von den anderen Verwendungen dieser Einheiten, z.B. als Konjunktion oder als Gradpartikel, zu unterscheiden und b) Funktion und Bedeutung der Modalpartikeln zu verstehen145. In Kapitel 5 dieser Arbeit werden die partikelbezogenen Lehrmaterialien vorgestellt und diskutiert. Die Materialien wurden in der Praxis erprobt, die Einstellung der Schüler zum Lernen an authentischem Sprachmaterial wurde evaluiert. Möllering sieht sich mit ihrer Arbeit in einem Trend der Sprachlehre, die im Sprachlehrer eher einen Vermittler als einen Wissensproduzenten sieht und Sprachlernen als aktive Auseinandersetzung der Lernenden mit authentischen Äußerungen der Zielsprache. Randall Jones147 ist an Präpositionen aus der Perspektive der Sprachlehre interessiert. Ziel seiner Studie ist es, die Beschreibungen und Lernhilfen in Lehrbüchern und Lernergrammatiken, die Präpositionen betreffen, mit den Ergebnissen der Analyse eines Korpus gesprochener Sprache zu vergleichen. Für seine Untersuchungen verwendet er ein an der Brigham Young University erstelltes Korpus des gesprochenen Deutsch148. Er betrachtet die neun am häufigsten im Korpus vorkommenden Präpositionen: hinter, neben, zwischen, unter, vor, über, an, auf und in149 und stellt fest, dass eine solche Korpusanalyse andere Informationen zu Tage fördert, als sie in Sprachlehrwerken vermittelt werden. Im Detail: • Die prototypische Unterscheidung von Ort und Richtung hilft bei der Bestimmung des Kasus, den die Präposition regiert, wenig, weil bei fast allen Präpositionen die wenigsten Vorkommen sich diesem Schema zuordnen ließen. Die meisten Vorkommen hatten keine klare lokale oder direktionale Bedeutung. Viele Präpositionen sind Teil von Präpositionalergänzungen von Verben oder Teil von idiomatischen Wendungen. In diesen Fällen ist der regierte Kasus aber nicht regelhaft erschließbar; • die Verwendung des Akkusativs und die Verwendung des Dativs sind bei keiner Präposition ausgewogen. Bei hinter dominierte der Dativ mit über 80 Prozent, bei über der Akkusativ mit über 99 Prozent. Diese quantitativen Tendenzen zu kennen kann für Lerner wichtig sein; 145Der Autorin geht es ausdrücklich nicht darum, die aktive Verwendung der Partikeln einzuüben, sondern nur darum, das Verstehen zu erleichtern, vgl. S. 244. '■"'Möllering (2004), S. 250. I47Vgl. Jones (2000). l48Vgl. S. 118. "9Vgl. Tabelle 1 auf S. 120. 170 Korpuslinguistik in der Praxis • die Präpositionen selbst kommen unterschiedlich oft vor am seltensten hinter und am häufigsten in150. Diese Erkenntnis mag vor allem für Muttersprachler banal sein, sie wird aber für den Lerner durch die Gleichbehandlung der Präpositionen in vielen Lehrbüchern verdeckt. Jones schlägt hier ein Vorgehen vom Häufigeren zum Selteneren vor. Als Fazit schlägt Jones den verstärkten Einbezug von Korpora, gesprochener und geschriebener Sprache, für die Sprachlehre oder doch zumindest für die Erstellung von Lehrwerken vor, da sie das Verständnis der komplexen Maschinerie des Deutschen erleichtern151. Diese Arbeiten leisten einen wertvollen Beitrag zu Forschungen, die den Lernprozeß nicht aus der Sicht der kognitiven Leistungen der Lernenden, sondern aus der Sicht der Besonderheiten des authentischen Sprachgebrauchs betrachten. Es bleibt zu hoffen, dass diese Erkenntnisse bei den Verlagen, die Lehrmaterialien für Deutsch als Fremdsprache erstellen, auch ankommen. 10 Fazit Wie wir eingangs erwähnt haben, können die in diesem Kapitel dargestellten Arbeiten zum Teil als gute, zum Teil als schlechte Beispiele korpuslinguistischer Forschung aufgefasst werden. Wir wollen die methodischen Tendenzen, die in diesen Arbeiten deutlich werden, hier zusammenfassen und daraus Empfehlungen für eine gutes methodisches Arbeiten ableiten. Zunächst fällt auf, dass viele Arbeiten sich auf kleinere Korpora stützen, die sich überwiegend im Besitz der Autoren befinden bzw. für diese zum Zweck der Untersuchung erstellt wurden. Es ist auch oft nicht klar, ob die Korpora digital vorliegen und maschinell ausgewertet wurden. Es ist im Prinzip nichts gegen die intellektuelle Auswertung eines (kleinen) Gesamtkorpus einzuwenden. Diese Methode erschwert aber die Überprüfung oder Reproduktion der Ergebnisse. Das einzige Bewertungskriterium ist in diesem Fall die Plausibilität der Ergebnisse. Die linguistische Forschung wird auch weiterhin auf Spezialkorpora angewiesen sein, die ad hoc zum Zwecke einer bestimmten Untersuchung zusammengestellt werden. Es sollte aber gefordert werden, dass diese Spezialkorpora a) digital erfasst und b) begleitend zur Publikation der Öffentlichkeit zur Verfügung gestellt werden, soweit keine urheberrechtlichen oder personenrechtlichen Gründe dagegen sprechen. Die ,S0Vgl. Tabelle 2, S. 141. 151S. 142. Korpuslinguistik in der Praxis 171 Publikation der Daten kann entweder über die Homepage des Forschers oder über eine zentrale Sammel- und Dokumentationsstelle für Korpora geschehen. Eine solche Stelle existiert allerdings noch nicht. Auch die Beschreibung dieser Korpora mit Metadaten ist wünschenswert. Ein ähnliches Problem ergibt sich, wenn nicht zu wenig, sondern zu viel Daten zur Verfügung stehen. Dies ist bei Forschungen zur corn-putervermittelten Kommunikation der Fall. Hier besteht die Tendenz, Daten in wenig kontrollierter und opportunistischer Weise zu sammeln. Auch dies erschwert letztendheh die Generalisierbarkeit der gewonnenen Erkenntnisse. Dem könnte durch den Aufbau textsorten- oder medienspezifischer Referenzkorpora abgeholfen werden. Dies ist freilich nicht die Aufgabe einzelner Wissenschaftler, sondern muss institutionell geregelt werden. Einzelne Forscher können und sollten zu einem solchen Referenzkorpus beitragen. Es gibt nach wie vor nicht das Referenzkorpus des Deutschen, wie es etwa das British National Corpus für das Britische Englisch war und ist. Die meisten Forscher verwenden die Korpora des Instituts für deutsche Sprache. Dies bedeutet auf der anderen Seite eine gewisse Verantwortung für dieses Institut, geeignete Daten und Korpora zur Verfügung zu stellen. Die Dienstleistungen des Instituts für deutsche Sprache und deren Dokumentation lassen aus unserer Sicht zu wünschen übrig. Als einen Beitrag zur Verbesserung der Situation stellen wir eine Bedienungsanleitung für das Recherchesystem COSMAS auf die dieses Buch begleitende Webseite152. Wir hoffen außerdem, mit der Darstellung der' Korpuslandschaft des Deutschen in Kapitel 5 dazu beitragen zu können, dass die erwähnten Korpora stärker genutzt werden. Es gibt kaum einen (korpus-)linguistischen Bereich oder Fragenkomplex, dem sich mehrere Arbeiten widmen. Am ehesten ist dies bisher im Bereich der Modalpartikeln geschehen. Gerade die in den vorhergehenden Kapiteln beschriebenen Probleme mit Korpusdaten als Grundlage linguistischer Erkenntnis sollten zur Reproduktion bzw. Kontrolle einmal erzielter Ergebnisse ermuntern. Von den hier beschriebenen Arbeiten leistet dies nur Lemnitzer 2001 mit Bezug auf die Arbeit von Thurmair 1989. Verstehen Sie als Leser dieses Buches dies auch als Aufforderung, die hier beschriebenen Arbeiten und daraus gewonnenen Erkenntnisse selbst zu überprüfen. Wenige Arbeiten machen bisher von den Möglichkeiten Gebrauch, die die linguistische Annotation von Korpora für die weitergehende Forschung schafft. Beispielhaft seien hier die Arbeiten von Nederstigt 2003 sowie von Zinsmeister und Heid 2003 erwähnt. Nicht jede Untersuchung http://www.lemnitzer.de/lothar/KoLi. 172 Korpuslinguistik in der Praxis profitiert von der Existenz einer linguistischen Annotation, zumal diese nicht immer hundertprozentig korrekt ist und oft auch nicht tief genug geht. Wir empfehlen aber, die Verwendung der in den vorhergehenden Kapiteln beschriebenen annotierten Korpora bzw. Bauinbanken für die Analyse zu erwägen. Man kann sich u.U. auf Vorkommen von Wörtern in einer bestimmten Wortart oder in einer bestimmten syntaktischen Position beschränken und so die Genauigkeit der Datenextraktion und -analyse verbessern. Nicht in allen Arbeiten wird das Verhältnis von quantitativer und qualitativer Analyse reflektiert. Ein Musterbeispiel ist hier wieder die Arbeit von Nederstigt 2003, die für alle analysierten Wörter eine die kompletten Korpusdaten umfassende quantitative Analyse vornimmt, für die darauf folgende qualitative Analyse aber für jedes Wort eine gleich große Anzahl von Belegen auswählt. Letzteres erlaubt ihr, die Analyse der beschriebenen Wörter vergleichbar zu machen. Die saubere Trennung beider Aspekte sollte bereits Gegenstand des Forschungsdesigns sein und vor der Auswahl der Korpora und weiteren Analysemitteln stehen. Letztendlich müssen auch die grundsätzlichen Fragen beantwortet, werden, die wir in den vorhergehenden Kapiteln aufgeworfen haben: Ist ein Korpus überhaupt geeignet zur Beantwortung der Forschungsfra-gen? Gibt es Alternativen oder Ergänzungen? In welchem Verhältnis stehen die ausgewählten Korpusdaten zum beschriebenen Gegenstand, sind Generalisierungen über die Korpusdaten hinaus möglich? Diese grundsätzlichen Fragen werden in den hier beschriebenen Arbeiten keinesfalls ausgeblendet, sie könnten u.E. aber stärker reflektiert werden. 11 Weiterführende Literatur Es gibt leider bisher für das Deutsche kein Buch, das die in diesem Kapitel dargestellten korpuslinguistischen Ansätze und Themengebiete in geschlossener Form präsentieren würde. Zur Zeit ist ein Band Korpuslinguistik in der Reihe Handbücher zur Sprache und Kommunikationswissenschaft in Arbeit, der vermutlich im Laufe des Jahres 2007 erscheinen wird. Die Themen dieses Bandes sind allgemeiner Natur und nicht speziell auf das Deutsche bzw. die germanistische Linguistik zugeschnitten. Ebenfalls im Jahre 2006 wird eine Einführung in die Korpuslinguistik für Germanisten von Carmen Scherer erscheinen. Wir wissen leider wenig über den geplanten Inhalt des Buches, denken aber, dass sich die Lektüre des Buches ergänzend zu diesem Buch lohnen wird. Ansonsten ist ein regelmäßiger Blick in die germa- Korpuslinguistik in der Praxis 173 nistischen Fachzeitschriften zu empfehlen. Ergiebige Quellen sind die Zeitschriften Deutsche Sprache, Zeitschrift für germanistische Linguistik, Muttersprache, Osnabrücker Beiträge zur Sprachtheorie. Man sollte außerdem die Beiträge in der englischsprachigen Zeitschrift Corpus Linguistics zur Kenntnis nehmen, wenn man up-to-date bleiben möchte. Die Studienbibliographie zur Korpuslinguistik von Lenz (2000) ist ebenfalls eine gute Quelle, der Berichtszeitraum endet allerdings mit dem Jahr 1999. Zur Verwendung von Korpora, die die Sprache von Zweitsprachlernern dokumentieren, verweisen wir auf die ausführliche Online-Bibliographie von Sylviane Granger (http://cecl.fltr.ucl. ac.be/learnercorpusbibliography.html). 12 Aufgaben 1. Sie wollen untersuchen, wie oft verschiedene orthographische Varianten eines Wortes verwendet werden, oder, anders formuliert, welche Variante eines Wortes überwiegt. Sie wählen das Web als Korpus und wollen eine Suchmaschine verwenden, um anhand der gelieferten Treffer zu jeder Variante eine ungefähre Abschätzung der Verwendungshäungkeit vorzunehmen. Arbeiten Sie mit den folgenden Beispielen: a) Buddyliste / Buddy-Liste / Buddy Liste, b) Musikdownload, Musik-Download, Musik Download, oder wählen Sie ein eigenes Beispiel. Testen Sie die Suchmaschinen google (www.google.de), msn (http://search.msn.de) und alltheweb (http://www.alltheweb.com). Welche Ergebnisse bringt die jeweilige Trcfferliste? Prüfen Sie einige Treffer, auch solche, die weiter hinten in der Liste stehen. Sind die Treffer korrekt? Sind Sie, nach Durchsicht der Ergebnisse, der Meinung, dass eine oder mehrere der Suchmaschinen sich für solche linguistischen Untersuchungen eignen? 2. Für eine Untersuchung zu Anglizismen im Deutschen möchten Sie aus einem Korpus möglichst viele Anglizismen extrahieren. Welche Möglichkeiten sehen Sie, Anglizismen von nativen deutschen Wörtern zu unterscheiden, ohne jedes einzelne Wort zu überprüfen? 3. Bearbeiten Sie die Vorsilbe zwischen als Vorsilbe zu Verben wie z.B. zwischenfinanzieren. Suchen Sie Belege aus einem Korpus oder aus dem Web. Verfassen Sie einen Wörterbuchartikel für dieses Präfix. Erarbeiten Sie eine Übung für den Sprachunterricht. 4. Betrachten Sie die E-Mail in Ihrem Postfach als eine Art Korpus. Diskutieren Sie, wemi möglich in einer Gruppe, nach welchen Text-sorten Sie diese Mail sortieren könnten. Untersuchen Sie auch die 174 Korpuslinguistik in der Praxis Header Ihrer Mail. Welche Informationen aus dem Header lassen sich für eine Klassifikation der Nachrichten in Textsorten nutzen? 5. Auf unserer begleitenden Webseite haben wir Listen von möglichen Kollokanten für einige Schlüsselwörter bereitgestellt. Die Liste der Kollokanten wurde mit statistischen Mitteln aus einem sehr großen Korpus extraliiert. Wählen Sie aus diesen Listen alle Wortpaare aus Schlüsselwort und Kollokant aus, die Sie für die Aufnahme in ein Wörterbuch für würdig halten. Markieren Sie das Stichwort, unter dem Sie die Kollokation einordnen würden. Vergleichen Sie die Ergebnisse mit Ihren Kollegen und ermitteln Sie, wie hoch die Übereinstimmung ist. Vergleichen Sie Ihre Ergebnisse auch mit den Kollokationen in einein ein- oder zweisprachigen Wörterbuch. Welche Kollokationen zum Stichwort fallen Ihnen ein und welche Kolloka-tionen finden Sie im Wörterbuch, die in der Liste nicht enthalten sind? 6. Eine eigene, etwas systematischere, aber keinesfalls erschöpfende Untersuchung des Wortwarte-Korpus förderte die folgenden Wörter mit BinnenGroßSchreibung zutage: eBay, eBook eGovernment, eLearning, Gamerlnnen, ge WAPnet, Li-nuxTag, MUDder, WinNT. Klassifizieren Sie diese Einheiten nach den Motiven, die zu diesen Bildungen führten. Fallen Ihnen weitere Beispiele ein? Nehmen Sie Stellung zu der Frage, ob die Rechtschreibnorm solche Formen zulassen sollte. Man muss sich mit einem Korpus anfreunden - Erfahrungen von Linguisten mit Korpora Im Folgenden präsentieren wir die Antworten einiger Linguisten auf vier Fragen, die wir im Dezember 2005 stellten. Die Fragen beziehen sich auf die Erfahrungen, die die Befragten bei ihrer linguistischen Forschung mit Korpora gemacht haben, und auf Empfehlungen, die sie Neulingen der Korpuslinguistik geben. Einige der Befragten haben per Mail geantwortet, einige haben sich zu einem mündlichen Interview bereit erklärt. Dies ist einer der Gründe, warum die Antworten unterschiedlich lang ausgefallen sind. Wir haben in den meisten Fällen die Antworten gekürzt, da sie sonst den Rahmen dieses Kapitels gesprengt hätten. Die vollständigen Texte bzw. Transkripte der Interwiews können Sie auf der dieses Buch begleitenden Webseite (http: //www. lemnitzer. de/lothar/KoLi) nachlesen. Wir haben versucht, Interviewparter zu gewinnen, die Experten auf mindestens einem der mit der Korpuslinguistik verbundenen Gebiete sind, nämlich theoretische Linguistik, Lexikographie, Computerlinguistik und Sprachlehre. Dass die Biographien der meisten Interviewten in irgendeiner Weise mit Tübingen verbunden ist, hängt sicher auch mit der Biographie und dem momentanen Arbeitskontext der Autoren dieses Buches zusammen. Wir stellen zunächst die befragten Experten vor und fassen im Anschluss daran alle Antworten zu jeweils einer Frage in einem Abschnitt zusammen. Wir haben die Beiträge dabei alphabetisch geordnet. 1 Porträts Julia Berman Studium der Germanistischen Linguistik, Romanistik und Deutsch als Fremdsprache an der Universität München, anschließend Wissenschaftliche Angestellte am Institut für Maschinelle Sprachverarbeitung und Mitglied im Graduiertenkolleg Linguistische Grundlagen der Sprachverarbeitung in Stuttgart. Promotion im Bereich der Syntax des Deutschen im Jahr 2000. Zur Zeit wis-