MASARYKOVA UNIVERZITA FILOZOFICKÁ FAKULTA Ustav románských jazyků a literatur Portugalský jazyk a literatura Alena Vašíčková COLOCACÔES Magisterská diplomová práce Vedoucí práce: Mgr. Iva Svobodová, Ph.D. 2009 Prohlašuji, že jsem diplomovou práci vypracovala samostatně a pouze s využitím uvedených pramenů a literatury. Prohlašuji, že tištěná verze práce je totožná s verzi elektronickou. 1 Zde bych chtěla upřímně poděkovat vedoucí práce Mgr. Ivě Svobodové, Ph.D. za podnětné připomínky a energii a čas, který mé práci věnovala. Děkuji i PhDr. Jarmile Fictumové z Katedry anglistiky a amerikanistiky FF MU za poskytnutí cenných materiálů. Zároveň děkuji RNDr. Ondřeji Bojarovi, Ph.D. z Ústavu formální a matematické lingvistiky, bez jehož pomoci by nevznikl paralelní česko-portugalský korpus a nástroje pro jeho další rozšiřování. Dík patří i Ing. Pavlu Erlebachovi za trpělivost s mými dotazy ohledně PHP+MySQL a za užitečné návrhy pro psaní skriptů. 2 índice 1. Introducäo...........................................................................................................................5 2. A importäncia das colocacöes.............................................................................................8 2.1 Colocacöes na aquisicäo da linguagem e no processamento psicológico....................8 2.2 Colocacöes no ensino..................................................................................................11 2.3 Colocacöes na traducäo..............................................................................................14 2.4 Colocacöes no processamento computacional e na linguística computacional..........14 3. Colocacöes na teória linguística.......................................................................................IV 3.1 Colocacöes na tradicäo linguística anglo-saxónica....................................................17 3.1.1. Princípios do termo 'colocacäo' em linguística..................................................17 3.1.2 J. R. Firth e a escola firthiana..............................................................................19 3.1.3 Colocacöes na era de linguística de corpus.........................................................24 3.1.4. Abordagem frasal................................................................................................27 3.2 Co-ocorréncia lexical restrita na tradicäo linguística portuguesa...............................31 3.2.1 Alvaro Iriarte Sanromán......................................................................................33 3.2.2 Herculano de Carvalho........................................................................................42 3.2.3 Bernard Portier.....................................................................................................43 3.3 Colocacöes na tradicäo linguística checa....................................................................44 3.4 Síntese das teorias e princípios da seleccäo de colocacöes para o dicionário de colocacöes checo-portugués.............................................................................................51 4. Dicionários de colocacöes................................................................................................54 4.1 O problema de metalexicografia.................................................................................54 4.2. Dicionários existentes de colocacöes e de combinacöes näo livres...........................55 5. Criacäo de um dicionário de colocacöes checo-portugués...............................................60 5.1 Métodos de deteccäo e extraccäo de colocacöes existentes.......................................60 5.1.1 Colocacöes monolingues.....................................................................................60 5.1.2 Pares bilingues.....................................................................................................61 5.2 Métodos utilizados na criacäo do dicionário de colocacöes checo-portugués............64 5.3 Versäo electrónica do dicionário de colocacöes checo-portugués..............................66 5.4 Trabalho futúr o...........................................................................................................67 6. Conclusäo..........................................................................................................................68 Bibliografia...........................................................................................................................70 Apéndice 1: Lista das colocacöes.........................................................................................79 Apéndice 2: Código fönte da página web do dicionário de colocacöes online....................85 3 We talk of high mountains and tall trees, but not usually of tall mountains and high trees. Similarly a man can be tall but never high (except in the sense of being intoxicated!), whereas a ceiling can only be high, not tall. A window can be both tall or high, but a tall window is not the same as a high window. We get old and tired, but we go bald or grey. We get sick but we fall ill. A big house, a large house and a great house have the same meaning, but a great man is not the same as a big man or a large man. You can make a big mistake or a great mistake, but you cannot make a large mistake. You can be a little sad but not a little happy. We say very pleased and very tiny, but we do not say very delighted or very huge.1 In order to speak natural English, you need to be familiar with collocations. You need to know, for example, that you say 'a heavy smoker' because heavy (NOT big) collocates with smoker, and that you say free of charge' because free of collocates with charge (NOT cost, payment, etc.). If you not choose the right collocation, you will probably be understood but you will not sound natural.2 la combinacion *introducir ganas no existe en espanol, pero si entrar ganas; lo mismo ocurre con *albergar un chasco. En espanol, albergamos esperanzas e incluso odios, pero no chascos. Estos, los tenemos o nos los llevamos.3 ...o esp. pan bianco se opoe ao pan negro, que nao e negro, e dgua [sic] salada a agua [sic] dulce, que e simplesmente nao-salgada. Trata-se sempre de oposigoes na norma, que caracterizam os idiomas a que pertencem; assim, o esp. vino tinto e vermelho em italiano (vino rosso) e preto em servo-croata (crno vino)4 1 http://esl.fis.edu/grammar/easv/colloc.htm 2 Longman Dictionary of Contemporary English (1987: 193). 3 http://www.dicesp.com 4 Coseriu, 1979: 68, em Sanroman Iriarte (2002: 190). 4 1. Introdu^äo Todos os dias, usamos expressöes aparentemente ilögicas: vinho branco e dourado e päo preto e castanho. Um falante nativo sabe que deve dizer vinho tinto e primeiros socorros mas um estrangeiro que esta a aprender a lingua talvez näo ache estranho vinho vermelho nem primeira ajuda. Em checo «damos» atencäo, em ingles «pagamos» atencäo e em portugues prestamo-la. Todas essas peculiaridades devem-se ao fenömeno da colocacäo e as expressöes chamam-se colocacöes (do latim collocare, colocar junto). Analisando a nossa experiencia pessoal com a aprendizagem e o ensino de linguas e com a traducäo, chegämos ä conclusäo de que a problemätica das colocacöes e extremamente importante; porem, näo lhe e prestada devida atencäo. Este trabalho tem como objectivo mudar esta situacäo desfavorävel e demonstrar a importäncia das colocacöes. Quem decidir dedicar-se ao estudo das colocacöes, notarä logo que - tal como disse Nesselhauf (2004, em Antunes, 2007) - hä tantas respostas ä pergunta 'o que e uma colocacäo?' quantos os autores que escrevem sobre o assunto. Segundo Bartsch (2004: 27-28), esta situacäo deve-se aos seguintes factos: (i) a dificuldade encontrada em delimitar os diferentes tipos de combinacöes de palavras; (ii) o facto de as combinatörias consistirem num fenömeno linguistico que parece situar-se na fronteira entre a gramätica e o lexico (o que dificulta a elaboracäo de uma definicäo formal e sistemätica do ponto de vista da teoria linguistica, uma vez que parece näo ser possivel uma explicacäo baseada unicamente em principios sintäcticos e semänticos ja estabelecidos); (iii) o facto de existirem diferentes abordagens deste fenömeno, nomeadamente a abordagem baseada em frequencias e a abordagem fraseolögica.5 5 Traduzido por Sandra Antunes (2007). 5 Bartsch acrescenta que a insuficiente especificidade das definicöes do termo 'colocacäo' domina nos estudos sobre as colocacöes desde a introducäo do termo em linguistica. Este é ainda hoje em dia um problema com o qual a linguistica näo consegue lidar efectivamente. Na literatura consultada encontrámos o termo e o conceito de 'colocacäo' utilizado em vários sentidos diferentes: (i) denominacäo do facto de algumas palavras ocorrerem juntas formando locucöes; (ii) o facto de algumas palavras poderem ocorrer juntas, i. e. a capacidade de algumas palavras ocorrerem juntas (neste sentido é também utilizado o termo 'colocabilidade'); (iii) combinacöes frequentes ou usuais de palavras; (iv) combinacöes de palavras aparentemente livres, onde actua qualquer tipo de restricäo lexical determinada pela norma e uso. Apesar destas dificuldades, tentaremos esbocar o desenvolvimento no campo dos estudos sobre as colocacöes, tracando o seu uso desde as primeiras mencöes até ao dia de hoje. Devido ao facto de o campo ter sido liderado pelos autores anglo-saxónicos, abordaremos com teorias e conceitos nascidos na Grä-Bretanha, mencionando, ocasionalmente, também autores näo anglo-saxónicos que escrevem em ingles. A seguir, pesquisaremos as obras de linguistas Portugueses e checos com a finalidade de descobrir se eles trazem abordagens novas e originais ou apenas adoptam os conceitos da linguistica anglo-saxónica. Como durante a nossa pesquisa näo encontrámos evidéncia de que os autores que escrevem sobre colocacöes se agrupassem ou formassem escolas complexas linguisticas que merecessem registo6, vamos tratar dos autores mais importantes separadamente. O conhecimento adquirido servir-nos-á como a base teórica para a criacäo de um futuro dicionário de colocacöes checo-portugués. O segundo objectivo do presente trabalho 6 Há seguidores de alguns autores que formám algo que pode ser considerado uma escola linguistica, esta contudo baseia-se em abordagens semelhantes da problemática de colocacöes. De nenhuma maneira podemos falar duma corrente linguistica complexa. Ao contrario, podemos dizer que alguns autores pertencem ao estruturalismo, á pragmática, etc. ou pelo menos foram influenciados por eles. 6 é entäo explorar os métodos de criacäo de tal dicionário. Os resultados, i. e. amostras de colocacoes que poderäo ser incluídas no futuro dicionário, seräo publicadas em anexo deste trabalho e na Internet. Demonstraremos também a importäncia das colocacöes na aquisicäo e processamento de linguagem, ensino de línguas, traducäo, linguística computacional e lexicografia. 7 2. A importäncia das coloca^öes 2.1 Coloca^öes na aquisicäo da linguagem e no processamento psicológico Os estudos recentes confirmam que devido ao facto de as frases lexicais ('lexical phrases', termo introduzido por Nattinger) prefabricadas formarem uma parte da linguagem dum adulto täo ubiqua, podemos assumir que também fazem parte da linguagem duma crianca, constituindo uma parte do sistema da linguagem que esta está a adquirir (cf. Nattinger-DeCarrico, 1992: 24). Esses estudos mostram que as criancas passam por uma fräse em que usam um grande numero de sequéncias näo analisadas de lingua ('unanalyzed chunks of language') em certos contextos sociais previsiveis. Por outras palavras, elas usam frequentemente uma linguagem «prefabricada» em situacöes apropriadas. Nattinger-DeCarrico däo o seguinte exemplo: Quanto a crianca pergunta a questäo frequente what is that?, usa-a como se os trés morfemas fossem uma unidade única e näo segmentada, what-is-that?, como qualquer palavra do seu vocabulário. Tratam estas trés palavras como se fossem uma unidade näo analisada, frequentemente reduzindo muitos dos seus sons ([hwgsdast], [hwgdas], etc.) e pronunciando o conjunto sob apenas um acento; aparentemente näo reconhecem, pelo menos nas fases iniciais da aquisicäo, que se trata duma frase com componentes lexicais separados. Muitas investigates iniciais atribuíram a frequéncia dessas sequéncias á releväncia da imitacäo e á necessidade da memorizacäo na aprendizagem da linguagem. Viam-nos como um «atoleiro» na aquisicäo das regras reguläres e sintácticas. Consideravam essas sequéncias prefabricadas distintas (e de čerta maneira periféricas) do corpo fundamental da linguagem (Ibidem). Naturalmente, há também estudos sobre a aquisicäo da L2, a segunda lingua, ou seja, a lingua näo materna. Hakuta (1974, em Nattinger-DeCarrico, 2002: 24-25) foi dos primeiros a sugerir que afinal essas sequéncias talvez näo fossem täo incidentals. Num 7 Como a maioria dos estudos sobre as colocacöes está escrita em inglés, enfrentámos numerosos problemas terminológicos. Sempře procurámos encontrar um equivalente portugues, mas ás vezes era necessário incluir a nossa traducäo. 8 estudo de criancas japonesas que aprendiam inglés fez uma distincäo importante entre as rotinas ('routines') prefabricadas que descreveu como sequéncias da lingua invariáveis ('unvarying chunks of language') e os padröes ('patterns') prefabricados que descreveu como segmentos de frase que operam em conjunto com urn componente movivel, como insercäo duma frase nominal ou duma frase verbal, como por exemplo this-is-a X. Ele também sugeriu que essas sequéncias tem um papel importante no processo da formacäo de regras - as criancas näo os utilizam apenas como formulas memorizadas mas sim como matéria-prima da segmentacäo e análise no desenvolvimento das regras da sintaxe. As observacöes de Hakuta foram confirmadas por Lily Wong-Fillmore (1976, em Nattinger-DeCarrico, 2002), cuja pesquisa é reconhecida como uma das mais complexas no campo da linguagem prefabricada na aquisicäo da L2. Ela até pöe essas sequéncias no proprio centro da aquisicäo duma lingua: The strategy of acquiring formulaic speech is central to the learning of language. [...] Routines and patterns learnt in the language acquisition process evolve directly into creative language. Eis a palavra-chave, 'formulaica', ou seja, etiqueta que é atribuida a expressöes que näo säo formadas segundo as regras reguläres e abränge também idiomas e colocacöes. Por outro lado, há quem ponha em dúvida as conclusöes de Wong-Fillmore: segundo Krashen e Scarcella, rotinas e padröes apenas tern urn papel marginal na aquisicäo da linguagem e säo completamente diferentes do processo da construcäo criativa considerada somente uma questäo da análise das regras sintácticas. Sentem que essas sequéncias de lingua säo «useful in establishing and maintaining relations, [but] do not serve a primary role in language acquisition)) (Krashen-Scarcella, 1978: 283-300, em Nattinger-DeCarrico, 1992: 26). Contudo, a maioria dos investigadores concorda que os aprendentes usam no processo da aquisicäo da linguagem um numero significante das expressöes prefabricadas (Nattinger-DeCarrico, 1992: 26). Onde as opiniöes divergem, é na questäo da importäncia destes. O conhecimento linguistico dum adulto parece conter um continuum de construcöes linguisticas de vários niveis da complexidade e abstraccäo abrangendo itens concretos e 9 particulares, classes mais abstractas de itens ou combinacöes complexas de sequencias de lingua concretas e abstractas . Contudo, e necessärio ter em conta que apenas a linguagem dum adulto contem esta mistura e tern esta natureza. Esta estrutura emerge passo a passo, portanto as criancas näo aprendem a LI como se tivessem em mente uma gramätica inata9. Mais propriamente, aprendem com a ajuda de unidades psicolinguisticas diferentes das que os adultos usam, adquirem linguagem na base da frequencia, recorrencia e imitacäo10. Antes de falarmos sobre a resultante importäncia das colocacöes (e outras formas da linguagem formulaica) no ensino, mencionemos brevemente o papel da linguagem prefabricada no processamento psicolögico, estreitamente relacionado com a aquisicäo da linguagem. Hä sugestöes de que a capacidade da memoria e vasta - contrariamente ä velocidade do processamento. Por isso temos que aprender «atalhos» com o propösito de tornar o tempo de processamento o mais eficiente possivel (cf. Nattinger-DeCarrico, 1992: 31). Värios estudos do processamento da linguagem mostram que a linguagem esta depositada redundantemente. As palavras, por exemplo, estäo depositadas näo apenas como morfemas individuas senäo como partes de frases, ou como sequencias de lingua longas e memorizadas ('longer memorized chunks of speech') e estas säo frequentemente recuperadas da memoria numa forma dessas «pre-juntadas» sequencias ('pre-assembled chunks') (Ibidem). Como afirmam Nattinger e DeCarrico (Ibid.: 32), «e a nossa capacidade de usar frases lexicais que nos ajuda a falar fluentemente.»11. Uma opiniäo semelhante - relevante äs colocacöes - pode ser encontrada nos livros de aprendizagem de colocacöes: destaca-se o facto de que a fluencia que resulta do uso correcto das colocacöes deveria ser um dos objectivos do ensino de linguas. 8 [Adult language knowledge consists of] concrete and particular items (as in words and idioms), more abstract classes of items (as in word classes and abstract constructions), or complex combinations of concrete and abstract pieces of language (such as mixed constructions) (Tomasello, 2000: 99, em Collocations and Idioms 1: 87). 9 Children do not learn their LI on the basis of an innate Universal Grammar (Eskildsen-Cadierno, 2007: 87). 10 Children learn language in an item-based fashion heavily reliant on frequency, recurrence and imitation (Ibidem). 11 It is our ability to use lexical phrases [...] that helps us speak with fluency. 10 2.2 Colocacôes no ensino Em vista do que temos dito sobre a aquisicäo e o processamento de linguagem, vejamos agora o problema das colocacôes no ensino da L2. Muitos estudos sobre esta matéria tém sido efectuados, conduzindo, em alguns casos, a resultados parciais diferentes; näo obstante, há unanimidade sobre as seguintes conclusôes: (i) a producäo das colocacôes representa um problema para os aprendentes, e estes problemas säo maiores do que os que os aprendentes tém com o uso de vocabulário geral; (ii) os aprendentes usam menos colocacôes do que os falantes nativos; (iii) os aprendentes näo tém ciéncia nem das restricôes colocacionais, nem do potenciál combinatório dos itens lexicais (Eskildsen-Cadierno, 2007: 87-89). Segundo as estatísticas, o uso das colocacôes pelos aprendentes é apenas 25 %12 (Nesselhauf, 2005, em Eskildsen-Cadierno, 2007: 89). Urna das possíveis interpretacôes desta indicacäo é que os aprendentes da L2 adquirem a competéncia colocacional com dificuldades. Esta interpretacäo é apoiada pela vista tradicional de a linguagem formulaica ser divergente das normas duma lingua gerada gramaticalmente. This is a result of the underlying view of FL [formulaic language] being deviant from the norm of gramatically generated language. It is even implied in Wray13 that "learning formulaic language is not 'real' language learning" (Ibid.: 89). A aprendizagem «real» pressupoe computacao baseada nas regras sintacticas e a capacidade de analisar e de compor unidades lexicograficas. A linguagem formulaica, porem, foge das regras da combinatoria gramatica; ha inconsistencias entre elas. Por outras palavras, a linguagem formulaica e considerada fomulaica, ou seja fixa ou «congelada»14porque a competencia linguistica nunca podia ter produzido tais combinacoes (Ibidem). Contudo, os autores nao espeficificam o que exactamente o numero significa. 13 Wray, Alison (2002). Formulaic language and the lexicon. New York: Cambridge University Press. pl96. 14 Os autores anglo-saxonicos utilizam o termo frozen. Pereira e Nascimento (1996) empregam o termo «cristalizada». 11 Daqui resulta a necessidade de aprender colocacöes (bem como outras formas irreguläres e «congeladas») duma maneira diferente da aprendizagem de fenómenos reguläres. Infelizmente para os aprendentes, a aprendizagem de colocacöes consiste em memorizacäo automática, pois a forma da colocacäo na lingua estrangeira näo pode ser deduzida. As vezeš a estrutura é semelhante (kvalifikovaná většina - maioria qualificada) mas é necessário verificar o uso exacto (ozonová dira - buraco DO ozono vs. ozonová vrstva - camada DE ozono). O estudo de materiais de aprendizagem de várias línguas levou-nos á conclusäo de que a única lingua em cujo ensino é dada devida atencäo as colocacöes é o inglés. Este facto provavelmente resulta de um durável interesse dos linguistas anglo-saxónicos pelas colocacöes e também do facto de o inglés ser a lingua mundial mais importante, a cujo ensino é prestada muita atencäo, sendo os métodos já bem elaborados. Existe uma série de livros dedicados exclusivamente ás colocacöes (English Collocations in Use) mas as colocacöes näo fazem falta praticamente em nenhum bom livro de aprendizagem de inglés. A situacäo no ensino de outras línguas é diferente: näo existem livros especializados em colocacöes e há poucos materiais que tratem delas (ou os poucos existentes näo as nomeiam explicitamente). A importäncia das colocacöes é subvalorizada ou a problemática é omitida completamente, apesar de as colocacöes serem imprescindiveis no ensino de estudantes avancados: sabendo já como se dizem palavras separadas, devem aprender juntalas duma forma natural como o fazem os falantes nativos. Para alem disso, «precise thought is made easier by well-defined terms» (Lewis, 1993: 1). Begona Sanromán Vilas e Margarita Alonso Ramos (2007) observaram que até os estudantes mais avancados faziam muitos erros no uso das colocacöes em espanhol e afirmam que um dicionário de colocacöes é um instrumente necessário de aprendizagem. A ideia de combinar um dicionário de colocacöes com exercícios näo é nova: alguns exercícios säo inseridos no Oxford Collocations Dictionary for Students of English. Também o DiCE (Diccionario de colocaciones del espaňol) inclui tanto os exercícios de producäo como os de compreensäo. Mencionemos alguns dos exemplos apresentados15: http://www.dicesp.com 12 A. Rodea la respuesta que mejor se corresponda con la glosa 'causar pánico en varias personas': a. esparciar el pánico; b. reproducir el pánico; c. sembrar el pánico; d. extender el pánico. B. Transforma las siguientes oraciones de manera que se pueda sustituir el verbo en negrita por una expresión equivalente: un verbo de apoyo seguido del nombre que aparece entre paréntesis: a. Firme este documento, por favor. (FIRMA) b. Castigarán a los culpables. (CASTIGO) c. No se preocupe: su vida no peligra. (PELIGRO) C. Encuentra sinónimos para los verbos que aparece en cursiva: a. Senti una gran ALEGRIA, que todavia ahora no podria explicar. b. Sufrió una grave DOLENCIA que le mantuvo retirado durante un tiempo. c. Le dio un PUNT APE a un objeto duro que rodó unos pasos delante suyo. D. Rellena los huecos valiéndote de las glosas entre paréntesis: a. Pedro le_MIEDO a los aviones. b. No deberias_le RENCOR por tan cosa. c. De repente, le_el RESPETO. (Ibid.: 289-290) Quanto ao segundo grupo - exercícios de compreensäo - é possível produzir exercícios como o seguinte: E. Si leemos en el periódico "el gobierno de EEUU tiene fuertes sospechas de que Irán ha desarrollado programas de armas bacteriológicas", entenderemos que las sospechas son FUERTES porque... a. se refieren a un hecho considerado muy malo; b. el Gobierno está muy seguro de el hecho es cierto; c. duran mucho tiempo; d. son compartidas por varias personas. (Ibid.: 292) 13 A resposta correcta é b, pois um suspeito dum facto considerado negativo seria grave ou terrible, urn suspeito presente por muito tempo seria permanente e urn suspeito comum a muitas pessoas seria extendido ou generalizado. Contudo, apesar de uma inegável importäncia da aprendizagem das colocacöes, achamos que näo é importante aprender milhares de colocacöes de cor. O que importa säo os metodos: os estudantes avancados (entre os quais ha futuros tradutores) deveriam conhecer as ferramentas que facilitam a procura das colocacöes numa lingua estrangeira e a transferéncia das colocacöes duma lingua para outra (algumas ferramentas uteis seräo mencionadas em 5.1). Assim estamos a chegar á problemática das colocacöes na traducäo. 2.3 Colocacöes na traducäo Como já mencionámos, as colocacöes causam problemas sobretudo na hora de produzir um texto numa lingua estrangeira, seja em forma de capturar nossas próprias ideias seja em forma de traduzir ideias e textos de outros. Temos problemas em traduzir correctamente colocacöes de tipos B-D na classificacäo de Mel'cuk/Iriarte Sanromán {prudká reakce -reacgäo *afiada vs. violenta; drtivá většina - *maioria plausivel vs. esmagadora maioria; single words - palavras (*)únicas vs. (*)individuais vs. (*)separadas vs. isoladas) bem como colocacöes-unidades lexicais {daňový poplatník - contribuinte, slovní hříčka -trocadilho, zdrojový text - texto fonte) e outros tipos da linguagem prefabricada. Naturalmente, um ser humano nunca poderá aprender todas as colocacöes duma lingua estrangeira (e os tradutores confirmaräo que ás vezeš, influenciados pelo texto fonte, até duvidam das colocacöes em lingua materna) mas, como já mencionámos no capitulo anterior, é importante que aprenda como encontrar as colocacöes em textos disponiveis; no caso de textos técnicos, as colocacöes frequentemente säo idénticas á terminologia. 2.4 Colocacöes no processamento computacional e na linguistica computacional Sob a influéncia das gramáticas de Chomsky, o léxico computacional tinha sido visto como uma lista de palavras que possui propriedades sintácticas e semänticas muito especificas e 14 que e sujeite as regras combinatorias dum parser!generator. Contudo, o lexico passou a ser considerado um conjunto de varios tipos do conhecimento linguistico, nao apenas de propriedades depalavras isoladas (Nattinger-DeCarrico, 1992: 22). Becker (1974, em Nattinger-DeCarrico, 1992: 22) foi dos primeiros a propor que frases como let alone, as well as e so much for que de muitas maneiras fogem das analises nas gramaticas tradicionais simplesmente nao podem ser ignoradas: sao ubiquas. Becker pretende tratar essa classe de frases idiossincraticas duma forma sistematica. Como notam Nattinger e DeCarrico, a opiniao prevalente entre os linguistas computacionais nos anos noventa (quando foi publicado o seu livro Lexical Phrases and Language Teaching) era a de que o conhecimento linguistico nao pode ser dividido rigorosamente entre regras gramaticais e itens lexicais. Mais provavelmente, ha uma escala inteira de itens, dos quais alguns sao especificos e pertencem a um numero pequeno de casos, enquanto os outros sao muito gerais e pertencem a um grande numero de casos. Os primeiros chamam-se frequentemente 'itens lexicais', enquanto os segundos 'regras gramaticas', mas dado que os elementos existem a todos os niveis da generalidade, e impossivel distinguir rigorosamente entres eles. Em 1984, Wilensky et al. (1984, 574-593, em Nattinger-DeCarrico, 1992: 23) propos a abordagem frasal ('phrasal approach') que incorporou frases inteiras bem como palavras separadas. Em 1987, Zernick and Dyer (1987: 308-327, em Nattinger-DeCarrico, 1992: 23) aprofundaram a teoria incluindo, no seu conceito de lexico, as seguintes unidades: (i) palavras isoladas ('single words'); (ii) frases fixas ('fixed phrases'); (iii) todos os casos de certas frases variaveis ('all instances of certain variable phrases'); (iv) itens isolados e generalizados que abrangem esses series de frases ('single generalized entries which encompass these sets of phrases'). Quanto a aplicacao pratica, as colocacoes podem ser de grande importancia nas seguintes areas: 15 Criacäo de dicionários, seja monolingues, seja bilingues. As colocacöes frequentemente formám um significado semäntico novo e a extraccäo automática facilitará a criacäo de dicionários gerais, dicionários de termos, etc. Traducäo automática. As primeiras máquinas de traducäo utilizavam o mecanismo de traducäo á letra, perdendo assim uma parte do significado. As colocacöes reconhecidas podem ser traduzidas correctamente, mantendo o sentido do texto fonte. Verifícadores ortográfícos. Durante o controlo, näo apenas as palavras mas também as combinacöes de palavras podem ser verificadas. Assim descobre-se uso errado de palavras (*vinho vermelho). OCR, reconhecimento de texto. Geralmente trata-se das situacöes de predicäo de palavras num texto, dependendo das palavras antecedentes. Uma palavra dificilmente reconhecível será reconhecida com maior sucesso se as palavras antecedentes (ou o contexto em geral) predicarem ocorréncia duma colocacäo. Motores de pesquisa, classificacäo de documentos e sistemas de indexacäo. As palavras adquirem novos sentidos se formám parte duma colocacäo e conhecendo o «novo» significado especifico será mais fácil e mais preciso determinar o conteúdo do documento. Se formos capazes de extrair as colocacöes dum documento, seremos capazes de utilizá-las (junto com os termos univerbais) como a base para a indexacäo. Se reconhecermos as colocacöes também na consulta de pesquisa, obteremos resultados melhores dos que obtemos através da pesquisa de palavras isoladas e indexacäo clássica, i. e. univerbal. Com volumes de dados täo rapidamente crescentes é cada vez mais importante a especificacäo dos parämetros e a capacidade de interpretar correctamente as expressöes pluriverbais. Igualmente, se utilizarmos colocacöes e näo palavras unicas na procura das palavras-chave podemos esperar melhores resultados. Ao utilizarmos um dicionário de colocacöes na síntese de texto, podemos evitar uso errado dalgumas palavras. Recuperacäo de informacöes. Durante o processo da desambiguacäo semäntica distinguimos qual o significado (de todos os que a palavra tem) no texto concreto. Em muitos casos o significado depende do contexto e do conhecimento de possíveis colocacöes de uma determinada palavra; é porque as colocacöes säo frequentemente formadas por palavras polissémicas e o sentido apenas é determinado através da colocacäo. 16 3. Colocacöes na teória linguística 3.1 Colocacöes na tradicäo linguística anglo-saxónica 3.1.1. Princípios do termo 'colocacäo' em linguística Ao consultar a segunda edicäo do conspícuo OED, Oxford English Dictionary, vemos que o primeiro registo do termo 'collocation', num contexto distintamente linguístico, se data já do século XVIII: 1750 HARRIS Hermes II. iv. Wks. (1841) 197 The accusative..in modern languages..being subsequent to its verb, in the collocation of the words. Na citacäo de Harris, o termo colocacäo é utilizado num sentido mais proximo ao que hoj e em dia chamamos coligacäo, i. e. a justaposicäo gramática das palavras numa frase (trataremos o termo em detalhe em 3.1.2). Näo há nenhuma mencäo sobre o carácter lexical que o termo assumiu ao decorrer do tempo e com o qual está ligado na terminológia da linguística contemporänea. Numa citacäo de Trager de 1940 (na mesma entrada no OED), o termo 'collocation' denota as propriedades gerais combinatórias dos 'elementos linguisticos' (i. e. näo apenas itens lexicais). 1940 G. L. TRAGER in Language XVI. 301 Collocation establishes categories by stating the elements with which the element being studied enters into possible combinations. Ibid. 303 It is now necessary to establish the collocations of the various forms to see what their functions are. Esta apreensäo concebe a colocacäo como um conjunto de propriedades combinatórias sintáticas e semänticas que regem a combinacäo de itens lexicais individuals e de formas individuals das palavras. Näo é evidente quem foi o primeiro a introduzir o termo 'collocation' no sentido de uma combinacäo de palavras fixa e relativamente recorrente. Já em 1917, Otto Jespersen 17 (em Bartsch, 2004: detalhes bibliograficos nao mencionados) nota que algumas expressoes colocam frequentemente com outras: Little and few are also incomplete negatives: note the frequent collocation with no: there is little or no danger. Na obra^4 Grammar of English Words (1938: x, em Bartsch, 2004), Harold E. Palmer, alem de ter incluido o termo colocacao no subtitulo do capitulo How the vocabulary is set out explica o que e uma colocacao e como ele resolveu o problema das colocacoes na sua 'gramatica das palavras' ('grammar of words'). As colocacoes sao concebidas como unidades lexicais. COLLOCATIONS When a word forms an important element of a "collocation" (a succession of two or more words that may best be learnt as if it were a single word) the collocation is shown in bold type (...). The collocations are entered so far as possible under the appropriate semantic variety of the word (...). O que e interessante sobre esta definicao e o facto de que Palmer a aprofunda mais do que muitos autores posteriores, afirmando que, em principio, nao ha restricoes quanto ao numero das palavras («a succession of two or more words»). Nos exemplos apresentados vemos que Palmer considera como constituintes de colocacoes palavras semanticamente autonomas bem como as nao autonomas (make up, make a fool of ask about, ask for, a good many)16. Realce-se, ao mesmo tempo, a importancia da distincao entre 'colocacoes' e 'frases' ('phrases') que, de novo, reflecte o conceito da colocacao como uma unidade lexical: PHRASES Phrases are different from collocations. While collocations are comparable in meaning and function to ordinary single "words", (and indeed are often translated by single words in the 16 Alguns autores (e.g. Hausmann, 1995) reconhecem como constituintes apenas palavras semanticamente autonomas.. 18 student's mother-tongue), phrases are more in the nature of conversational formulas, sayings, proverbs, etc (Ibid.: xi). Esta distincao entre as colocacoes e as frases, i. e. proverbios e frases feitas, e uma das que se mantiveram ate ao dia de hoje. Contudo, o que Palmer rejeita e a distincao entre os idiomas e as colocacoes, considerando as colocacoes apenas uma subcategoria dos idiomas. The term 'idiom' is as superfluous as (...) what are usually called idioms are generally nothing other than (a) collocations, (b) phrases and sayings, (c) rarer semantic varieties of words and collocations, (d) peculiar construction patterns and, in short, any word or form of wording that is likely to puzzle the foreign student (Ibid.: xii). 3.1.2 J. R. Firth e a escola firthiana J. R. Firth (1890-1960), o primeiro professor de Linguistica em Inglaterra, foi um dos iniciadores da chamada London School of Linguistics que seguia a linha estruturalista prevalente naquela epoca. Alem disso, copiou algumas ideias e conceitos tambem do funcionalismo. Sob a forte influencia do antropologo Bronislav Malinowski17, Firth assumiu a ideia de que a lingua devia ser estudada como um fenomeno social, sendo necessario levar em consideracao, alem dos factos puramente linguisticos, tambem o contexto social. Firth foi o primeiro a tratar das colocacoes mais amplamente e contribuiu para o aumento do interesse por este fenomeno18. Firth baseou a sua teoria do significado19 em 'sentido atraves da colocacao' ('meaning by collocation'), ou seja, na pressuposicao de que o significado duma palavra e determinado pelas relacoes existentes entre ela e as outras palavras. I propose to bring forward as a technical term, meaning by 'collocation', and to apply the test of 'collocability' (1957: 194). Bronislaw Kasper Malinowski (1882-1942), antropólogo britänico, considerado fundador da escola 'funcionaľ de antropológia que propunha que institucôes humanas devessem ser examinadas no contexto da cultura como um todo. 18 Contudo, Firth pretende pesquisar o fenomeno de colocacoes apenas com fins estilisticos. 19 theory of meaning 19 Na teória do significado contextual , a colocacäo tem um papel central no sentido determinado pelo contexto. No ensaio The Technique of Semantics de 1934, Firth afirma que as palavras adquirem o seu sentido tanto através de co-ocorréncias tipicas com outras palavras num ambiente linguístico imediato como através da sua posicäo nos enunciados que pertencem á linguagem general ou a urna particular variedade domínio-específica21. Firth defende que o significado tem quatro níveis: (i) contexto situacional; (ii) colocacôes; (iii) sintaxe; (iv) fonologia e fonética. A primazia atribuída ás relacôes sintagmáticas entre itens linguísticos e a resultante importäncia da descoberta dos limites sintagmáticos para além dos quais a escolha linguística é impredicável levou Firth a marcar distincäo entre os conceitos de 'colocacäo' e de 'coligacäo'. Enquanto o conceito de colocacäo é usado para denotar a escolha lexical restringida (as colocacôes correspondem a co-ocorréncias significativas de determinadas palavras com urna čerta proximidade), a coligacäo refere-se á formacäo regular de estruturas gramáticas como preferencia dalguns verbos em certas estruturas; as coligacôes correspondem a combinacôes de palavras sintacticamente restritas do ponto de vista da sub-categorizacäo {afraid of). Firth näo nos dá outras referéncias sobre a dištancia das palavras que constituem urna colocacäo, constatando apenas que como colocacôes podem ser consideradas quer associacôes contíguas de palavras {hold life in contempt), quer palavras que näo ocorrem contiguamente {one dark and cold night; the night is dark). A contribuicäo de Firth é digna de elogio dado que näo teve á sua disposicäo nenhumas ferramentas de processamento automático do texto. Mesmo assim, efectuou uma pesquisa empírica de itens lexicais em contexto baseada em textos auténticos e näo em exemplos inventados e sem contexto. Apesar de näo haver, na sua época, ferramentas 20 contextual meaning theory 21 through their being embedded in utterances identified as belonging to either the general language or to a particular domain-specific language variant (Ibid.: 10) 20 adequadas de processamento do texto, Firth sugeriu uma metodológia ideal do estudo da linguagem que pôde ser aplicada quando finalmente apareceram ferramentas apropriadas; facilitou assim a subida da linguistica de corpus. A «ressureicao» do interesse pelas colocacôes decorreu nos anos 80 gracas aos corpora já elaborados22. Contudo, houve autores que escreveram sobre as colocacôes nos anos 60 e 70 e algumas notas sobre os seguidores de Firth - T. F. Mitchell, Michael Halliday e Sidney Greenbaum - merecem ser listadas aqui. T. F. Mitchell (1919-2007) comecou a sua carreira linguistica em Londres: depois da segunda guerra mundial foi nomeado director da School of Oriental and African Studies por J. R. Firth. Junto com Sydney Greenbaum é considerado uma das personagens centrais da atitude britänica na area de estudos lexicográficos. Como Mitchell nota no seu estudo Principles of Firthian linguistics, a linguistica 23 firthiana comecou a dar prevaléncia ao estudo das relacôes sintagmáticas entre itens linguísticos. Para além disso, a linguistica firthiana (com a excepcäo de Halliday) reconheceu também a interdependéncia da gramática e do léxico. Mitchell próprio descreve esta interdependéncia em termos da influéncia mútua de sentido formal e estrutural24 e até os estudos recentes mostram que este merne - que palavras devem ser estudadas no contexto de outras palavras com as quais co-ocorrem em relacôes sintácticas directas e que essas combinacôes de palavras devem ser vistas em luz do seu contexto de ocorréncia mais amplo (i. e. textual, situacional) - sobreviveu. Mitchell examinou principalmente todas as variedades da delimitacäo sintagmática e a inter-relacäo entre a gramática e o léxico. Contribuiu para os estudos das colocacôes com as observacôes sobre a posicäo dos constituintes: configuracôes que contém os mesmos morfemas lexicais nem sempre significam o mesmo se estes constituintes säo deslocados ou inflectidos. Por exemplo, hard em hard work tern significado diferente do em hard-working. De maneira semelhante, goings-on näo equivale a on-going. Os primeiros corpora surgem ja nos anos 60, mas os metodos de processamento automatico do texto estao longe de ser de qualidade pelo menos ate aos anos 80. 23 Usamos este termo aqui para designar o conjunto de teorias dos seguidores de Firth, nao de ele proprio. 24 Lexical particularities are considered to derive their formal meaning not only from contextual extension of a lexical kind but also from the generalized grammatical patterns within which they appear, and conversely, the recognition of general patterns is seen as only justifiable in response to selected comparisons of lexical combinations (1975: 114). 21 A seguir, devido ao interesse de Mitchell pelas relacôes gramaticais , vemos que nem todas as palavras duma colocacäo ocorrem em todos os padrôes morfo-sintáticos teoricamente possíveis: Heavy damage is possible as well as damage heavily and heavily damaged, but not *heavy damaging, whereas heavy drinking is possible as well as drink heavily, but not *heavily drunk (1971: 52). Segundo Mitchell, urna colocacäo é constituída por um lexema (ou o seu raiz) e por todas as suas formas derivadas (expressôes como a strong argument, he argued strongly, the strength of the argument, e his argument was strengthened säo consideradas instäncias da mesma combinatória). Quanto á dištancia dos componentes, Mitchell (bem como Halliday que será analisado mais tarde) afirma que urna combinacäo de palavras pode ultrapassar fronteiras frásicas, dando como exemplo: He didn 'twant the job. I don't think he even applied. Sidney Greenbaum (1929-1996) foi professor de inglés na London University College e University of London e autor de várias gramáticas e livros sobre uso de inglés. Devido á confusäo que havia no uso do termo colocacäo, Greenbaum propos a distincäo entre 'colocabilidade' ('collocability'), para potenciais co-ocorréncias de palavras, e 'colocacäo' ('collocation'), para expressôes que co-ocorrem frequentemente. Greenbaum distingue entre dois tipos de restricäo da colocabilidade dum item com outro em «certas relacôes sintácticas». Primeiro, a colocabilidade pode ser restringida pelas características semänticas dos constituintes26. *The boy may frighten sincerity está incorrecto; ao trocarmos os substantivos, a frase fica correcta: Sincerity may frighten the boy. O segundo tipo de restricôes näo pode, porém, ser exprimido em termos gerais. E entäo necessário enumerar itens concretos que podem colocar com o item em questäo. Greenbaum coloca os seguintes exemplos: *The man badly wished them to leave em contraste com The man badly wanted them to leave. Apesar de want, wish e desire serem sinónimos, näo criam colocacôes idénticas. 25 Contudo, apesar de considerar as relacôes gramaticais como as mais importantes, este autor tem também em atencäo as relacôes semänticas no estudo das colocacôes, tentando estabelecer um continuum entre as colocacôes, os compostos e as expressôes idiomáticas. 26 Este fenómeno já foi descrito por Chomsky (1965). 22 Quanto a consideracao de factores semanticos e sintacticos, o autor defende uma 27 abordagem integrada, i. e. o estudo de colocacoes deve ter em conta os dois : «for an analysis of collocations that is divorced from syntax, [...] it does not seem possible to establish a criterion for determining whether two items are collocating)) (1970: 11). Michael Halliday (Michael Alexander Kirkwood Halliday, nascido em 1952) e um dos linguistas mais importantes do seculo passado, fundador do influente modelo gramatical, gramatica sistemico-funcional28. Halliday interessa-se por dois problemas: o da colocacao e o da influencia que ela exerce em membros de conjuntos lexicais ('lexical sets'). Halliday viabilizou uma separacao mais completa entre a semantica e a gramatica, com o qual rematou as intencoes de Firth. Como um exemplo da lexicalidade da colocacao, Halliday compara a colocabilidade diferente de strong e powerful. An Electronic Dictionary of Collocations for European Portuguese: Methodology, Results and Applications [online]. 2002 [consultado 13/3/2009]. Antunes, S. Combinatorias do Portugues: uma abordagem corpus-driven com fins lexicograficos [online]. 2007 [consultado 13/3/2009]. Breve historico da metalexicografia no Brasil e dos dicionarios gerais brasileiros [online]. 2005 [consultado 15/2/2009]. Collocation [online], [consultado 15/2/2009]. COMBINA-PT: A Large Corpus-extracted and Hand-checked Lexical Database of Portuguese Multiword Expressions [online], [consultado 13/3/2009]. 75 COMBINA-PT - Combinatorias Lexicais do Portugues [online]. 2004 [consultado 13/3/2009]. COMBINATORIAS LEXICAIS DO PORTUGUES. Manual do Utilizador [online], [consultado 13/3/2009]. COMPARA [online]. 2008 [consultado 13/3/2009]. Etiquetador Tree-Tagger [online]. 2007 [consultado 15/4/2009]. JohnMcHardy Sinclair [online]. 2009 [consultado 17/3/2009]. Martins, E. S. O tratamento das lexias compostas e complexas [online], [consultado 28/3/2009]. Michael Halhday [online]. 2008 [consultado 16/3/2009]. Mineiro, A. Que tipo de combinatoria lexical no discurso da Nautica? Um estudo baseado num corpus linguistico [online]. 2005 [consultado 13/3/2009]. 76 Moraeus, H. F. R. Um estudo Contrastivo de colocacoes adverbiais (ingles portugues) sob o enfoque da linguistica de corpus [online]. 2005 [consultado 13/3/2009]. Pecina, P. A Machine Learning Approach to Multiword Expression Extraction [online]. 2008 [consultado 13/4/2009]. Pereira, L.A., M. F. Bacelar do Nascimento. Dicionario de Combinatorias do Portugues do Centro de Linguistica da Universidade de Lisboa [online], [consultado 13/3/2009]. T. S. Mitchell [online], [consultado 13/3/2009]. The DGT Multilingual Translation Memory of the Acquis Communautaire: DGT-TM [online]. 2009 [consultado 13/4/2009]. The Prague Dependency Treebank [online], [consultado 3/4/2009]. 77 Valente, R. Diferencas e similaridades colocacionais entre o portugues brasileiro e o portugues europeu. Estudo baseado na nocao de funcao lexical da teoria sentido texto [online], [consultado 25/3/2009]. Valente, R. Por que razao a combinatoria lexical nao pode ser um principio para se considerar verbos e adjetivos como sendo especializados? [online]. 2005 [consultado 13/3/2009].
 
PConnect("mysql.webzdarma.cz", "kolokace", "*********", "-k-k-k-k-k-k") . // vymazáni hodnot z formuláře pri zmačknuti tlacitka // preloz do PT/CS/odesli if ($_POST['SUBMIT1']) { $pt = ""; } else { $pt = $INTOPT; } if ($_POST['SUBMIT2']) { $cs = ""; } else { $cs = $INTOCS; } if ($_POST['SUBMIT']) { $newCS = ""; $newPT = ""; } else { $newCS = $CS; $newPT = $PT; } ?>

Vyhledáváni překladu kolokace

cesky
portugalsky
Execute($sql) ; if ($CONN->Execute($sql) === false) { echo('Nastal nejaky problem s výběrem z databáze.
'); echo("Problem spociva v: ".$CONN->ErrorMsg()."
"); echo("Napis to webmasterovi.
"); } else { if ($r->EOF) { echo ("Hledaný vyraz neni v databázi."); } else { while (!$r->EOF) { echo ( '
' .$r->fields[1] . ': ' .$r->fields[2]) ; $r->MoveNext(); } } } } if ($ POST['SUBMIT2']) { $sql = "SELECT * FROM slovníček WHERE pt='$INTOCS'"; $r = &$CONN->Execute($sql); if ($CONN->Execute($sql) === false) { echo('Nastal nejaky problem s výběrem z databáze.
'); echo("Problem spociva v: ".$CONN->ErrorMsg()."
"); echo("Napis to webmasterovi.
"); } else { if ($r->EOF) { echo ("Hledaný vyraz neni v databázi."); } else { while (!$r->EOF) { echo ( '
' .$r->fields[2] . ': ' .$r->fields[1]) ; $r->MoveNext(); } } } 87 } ?>

Přidejte svůj výraz

cesky portugalsky
Execute($sql) === false) { echo('Nastal nejaky problem s pridanim záznamu do databáze.
'); echo("Problem spociva v: ".$CONN->ErrorMsg()."
"); echo("Napiš to webmasterovi.
"); } else { echo('Vyrazy pridaný do databáze.' ) ; } } ?> < ! FOOTER
88