D.
Processamento de Linguagem Natural Multilíngue com SpaCy e análises avançadas de corpora anotados com AntConc (v. 4)
21/10/24, das 14h às 16h
Date, time and location:
Language of instruction:
Português
Will it have an interpreter?
não
About the Course
Esta oficina de duas horas é destinada a participantes com conhecimentos básicos da versão 4 do AntConc, que desejam aprimorar suas habilidades em processamento de linguagem natural (PLN) e análise de corpora multilíngues. Ao utilizar os pipelines da SpaCy, os participantes executarão tarefas como etiquetagem gramatical (POS tagging), lematização e análise de dependências sintáticas em corpora de diferentes idiomas. Em seguida, explorarão esses corpora anotados com Spacy no AntConc, observando as funcionalidades avançadas do Corpus Manager, para realizar pesquisas linguísticas criteriosas.
Objetivos:
1. Utilizar a ferramenta SpaCy para realizar tarefas avançadas de processamento de linguagem natural, incluindo etiquetagem gramatical (POS tagging), lematização e análise de dependências sintáticas, em corpora multilíngues.
2. Capacitar os participantes a explorarem corpora anotados com SpaCy e o Corpus Manager do AntConc, aproveitando as funcionalidades avançadas para realizar pesquisas linguísticas criteriosas.
Metodologia:
A oficina será conduzida através de uma abordagem prática e interativa. Inicialmente, os participantes serão introduzidos aos conceitos básicos e avançados do SpaCy e do AntConc. Seguir-se-á uma sessão prática onde os participantes executarão tarefas como etiquetagem gramatical, lematização e análise de dependências sintáticas em corpora de diferentes idiomas utilizando o SpaCy. Em seguida, os participantes aprenderão a explorar e analisar esses corpora anotados no AntConc, observando as funcionalidades avançadas do Corpus Manager.
Programa Resumido:
1. Introdução ao SpaCy e ao AntConc:
o Revisão das principais funcionalidades do SpaCy e da versão 4 AntConc.
2. Processamento de Linguagem Natural com SpaCy:
o Etiquetagem gramatical (POS tagging): Identificação e marcação das partes do discurso em diferentes idiomas.
o Lematização: Redução das palavras às suas formas base.
o Análise de Dependências Sintáticas: Estudo das relações gramaticais entre palavras em uma sentença.
3. Análise de Corpora no AntConc:
o Introdução ao Corpus Manager: Navegação e utilização das funcionalidades avançadas.
o Pesquisa Linguística: Realização de pesquisas criteriosas e análise de padrões linguísticos nos corpora anotados.
4. Atividades Práticas e Discussões:
o Execução de exercícios práticos utilizando SpaCy e AntConc.
o Discussão dos resultados e estratégias para melhorar a análise de corpora multilíngues.
Target audience
Participantes com conhecimentos básicos da versão 4 do AntConc.
References
Honnibal, Matthew; Montani, Ines. SpaCy Trained Models & Pipelines. Berlin: Explosion AI. Disponível em: < https://spacy.io/models >. Acesso em: 17 set. 2024.
Anthony, L. AntConc (Version 4.3.1). Tokyo, Japan: Waseda University. Disponível em: < https://www.laurenceanthony.net/software >. Acesso em: 17 set. 2024
Lecturer(s)
Jean-Claude Miroir
Professor associado na Universidade de Brasília (UnB), no departamento de Línguas Estrangeiras e Tradução (LET), com experiência em tradução literária, crítica e teoria da tradução, tradução especializada (jurídica, econômica, SEO), localização, legendagem, linguística de corpus e computacional. Endereço para acessar ao Lattes: http://lattes.cnpq.br/3299590986801782.