top of page

D.
Processamento de Linguagem Natural Multilíngue com SpaCy e análises avançadas de corpora anotados com AntConc (v. 4)

21/10/24, das 14h às 16h

Data e horário: 

Língua de instrução:

Português

Vai ter intérprete?

não

Sobre o curso

Esta oficina de duas horas é destinada a participantes com conhecimentos básicos da versão 4 do AntConc, que desejam aprimorar suas habilidades em processamento de linguagem natural (PLN) e análise de corpora multilíngues. Ao utilizar os pipelines da SpaCy, os participantes executarão tarefas como etiquetagem gramatical (POS tagging), lematização e análise de dependências sintáticas em corpora de diferentes idiomas. Em seguida, explorarão esses corpora anotados com Spacy no AntConc, observando as funcionalidades avançadas do Corpus Manager, para realizar pesquisas linguísticas criteriosas.

Objetivos:
1. Utilizar a ferramenta SpaCy para realizar tarefas avançadas de processamento de linguagem natural, incluindo etiquetagem gramatical (POS tagging), lematização e análise de dependências sintáticas, em corpora multilíngues.
2. Capacitar os participantes a explorarem corpora anotados com SpaCy e o Corpus Manager do AntConc, aproveitando as funcionalidades avançadas para realizar pesquisas linguísticas criteriosas.

Metodologia:
A oficina será conduzida através de uma abordagem prática e interativa. Inicialmente, os participantes serão introduzidos aos conceitos básicos e avançados do SpaCy e do AntConc. Seguir-se-á uma sessão prática onde os participantes executarão tarefas como etiquetagem gramatical, lematização e análise de dependências sintáticas em corpora de diferentes idiomas utilizando o SpaCy. Em seguida, os participantes aprenderão a explorar e analisar esses corpora anotados no AntConc, observando as funcionalidades avançadas do Corpus Manager.

Programa Resumido:
1. Introdução ao SpaCy e ao AntConc:
o Revisão das principais funcionalidades do SpaCy e da versão 4 AntConc.
2. Processamento de Linguagem Natural com SpaCy:
o Etiquetagem gramatical (POS tagging): Identificação e marcação das partes do discurso em diferentes idiomas.
o Lematização: Redução das palavras às suas formas base.
o Análise de Dependências Sintáticas: Estudo das relações gramaticais entre palavras em uma sentença.
3. Análise de Corpora no AntConc:
o Introdução ao Corpus Manager: Navegação e utilização das funcionalidades avançadas.
o Pesquisa Linguística: Realização de pesquisas criteriosas e análise de padrões linguísticos nos corpora anotados.
4. Atividades Práticas e Discussões:
o Execução de exercícios práticos utilizando SpaCy e AntConc.
o Discussão dos resultados e estratégias para melhorar a análise de corpora multilíngues.

Público-alvo

Participantes com conhecimentos básicos da versão 4 do AntConc.

Referências

Honnibal, Matthew; Montani, Ines. SpaCy Trained Models & Pipelines. Berlin: Explosion AI. Disponível em: < https://spacy.io/models  >. Acesso em: 17 set. 2024.


Anthony, L. AntConc (Version 4.3.1). Tokyo, Japan: Waseda University. Disponível em: < https://www.laurenceanthony.net/software >. Acesso em: 17 set. 2024

Ministrante(s)

Jean-Claude Miroir

Jean-Claude Miroir

Professor associado na Universidade de Brasília (UnB), no departamento de Línguas Estrangeiras e Tradução (LET), com experiência em tradução literária, crítica e teoria da tradução, tradução especializada (jurídica, econômica, SEO), localização, legendagem, linguística de corpus e computacional. Endereço para acessar ao Lattes: http://lattes.cnpq.br/3299590986801782.

bottom of page