Area of Interest: Documentation and text collection
Skills:
Competences:
Age Bracket: Adult Education
Time Commitment: 30 – 60 minutes
Affordability: €
Materials:
O guia sobre a recolha de amostras de texto foi concebido para o ajudar a reunir uma gama diversificada de materiais de texto autênticos para melhorar o seu ensino. Ao recolher sistematicamente amostras de texto, estará a criar um recurso valioso para a aquisição de vocabulário, a compreensão da leitura e a compreensão cultural. Este guia dá ênfase a uma abordagem que privilegia o digital, ao mesmo tempo que incorpora princípios básicos de lexicografia para o ajudar a construir um corpus de texto pequeno mas completo para enriquecer as suas aulas.
EQUIPAMENTO NECESSÁRIO
Para esta abordagem digital-primeira, vai precisar de:
1. Computador portátil ou de secretária
2. Scanner (de preferência portátil para digitalização em viagem)
3. Smartphone (para capturas rápidas e aplicações de OCR)
4. Disco rígido externo ou subscrição de armazenamento na nuvem
5. Software de processamento de texto (por exemplo, Microsoft Word, Google Docs)
6. Software de folha de cálculo (por exemplo, Microsoft Excel, Google Sheets)
Facultativo mas útil:
1. Software ou aplicação de OCR (reconhecimento ótico de caracteres).
2. Câmara digital (se a câmara do seu smartphone não for suficiente).
APLICAÇÕES DE OCR RECOMENDADAS (da listagem gratuita para a mais cara)
1. Google Drive (iOS/Android): Gratuito com uma conta Google.
Prós: Integração perfeita com o Google Docs, OCR automático para PDFs e imagens.
Contras: A precisão do OCR pode ser inconsistente.
2. Microsoft Office Lens (iOS/Android): Gratuito.
Prós: Integra-se bem com o Microsoft Office, bom para digitalização de documentos.
Contras: Os recursos de OCR são mais limitados em comparação com aplicativos especializados.
3. Tesseract (código aberto): Gratuito.
Prós: Altamente personalizável, suporta muitas línguas.
Contras: Requer conhecimentos técnicos para ser configurado e utilizado eficazmente.
4. Adobe Scan (iOS/Android): Gratuito com funcionalidades básicas, subscrição para funcionalidades avançadas.
Prós: Fácil de usar, boa precisão, armazenamento automático na nuvem.
Contras: Algumas funcionalidades requerem subscrição.
5. ABBYY FineReader (Desktop/Móvel): Pago com avaliação gratuita, a opção mais cara.
Prós: Alta precisão, recursos avançados de OCR, suporta vários idiomas.
Contras: Caro para utilizadores ocasionais.
Recomendamos que escolha uma solução de OCR com base nas suas necessidades específicas, orçamento e nível de conforto técnico. Comece com as opções gratuitas e veja quais funcionam melhor para o seu idioma antes de investir em qualquer subscrição.
Expert recommendations:
PRINCÍPIOS LEXICOGRÁFICOS A CONSIDERAR
A compreensão dos princípios lexicográficos básicos é crucial para a recolha de amostras de texto para o ensino das línguas. Estes princípios ajudam-no a analisar e organizar as suas amostras de forma mais eficaz, conduzindo a melhores materiais didácticos e a uma compreensão mais profunda da utilização da língua. Ao aplicar estes conceitos, pode identificar padrões na utilização de palavras, compreender como o contexto afecta o significado e reconhecer as nuances da linguagem que podem não ser imediatamente aparentes. Este conhecimento permite-lhe criar recursos mais abrangentes e precisos para os seus alunos, ajudando-os a desenvolver uma compreensão mais autêntica e diferenciada da língua-alvo.
Ao recolher e organizar as suas amostras, tenha em mente estes princípios lexicográficos básicos:
1. Frequência: Observe a frequência com que certas palavras ou frases aparecem nas suas amostras.
2. Contexto: Registe o contexto em que as palavras são utilizadas, uma vez que este pode afetar o significado.
3. Colocação: Preste atenção às palavras que aparecem frequentemente juntas.
4. Registo: Observar o nível de formalidade de cada texto.
5. Campos semânticos: Agrupe as palavras relacionadas das suas amostras em categorias temáticas.
CONSIDERAÇÕES ÉTICAS
1. Direitos de autor: Certificar-se de que não está a violar as leis de direitos de autor. Utilizar materiais do domínio público ou de utilização justa para fins educativos.
2. Privacidade: Anonimize sempre as informações pessoais em amostras de texto.
3. Consentimento: Se recolher amostras de indivíduos (por exemplo, conversas no WhatsApp), obter autorização explícita.
Language: Portuguese
PREPARAÇÃO
Antes de começar a recolher amostras, considere o seguinte: (ou leia o guia Recolha de dados 1: Planeamento preliminar)
- Defina os seus objectivos: Em que nível linguístico, temas ou caraterísticas linguísticas se está a concentrar?
- Identifique as suas fontes: Planeie onde vai recolher amostras (por exemplo, bibliotecas, sítios Web, espaços públicos).
Pode preferir recolher as suas amostras casualmente e tirar algumas fotografias sempre que for conveniente. No entanto, recomendamos que mantenha um registo dos domínios que está a cobrir para manter o seu “mini-corpus” equilibrado e variado.
RECOLHA DE AMOSTRAS
Fontes digitais
- Sítios Web: Utilize a função de guardar do seu browser ou a ferramenta de captura de ecrã para capturar páginas Web.
- E-books: Se for permitido, copie as passagens relevantes ou guarde-as em PDF.
- Redes sociais: Captura de ecrã de conversas ou mensagens (certifique-se de que tem autorização se o conteúdo for privado).
- Jornais e revistas digitais: Guardar artigos como PDF ou utilizar a função “Imprimir em PDF”.
Fontes físicas
- Livros e material impresso: Utilize o seu scanner para digitalizar páginas relevantes.
- Ephemera (menus, bilhetes, folhetos): Digitalize ou fotografe estes objectos.
- Notas ou cartas escritas à mão: Digitalize-os para verificar a autenticidade das amostras de caligrafia.
Textos do mundo real
- Sinalização pública: Fotografar sinais, cartazes ou painéis publicitários.
- Menus: Pergunte aos restaurantes se pode guardar um menu para digitalizar ou tirar uma fotografia nítida.
- Embalagem do produto: Achatar a embalagem e digitalizar ou tirar fotografias nítidas do texto.
PROCESSAMENTO DE AMOSTRAS
- OCR: Converta texto baseado em imagens em texto editável utilizando software ou aplicações de OCR.
- Limpeza: Editar o resultado do OCR para corrigir quaisquer erros e formatar de forma consistente.
- Anonimização: Remover ou alterar quaisquer informações de identificação pessoal para proteger a privacidade.