OWL+

Ownership and Leadership: Pathway for (Endangered) Languages’ Use in School

Datainnsamling 2: Tekstprøver


Area of Interest: Documentation and text collection

Skills:

Competences:

Age Bracket: Adult Education

Time Commitment: 30 – 60 minutes

Affordability:

Materials:

Veiledningen om innsamling av tekstprøver er utviklet for å hjelpe deg med å samle et variert utvalg av autentisk tekstmateriale for å forbedre undervisningen din. Ved å samle inn tekstprøver på en systematisk måte kan du skape en verdifull ressurs for ordforrådstilegnelse, leseforståelse og kulturforståelse. Denne veiledningen legger vekt på en digital tilnærming, samtidig som den tar utgangspunkt i grunnleggende leksikografiske prinsipper for å hjelpe deg med å bygge opp et lite, men godt avrundet tekstkorpus som kan berike undervisningen din.

UTSTYR SOM TRENGS
For denne digitale tilnærmingen trenger du:
1. Bærbar eller stasjonær datamaskin
2. Skanner (helst bærbar for skanning på farten)
3. Smarttelefon (for raske opptak og OCR-apper)
4. Ekstern harddisk eller abonnement på skylagring
5. Tekstbehandlingsprogramvare (f.eks. Microsoft Word, Google Docs)
6. Programvare for regneark (f.eks. Microsoft Excel, Google Sheets)

Valgfritt, men nyttig:
1. Programvare eller app for OCR (Optical Character Recognition).
2. Digitalkamera (hvis kameraet på smarttelefonen din ikke er tilstrekkelig).

ANBEFALTE OCR APPS (listet opp fra gratis til dyrest)
1. Google Drive (iOS/Android): Gratis med Google-konto.
Fordeler: Sømløs integrering med Google Dokumenter, automatisk OCR for PDF-filer og bilder.
Ulemper: OCR-nøyaktigheten kan være inkonsekvent.

2. Microsoft Office Lens (iOS/Android): Gratis.
Fordeler: Integreres godt med Microsoft Office, bra for dokumentskanning.
Ulemper: OCR-funksjonene er mer begrenset sammenlignet med spesialiserte apper.

3. Tesseract (åpen kildekode): Gratis.
Fordeler: Svært tilpasningsdyktig, støtter mange språk.
Ulemper: Krever teknisk kunnskap for å sette opp og bruke effektivt.

4. Adobe Scan (iOS/Android): Gratis med grunnleggende funksjoner, abonnement for avanserte funksjoner.
Fordeler: Enkel å bruke, god nøyaktighet, automatisk skylagring.
Ulemper: Noen funksjoner krever abonnement.

5. ABBYY FineReader (stasjonær/mobil): Betalt med gratis prøveversjon, det dyreste alternativet.
Fordeler: Høy nøyaktighet, avanserte OCR-funksjoner, støtter mange språk.
Ulemper: Dyrt for vanlige brukere.

Vi anbefaler at du velger en OCR-løsning basert på dine spesifikke behov, budsjett og tekniske ferdigheter. Begynn med gratisalternativene og se hvilke som fungerer best for språket ditt før du investerer i abonnementer.

Expert recommendations:

LEKSIKOGRAFISKE PRINSIPPER Å TA HENSYN TIL

Å forstå grunnleggende leksikografiske prinsipper er avgjørende når du samler inn tekstprøver til språkundervisning. Disse prinsippene hjelper deg med å analysere og organisere tekstene dine på en mer effektiv måte, noe som fører til bedre undervisningsmateriell og en dypere forståelse av språkbruk. Ved å bruke disse konseptene kan du identifisere mønstre i ordbruken, forstå hvordan konteksten påvirker betydningen, og gjenkjenne nyanser i språket som kanskje ikke er umiddelbart synlige. Med denne kunnskapen kan du lage mer omfattende og nøyaktige ressurser for elevene dine, og hjelpe dem til å utvikle en mer autentisk og nyansert forståelse av målspråket.

Når du samler inn og organiserer prøvene dine, må du huske på disse grunnleggende leksikografiske prinsippene:
1. Frekvens: Legg merke til hvor ofte visse ord eller fraser forekommer i prøvene dine.
2. Kontekst: Noter i hvilken sammenheng ordene brukes, ettersom dette kan påvirke betydningen.
3. Kollokasjon: Vær oppmerksom på ord som ofte forekommer sammen.
4. Register: Legg merke til formalitetsnivået i hver tekst.
5. Semantiske felt: Grupper beslektede ord fra tekstene i tematiske kategorier.

ETISKE BETRAKTNINGER
1. Opphavsrett: Sørg for at du ikke bryter opphavsrettslovene. Bruk materiale som er offentlig tilgjengelig eller som er godkjent for rimelig bruk til undervisningsformål.
2. Personvern: Anonymiser alltid personlig informasjon i tekstprøver.
3. Samtykke: Hvis du samler inn prøver fra enkeltpersoner (f.eks. WhatsApp-samtaler), må du innhente eksplisitt tillatelse.

Language: Norwegian

Translations:

Data Collection 2: Text SamplesDataverzameling 2: Tekstuele DataDatasamling 2: Tekstuele DataDatu vākšana 2: teksta paraugiRecolha de dados 2: Amostras de texto

FORBEREDELSER

Før du begynner å samle inn prøver, bør du tenke på følgende: (eller les veiledningen Datainnsamling 1: Foreløpig planlegging)

  1. Definer målene dine: Hvilket språknivå, hvilke temaer eller språklige trekk fokuserer du på?
  2. Identifiser kildene dine: Planlegg hvor du skal samle inn eksempler (f.eks. biblioteker, nettsteder, offentlige rom).

Du foretrekker kanskje å samle inn prøvene dine tilfeldig og ta noen bilder når det passer deg. Vi anbefaler imidlertid at du holder oversikt over hvilke domener du dekker, slik at “minikorpuset” ditt blir balansert og variert.

INNSAMLING AV PRØVER

Digitale kilder

  1. Nettsteder: Bruk nettleserens lagringsfunksjon eller skjermbildeverktøyet til å ta bilder av nettsider.
  2. E-bøker: Hvis det er tillatt, kan du kopiere relevante avsnitt eller lagre dem som PDF-filer.
  3. Sosiale medier: Ta skjermdump av samtaler eller innlegg (sørg for at du har tillatelse hvis innholdet er privat).
  4. Digitale aviser og magasiner: Lagre artikler som PDF-filer, eller bruk “Skriv ut til PDF”-funksjonen.

Fysiske kilder

  1. Bøker og trykte medier: Bruk skanneren til å digitalisere relevante sider.
  2. Ephemera (menyer, billetter, flygeblad): Skann eller fotografer disse gjenstandene.
  3. Håndskrevne notater eller brev: Skann disse for å se om håndskriften er autentisk.

Tekster fra den virkelige verden

  1. Offentlig skilting: Fotografering av skilt, plakater eller reklametavler.
  2. Menyer: Spør restaurantene om du kan beholde en meny som du kan skanne, eller ta et tydelig bilde.
  3. Produktemballasje: Flat ut emballasjen og skann den, eller ta tydelige bilder av teksten.

BEHANDLING AV PRØVER

  1. OCR: Konverter bildebasert tekst til redigerbar tekst ved hjelp av OCR-programvare eller -apper.
  2. Rydd opp: Rediger OCR-resultatet for å rette opp eventuelle feil og formatere det konsekvent.
  3. Anonymisering: Fjern eller endre all personlig identifiserende informasjon for å beskytte personvernet.