Area of Interest: Documentation and text collection
Skills:
Competences:
Age Bracket: Adult Education
Time Commitment: 30 – 60 minutes
Affordability: €
Materials:
Rokasgrāmata par tekstu paraugu vākšanu ir izstrādāta, lai palīdzētu jums apkopot daudzveidīgu autentisku tekstu materiālu klāstu, kas varētu uzlabot jūsu mācīšanas procesu. Sistemātiski vācot tekstu paraugus, jūs izveidosiet vērtīgu resursu vārdu krājuma apguvei, lasīšanas izpratnei un kultūras izpratnei. Šajā rokasgrāmatā uzsvars likts uz pieeju, kas vērsta uz digitalizāciju, vienlaikus iekļaujot arī leksikogrāfijas pamatprincipus, lai palīdzētu jums izveidot nelielu, bet labi izstrādātu tekstu krājumu, kas bagātinās jūsu stundas.
NEPIECIEŠAMAIS APRĪKOJUMS
Lai izmantotu šo digitālo pieeju, jums būs nepieciešams:
1. klēpjdators vai galddators
2. Skeneris (vēlams, portatīvs, lai skenētu, atrodoties ceļā).
3. Viedtālrunis (ātrai uztveršanai un OCR lietotnēm)
4. Ārējais cietais disks vai mākoņkrātuves abonements
5. Teksta apstrādes programmatūra (piemēram, Microsoft Word, Google Docs)
6. Izklājlapu programmatūra (piemēram, Microsoft Excel, Google Sheets)
Neobligāti, bet noderīgi:
1. OCR (optiskās rakstzīmju atpazīšanas) programmatūra vai lietotne.
2. Digitālā kamera (ja ar viedtālruņa kameru nepietiek).
IETEIKTĀS OCR APLIS (uzskaitītas no bezmaksas līdz visdārgākajām)
1. Google Drive (iOS/Android): Bezmaksas ar Google kontu.
Priekšrocības: Nevainojama integrācija ar Google Docs, automātiska PDF un attēlu OCR.
Mīnusi: OCR precizitāte var būt nekonsekventa.
2. Microsoft Office Lens (iOS/Android): Bezmaksas.
Priekšrocības: Labi integrējas ar Microsoft Office, labi noder dokumentu skenēšanai.
Mīnusi: OCR funkcijas ir ierobežotākas salīdzinājumā ar specializētajām lietotnēm.
3. Tesseract (atvērtā koda programmatūra): Bezmaksas.
Priekšrocības: Ļoti pielāgojama, atbalsta daudzas valodas.
Mīnusi: Nepieciešamas tehniskas zināšanas, lai to iestatītu un efektīvi izmantotu.
4. Adobe Scan (iOS/Android): Bezmaksas ar pamata funkcijām, abonements uzlabotām funkcijām.
Priekšrocības: Vienkārša lietošana, laba precizitāte, automātiska uzglabāšana mākonī.
Mīnusi: Dažām funkcijām nepieciešama abonēšana.
5. ABBYY FineReader (darbvirsmas/obilais): Maksas ar bezmaksas izmēģinājuma versiju, visdārgākais variants.
Priekšrocības: Augsta precizitāte, uzlabotas OCR funkcijas, atbalsta daudzas valodas.
Mīnusi: Dārga vienkāršiem lietotājiem.
Mēs iesakām izvēlēties OCR risinājumu, ņemot vērā jūsu konkrētās vajadzības, budžetu un tehnisko ērtību līmeni. Pirms ieguldīt līdzekļus abonementos, sāciet ar bezmaksas iespējām un pārbaudiet, kuras no tām vislabāk atbilst jūsu valodai.
Expert recommendations:
VĒRĀ ŅEMAMIE LEKSIKOGRĀFIJAS PRINCIPI
Leksikogrāfijas pamatprincipu izpratne ir ļoti svarīga, vācot tekstu paraugus valodas mācīšanai. Šie principi palīdz efektīvāk analizēt un sakārtot paraugus, tādējādi iegūstot labākus mācību materiālus un dziļāku izpratni par valodas lietojumu. Piemērojot šos jēdzienus, jūs varat noteikt vārdu lietojuma modeļus, saprast, kā konteksts ietekmē nozīmi, un atpazīt valodas nianses, kas var nebūt uzreiz redzamas. Šīs zināšanas ļauj jums veidot pilnīgākus un precīzākus resursus saviem skolēniem, palīdzot viņiem attīstīt autentiskāku un niansētāku izpratni par mērķvalodu.
Vācot un sakārtojot paraugus, paturiet prātā šos leksikogrāfijas pamatprincipus:
1. Biežums: Ievērojiet, cik bieži jūsu paraugos parādās konkrēti vārdi vai frāzes.
2. Konteksts: Pierakstiet kontekstu, kādā vārdi tiek lietoti, jo tas var ietekmēt nozīmi.
3. Kolokācijas: Pievērsiet uzmanību vārdiem, kas bieži parādās kopā.
4. Reģistrs (valodas stils): Pievērsiet uzmanību, cik formāls ir katrs teksts.
5. Semantiskie lauki: Grupējiet tematiskās kategorijās saistītos vārdus no paraugiem.
ĒTISKIE APSVĒRUMI
1. Autortiesības: Pārliecinieties, ka nepārkāpjat autortiesību likumus. Izglītības nolūkos izmantojiet materiālus, kas ir publiski pieejami vai godprātīgi izmantojami.
2. Privātums: Teksta paraugos vienmēr anonimizējiet personisko informāciju.
3. Piekrišana: Ja paraugus vāc no privātpersonām (piemēram, WhatsApp sarunas), saņemiet skaidru atļauju.
Language: Latvian
SAGATAVOŠANĀS
Pirms sākat vākt paraugus, ņemiet vērā šādus aspektus: (vai izlasiet rokasgrāmatu Datu vākšana 1: sākotnējā plānošana)
- Definējiet savus mērķus: Uz kuru valodas līmeni, tēmām vai valodas iezīmēm jūs koncentrējaties?
- Norādiet savus avotus: Plānojiet, kur vāksiet paraugus (piemēram, bibliotēkās, tīmekļa vietnēs, publiskās vietās).
Iespējams, jūs vēlaties savākt paraugus nejauši un fotografēt, kad vien tas ir ērti. Tomēr mēs iesakām sekot līdzi jomām, kuras aptverat, lai jūsu “mini korpuss” būtu līdzsvarots un daudzveidīgs.
PARAUGU VĀKŠANA
Digitālie avoti
- Tīmekļa vietnes: Izmantojiet pārlūkprogrammas saglabāšanas funkciju vai ekrānšāviņu rīku, lai uzņemtu tīmekļa lapas.
- E-grāmatas: Ja atļauts, kopējiet attiecīgos fragmentus vai saglabājiet kā PDF failus.
- Sociālie plašsaziņas līdzekļi: Veiciet ekrānšāviņus ar sarunām vai ziņām (pārliecinieties, ka jums ir atļauja, ja saturs ir privāts).
- Digitālie laikraksti un žurnāli: Saglabājiet rakstus PDF formātā vai izmantojiet funkciju “Drukāt PDF formātā”.
Fiziskie avoti
- Grāmatas un drukātie plašsaziņas līdzekļi: Izmantojiet skeneri, lai digitalizētu attiecīgās lapas.
- Edienkartes, biļetes, skrejlapas, plakāti: Skenējiet vai fotografējiet šos priekšmetus.
- Ar roku rakstītas piezīmes vai vēstules: Skenējiet tos, lai noteiktu rokraksta paraugu autentiskumu.
Reālās pasaules teksti
- Publiskās norādes: Fotogrāfijas (zīmes, plakāti vai reklāmas stendi).
- Ēdienkartes: Pajautājiet restorāniem, vai varat paturēt ēdienkarti skenēšanai vai uzņemt skaidru fotoattēlu.
- Produkta iepakojums: Iepakojumu saplaciniet un skenējiet vai nofotografējiet skaidru tekstu.
PARAUGU APSTRĀDE
- OCR: Konvertējiet attēlu tekstu rediģējamā tekstā, izmantojot OCR programmatūru vai lietotnes.
- Tīrīšana: rediģējiet OCR rezultātu, lai izlabotu visas kļūdas un konsekventi formatētu.
- Anonimizācija: Anonimizēšana: noņemiet vai mainiet jebkādu personisko identifikācijas informāciju, lai aizsargātu privātumu.