Tverin kenttätyömatka 2018
- Aika: Kesä 2018
- Paikka: Tver
- Järjestäjät: Niko Partanen, Janne Saarikivi jne.
Tavoitteet
- Karjalan tverin murteen aineiston kerääminen
- Vanhan jo olemassa olevan aineiston saaminen digitaaliseen tutkimuskäyttöön
- Diakronisen aineiston luominen
- Kielisosiologisen materiaalin tuottaminen
- Kielenvaihdon tutkimus
- Kielikontaktin ja paikallisen etnisen vuorovaikutuksen tutkimus
- Paikanninistön tutkimus
Työvaiheet – minimimalli
Listaan alla sellaiset työvaiheet, jotka on mielestäni pakko tehdä ennen kenttätyömatkalle lähtöä. Mutta joka tapauksessa ne kuuluvat alla olevan laajemman esityksen yhteyteen, eikä niitä oikein pidä ajatella sen ulkopuolella.
- Julkaisujen paikantaminen (Markus on tehnyt)
- Nauhoitusten paikantaminen (Nikolla on lista)
- Metadatan kerääminen näistä kahdesta
- Niko on tehnyt puoliksi, jonkun pitää tarkistaa ja täydentää (noin viikon työ)
- Kaikkien julkaistujen tekstien sivujen skannaus, jotta ne ovat kentällä mukana
- Monta sivua on yhteensä? Siitä voi arvioida paljonko aikaa skannaus vie.
Työvaiheet – laajempi esitys
Näitä vaiheita ei tehdä varsinaisesti toinen toisiaan seuraten, vaan osin päällekkäin. Esimerkiksi metadatan luonti tehdään jo hyvin varhain, ja eri vaiheita priorisoidaan sen mukaan, miten asiat kehittyvät. Tämä ei siis ole millään tavalla triviaali tehtävä, mutta toisaalta työvaiheet ovat melko samat kielen kuin kielen kanssa, ja jotain tällaista on jo tehty komin kanssa monta kertaa.
Suluilla on merkitty sellaiset työvaiheet, jotka menevät sen verran monimutkaisiksi, että niiden järjestely vaatisi oikeastaan omaa projektiaan/rahoitustaan. Tuo jää varmasti tämän ulkopuolelle, mutta käytännössä pidemmin aikavälin tavoitteena on oltava, että jossain vaiheessa nauhat ja litteroinnit tulisivat yhteen.
- Nauhoitusten paikallistaminen (Kotuksen lista)
- Selvitys siitä, mitkä on digitoitu
- Arviointi siitä, mitä kaikkea digitoidaan
- Aineistopyyntö Kotukseen
- Nauhojen annotointi sen perusteella, missä mikäkin litteroitu osa alkaa ja loppuu
- Kielennäytteiden paikallistaminen
- Kielennäytteiden tekstintunnistus
- Tekstintunnistuksen korjaaminen, priorisointi jollain perusteella
- Toisiaan vastaavien nauhoitusten ja kielennäytteiden löytäminen
- (Nauhoitteiden segmentointi)
- (Nauhoitteiden ja tekstien alignointi)
- Metadatan luominen
- Nauhoitusaika
- Nauhoituspaikka
- Nauhoittaja
- Puhuja(t)
- Puhujan asuinpaikka
- Puhujan syntymäpaikka
- Puhujan syntymäaika
- Puhujan sukupuoli