finnic

Tverin kenttätyömatka 2018

Tavoitteet

Työvaiheet – minimimalli

Listaan alla sellaiset työvaiheet, jotka on mielestäni pakko tehdä ennen kenttätyömatkalle lähtöä. Mutta joka tapauksessa ne kuuluvat alla olevan laajemman esityksen yhteyteen, eikä niitä oikein pidä ajatella sen ulkopuolella.

Työvaiheet – laajempi esitys

Näitä vaiheita ei tehdä varsinaisesti toinen toisiaan seuraten, vaan osin päällekkäin. Esimerkiksi metadatan luonti tehdään jo hyvin varhain, ja eri vaiheita priorisoidaan sen mukaan, miten asiat kehittyvät. Tämä ei siis ole millään tavalla triviaali tehtävä, mutta toisaalta työvaiheet ovat melko samat kielen kuin kielen kanssa, ja jotain tällaista on jo tehty komin kanssa monta kertaa.

Suluilla on merkitty sellaiset työvaiheet, jotka menevät sen verran monimutkaisiksi, että niiden järjestely vaatisi oikeastaan omaa projektiaan/rahoitustaan. Tuo jää varmasti tämän ulkopuolelle, mutta käytännössä pidemmin aikavälin tavoitteena on oltava, että jossain vaiheessa nauhat ja litteroinnit tulisivat yhteen.

  1. Nauhoitusten paikallistaminen (Kotuksen lista)
    • Selvitys siitä, mitkä on digitoitu
    • Arviointi siitä, mitä kaikkea digitoidaan
    • Aineistopyyntö Kotukseen
    • Nauhojen annotointi sen perusteella, missä mikäkin litteroitu osa alkaa ja loppuu
  2. Kielennäytteiden paikallistaminen
    • Kielennäytteiden tekstintunnistus
    • Tekstintunnistuksen korjaaminen, priorisointi jollain perusteella
  3. Toisiaan vastaavien nauhoitusten ja kielennäytteiden löytäminen
  4. (Nauhoitteiden segmentointi)
  5. (Nauhoitteiden ja tekstien alignointi)
  6. Metadatan luominen
    • Nauhoitusaika
    • Nauhoituspaikka
    • Nauhoittaja
    • Puhuja(t)
    • Puhujan asuinpaikka
    • Puhujan syntymäpaikka
    • Puhujan syntymäaika
    • Puhujan sukupuoli