• Introduction
  • Lattice
  • IKDP
  • Information

Introduction

This is a HTML display into the trees annotated within upcoming Universal Dependencies Komi-Zyrian corpus. Actually there are too corpus, one based on written Komi materials that are in Public Domain, and another that is based on spoken language data from IKDP project. The work has been coordinated by Niko Partanen in LATTICE laboratory, but there have been several participants. The work connects closely to multilingual dependency parsing approach currently being developed in LATTICE. In case there are comments of questions, please contact Niko Partanen (nikotapiopartanen@gmail.com).

The project goals and participants are better described in project’s README.

Lattice

# sent_id = belyx-011.000
# text_rus = Рано утром спустился к Вычегде поудить.

# sent_id = belyx-011.001
# text_rus = Но рыба почему-то не ела.

# sent_id = belyx-011.002
# text_rus = Хотя день был очень хорошим.

# sent_id = belyx-011.003
# text_rus = Солнце пекло, ничего не жалея.

# sent_id = belyx-011.004
# text_rus = В небе не было видно ни облачка.

# sent_id = belyx-011.005
# text_rus = Жаркий воздух отнимал силы.

# sent_id = belyx-011.006
# text_rus = Совсем изнемог.

# sent_id = belyx-011.007
# text_rus = Даже прохлада, доносящаяся с реки, не помогала.

# sent_id = belyx-011.008
# text_rus = Пусть хотя бы какой-то ветерок донесётся, подумал про себя.

# sent_id = belyx-011.009
# text_rus = К середине дня откуда-то с шуршанием донёсся небольшой ветерок.

# sent_id = belyx-011.010
# text_rus = И дышать стало легче.

# sent_id = belyx-011.011
# text_rus = Не заметил, как над головой один за другим стали появляться небольшие облака.

# sent_id = belyx-011.012
# text_rus = Сначала похожие на маленьких овечек.

# sent_id = belyx-011.013
# text_rus = А затем стали побольше.

# sent_id = belyx-011.014
# text_rus = На другом берегу, над сосновым бором острова Присада, вдруг появилось облако, похожее на одеяло, и перед глазами стало расти.

# sent_id = belyx-011.015
# text_rus = Издалека послышались звуки грома.

# sent_id = belyx-011.016
# text_rus = Вода стихла.

# sent_id = belyx-011.017
# text_rus = Рыба совсем присмирела.

# sent_id = belyx-011.018
# text_rus = Даже хвост не показывала.

# sent_id = belyx-011.019
# text_rus = Но зря, оказалось, запереживалось.

# sent_id = belyx-011.020
# text_rus = Туча после того, как немного попугала, ушла в сторону.

# sent_id = belyx-011.021
# text_rus = А сам думаю, что если небеса грозят громом и дождём, просто так всё не закончится.

# sent_id = belyx-011.022
# text_rus = Когда-то всё равно пройдёт гром и дождь.

# sent_id = belyx-011.023
# text_rus = Сидеть у берега было попусту.

# sent_id = belyx-011.024
# text_rus = По-тихоньку собрал рыболовные снасти и пошёл в сторону дома.

# sent_id = belyx-011.025
# text_rus = Незаметно с северо-востока показалась ещё туча и быстро стала направляться к середине неба.

# sent_id = belyx-011.026
# text_rus = Постепенно она становилась шире и синела.

# sent_id = belyx-011.027
# text_rus = Смотря на неё, даже грустно становилось на сердце.

# sent_id = belyx-011.028
# text_rus = Дойду ли до начала дождя до дома?

# sent_id = belyx-011.029
# text_rus = Ведь пройти надо немало.

# sent_id = belyx-011.030
# text_rus = Ускорил шаги.

# sent_id = belyx-011.031
# text_rus = Но туча шла ещё быстрее.

# sent_id = belyx-011.032
# text_rus = Уже начались гром и молнии.

# sent_id = belyx-011.033
# text_rus = А потом сверху пошли большие капли дождя.

# sent_id = belyx-011.034
# text_rus = До этого успел дойти только к осиновой роще.

# sent_id = belyx-011.035
# text_rus = От дождя прятаться было уже бесполезно.

# sent_id = belyx-011.036
# text_rus = Думаю, пусть намокну.

# sent_id = belyx-011.037
# text_rus = В дождь дойду до дома.

# sent_id = belyx-011.038
# text_rus = Уже не стал сильно торопиться.

# sent_id = belyx-011.039
# text_rus = Вдруг с северо-востока опять пришёл порыв ветра, который чуть не сбил с ног.

# sent_id = belyx-011.040
# text_rus = Даже дыхания не хватало, так сильно ветер перехватывал горло.

# sent_id = belyx-011.041
# text_rus = Вместе с порывом ветра воздух становился серым.

# sent_id = belyx-011.042
# text_rus = Эта серость очень быстро приблизилась ко мне.

# sent_id = belyx-011.043
# text_rus = В последний момент в лицо ударили льдинки.

# sent_id = belyx-011.044
# text_rus = Это, оказывается, град.

# sent_id = belyx-011.045
# text_rus = Шагать дальше я уже не мог.

# sent_id = belyx-011.046
# text_rus = Ветер и град сбили с ног.

# sent_id = belyx-011.047
# text_rus = Дорога из-за дождя стала похожа на небольшую речку.

# sent_id = belyx-011.048
# text_rus = Без конца гремел гром и сверкали молнии.

# sent_id = belyx-011.049
# text_rus = Молнии словно совсем рядом разрывали воздух.

# sent_id = belyx-011.050
# text_rus = Делать нечего.

# sent_id = belyx-011.051
# text_rus = Зашёл в осиновую рощу и встал на небольшую поляну.

# sent_id = belyx-011.052
# text_rus = При грозе под деревом стоять нельзя.

# sent_id = belyx-011.053
# text_rus = До сюда порывы ветра не так сильно доходили.

# sent_id = belyx-011.054
# text_rus = Но молния без остановок сверкала перед глазами.

# sent_id = belyx-011.055
# text_rus = Про себя вспомнил уже, может быть, всех Богов, знакомых и незнакомых, чтобы, если они где-то есть, не оставили человека в дороге.

# sent_id = belyx-011.056
# text_rus = И вот град по-тихоньку отошёл в сторону.

# sent_id = belyx-011.057
# text_rus = Дождь шёл медленее.

# sent_id = belyx-011.058
# text_rus = Гремело как раньше.

# sent_id = belyx-011.059
# text_rus = Но уже не так сильно.

# sent_id = belyx-011.060
# text_rus = Затем и гром отошёл.

# sent_id = belyx-011.061
# text_rus = Не торопясь направился в сторону дома.

# sent_id = belyx-011.062
# text_rus = Одежда была насквозь мокрой.

# sent_id = belyx-011.063
# text_rus = Еле мог шагать по грязной дороге.

# sent_id = belyx-011.064
# text_rus = Роса булькала в сапоге.

# sent_id = belyx-011.065
# text_rus = Затем на пригорке появились сельские дома.

# sent_id = belyx-011.066
# text_rus = Шагать быстрее сил уже не было.

# sent_id = belyx-011.067
# text_rus = Мама встретила, выйдя на крыльцо.

# sent_id = belyx-011.068
# text_rus = — Почему не смог раньше прийти, — с жалостью сказала мама.

# sent_id = belyx-011.069
# text_rus = — Не знаешь, что будет такой дождь с грозой, — брякнул под нос только.

# sent_id = belyx-011.070
# text_rus = После того, как зашёл домой, торопясь снял насквозь промокшую одежду и обувь, и быстро залез на печку погреться, прийти в себя от этого страха.

# sent_id = belyx-011.071
# text_rus = Град много проблем принёс тогда сельчанам.

# sent_id = belyx-011.072
# text_rus = Сломал листья картофеля и овощей, повалил заборы.

# sent_id = belyx-011.073
# text_rus = А у кого-то даже снёс крышу.

# sent_id = belyx-011.074
# text_rus = И удивился ещё, что полоса града была очень узкой.

# sent_id = belyx-011.075
# text_rus = В близлежащих селах и деревнях о нём даже не знали.

# sent_id = kpv_four_battles.001
# text_rus = Все ребята нашей страны знают Климента Ефремовича Ворошилова, маршала Советского Союза, Народного Комиссара Обороны.

# sent_id = kpv_four_battles.002
# text_rus = Знают его и любят.

# sent_id = kpv_four_battles.003
# text_rus = И, конечно, хотят знать о нем решительно все.

# sent_id = kpv_four_battles.004
# text_rus = Как жил он в детстве?

# sent_id = kpv_four_battles.005
# text_rus = Как он стал большевиком?

# sent_id = kpv_four_battles.006
# text_rus = Как стал командиром Красной армии?

# sent_id = kpv_four_battles.007
# text_rus = Как вел в бой против белых наши армии?

# sent_id = kpv_four_battles.008
# text_rus = Как побеждал врагов?

# sent_id = kpv_four_battles.009
# text_rus = И за что получил те ордена, которые горят у него на груди, когда в час первомайского парада выезжает он на своем коне из-под старых ворот Спасской башни Московского Кремля?

# sent_id = kpv_four_battles.010
# text_rus = Чтобы рассказать хотя бы о самом главном из того, что случилось в замечательной жизни товарища Ворошилова, понадобится не одна толстая книга.

# sent_id = kpv_four_battles.011
# text_rus = Жизнь большого человека не укладывается в короткий рассказ.

# sent_id = kpv_four_battles.012
# text_rus = В этой же книжке мы расскажем только о четырех самых обыкновенных боевых случаях, которые когда-то, в далекие дни гражданской войны, произошли с Климентом Ефремовичем на фронте.

# sent_id = kpv_four_battles.014
# text_rus = Днем и ночью шли бои, днем и ночью пробивались красноармейские части на восток, к Волге, к городу Царицыну (теперь он называется Сталинградом).

# sent_id = kpv_four_battles.015
# text_rus = Путь был трудный, белые наседали со всех сторон.

# sent_id = kpv_four_battles.016
# text_rus = Отовсюду слышалась трескотня винтовок, стрельба орудий, грохот взрывов…

# sent_id = kpv_four_battles.017
# text_rus = И вдруг, когда вдали перед собой наши войска увидели небольшую казачью деревню, станицу Пятиизбенную, всё вокруг неожиданно смолкло.

# sent_id = kpv_four_battles.018
# text_rus = Ни криков, ни выстрелов.

# sent_id = kpv_four_battles.019
# text_rus = Враг точно бесследно провалился куда-то.

# sent_id = kpv_four_battles.020
# text_rus = Куда он делся?

# sent_id = kpv_four_battles.021
# text_rus = Откуда налетит вновь?

# sent_id = kpv_four_battles.022
# text_rus = Неизвестно!

# sent_id = kpv_four_battles.023
# text_rus = На войне такая непонятность хуже самого жестокого боя.

# sent_id = kpv_four_battles.024
# text_rus = Неприятель страшен, если не знаешь в точности, где он и что он делает.

# sent_id = kpv_four_battles.025
# text_rus = Надо было сейчас же итти на смелую разведку, ворваться в темневший вдали поселок, узнать, не прячется ли там враг.

# sent_id = kpv_four_battles.026
# text_rus = Это было делом очень опасным, но необходимым.

# sent_id = kpv_four_battles.027
# text_rus = Решили послать на разведку броневичок — боевой бронированный автомобиль с пулеметом.

# sent_id = kpv_four_battles.028
# text_rus = Броневик был старый и потрепанный, но ничего другого под рукой не было.

# sent_id = kpv_four_battles.029
# text_rus = Перед самым выходом в поле стало известно, что командиром броневика поедет командующий армией Климент Ефремович Ворошилов.

# sent_id = kpv_four_battles.030
# text_rus = Очевидно разведка в тот день была таким важным делом, что Ворошилов решил ехать на нее лично. Сам.

# sent_id = kpv_four_battles.031
# text_rus = Броневик быстро пробежал широкое пустое поле, отделявшее красных бойцов от деревушки, и на полном ходу ворвался в поселок.

# sent_id = kpv_four_battles.032
# text_rus = Главная улица его была пуста.

# sent_id = kpv_four_battles.033
# text_rus = Но враги могли спрятаться в боковых переулках.

# sent_id = kpv_four_battles.034
# text_rus = Не замедляя хода, водитель направил машину в один из таких переулочков, изгибавшийся крутым коленом.

# sent_id = kpv_four_battles.035
# text_rus = Однако едва машина долетела до поворота, как водитель изо всех сил схватился за тормоз.

# sent_id = kpv_four_battles.036
# text_rus = Он сразу понял, что случилась страшная вещь.

# sent_id = kpv_four_battles.037
# text_rus = Переулок кончался тупиком.

# sent_id = kpv_four_battles.038
# text_rus = Второго выхода из него не было.

# sent_id = kpv_four_battles.039
# text_rus = Там, в конце переулка, у деревянных заборов были привязаны оседланные казачьи лошади.

# sent_id = kpv_four_battles.040
# text_rus = А из всех дверей, из ворот, из калиток уже выбегали на шум мотора вооруженные люди.

# sent_id = kpv_four_battles.041
# text_rus = Казаки!

# sent_id = kpv_four_battles.042
# text_rus = Белые!

# sent_id = kpv_four_battles.043
# text_rus = Водитель остановил машину.

# sent_id = kpv_four_battles.044
# text_rus = Лицо его стало белым, как мел.

# sent_id = kpv_four_battles.045
# text_rus = — Что ты делаешь?

# sent_id = kpv_four_battles.046
# text_rus = Почему затормозил?

# sent_id = kpv_four_battles.047
# text_rus = — крикнул Ворошилов.

# sent_id = kpv_four_battles.048
# text_rus = — Узко!

# sent_id = kpv_four_battles.049
# text_rus = С ходу не развернешься, товарищ командир!

# sent_id = kpv_four_battles.050
# text_rus = Он не успел еще выговорить это, как казаки с ревом кинулись к машине.

# sent_id = kpv_four_battles.051
# text_rus = И сейчас же всё внутри броневика загрохотало, заколотилось и запрыгало: это заговорил единственный пулемет красных.

# sent_id = kpv_four_battles.052
# text_rus = — Ага!

# sent_id = kpv_four_battles.053
# text_rus = Не понравилось?

# sent_id = kpv_four_battles.054
# text_rus = Залегли под пулями, бандиты?

# sent_id = kpv_four_battles.055
# text_rus = Водитель, закусив губу, рванул рычаг заднего хода.

# sent_id = kpv_four_battles.056
# text_rus = — Ох, товарищ командир, беда!

# sent_id = kpv_four_battles.057
# text_rus = Задний ход испортился…

# sent_id = kpv_four_battles.058
# text_rus = Заело что-то.

# sent_id = kpv_four_battles.059
# text_rus = Не выбраться нам…

# sent_id = kpv_four_battles.060
# text_rus = Казаки сразу же поняли, что броневичок застрял.

# sent_id = kpv_four_battles.061
# text_rus = — Что?

# sent_id = kpv_four_battles.062
# text_rus = Попались, черти красные?..

# sent_id = kpv_four_battles.063
# text_rus = Ну, сейчас мы вас!

# sent_id = kpv_four_battles.064
# text_rus = И вот они уже кидаются в канавы, ползут по траве, ста-раются подобраться как можно ближе.

# sent_id = kpv_four_battles.065
# text_rus = Их пули бьют по броневику так, что у людей в машине от грохота чуть не лопаются перепонки в ушах.

# sent_id = kpv_four_battles.066
# text_rus = Пули рассыпаются на множество мелких горячих брызг свинца и стали.

# sent_id = kpv_four_battles.067
# text_rus = Эти брызги врываются в узкие щели боевых окошек, ранят руки, лицо, прожигают насквозь одежду…

# sent_id = kpv_four_battles.068
# text_rus = Водитель машины, еще молодой парнишка, совсем растерялся.

# sent_id = kpv_four_battles.069
# text_rus = Что делать?

# sent_id = kpv_four_battles.070
# text_rus = Товарищ командир?

# sent_id = kpv_four_battles.071
# text_rus = Как быть-то?

# sent_id = kpv_four_battles.072
# text_rus = Пропали-мы, — бормотал он.

# sent_id = kpv_four_battles.073
# text_rus = Твердая рука Ворошилова легла ему на плечо.

# sent_id = new_1
# text_rus =

# sent_id = new_2
# text_rus =

# sent_id = new_3
# text_rus =

# sent_id = new_4
# text_rus =

# sent_id = new_5
# text_rus =

# sent_id = new_6
# text_rus =

# sent_id = new_7
# text_rus =

# sent_id = new_8
# text_rus =

IKDP

# sent_id = missing_id_1
# text_rus =

# sent_id = missing_id_2
# text_rus =

# sent_id = missing_id_3
# text_rus =

# sent_id = missing_id_4
# text_rus =

# sent_id = missing_id_5
# text_rus =

# sent_id = missing_id_6
# text_rus =

# sent_id = missing_id_7
# text_rus =

# sent_id = missing_id_8
# text_rus =

# sent_id = missing_id_9
# text_rus =

# sent_id = missing_id_10
# text_rus =

# sent_id = missing_id_11
# text_rus =

# sent_id = missing_id_12
# text_rus =

# sent_id = missing_id_13
# text_rus =

# sent_id = missing_id_14
# text_rus =

# sent_id = missing_id_15
# text_rus =

# sent_id = missing_id_16
# text_rus =

# sent_id = missing_id_17
# text_rus =

# sent_id = missing_id_18
# text_rus =

# sent_id = missing_id_19
# text_rus = Я родилась одиннадцатого мая в тысяча девятьсот шестьдесят втором году.

# sent_id = missing_id_20
# text_rus = Родилась в Ляпине, Ляпин - это старинное название, а сейчас на современном языке деревню называют Саранпауль, Березовский район в Ханты-Мансийском автономном округе.

# sent_id = missing_id_21
# text_rus = Нас в семье шестеро.

# sent_id = missing_id_22
# text_rus = Значит, четыре сестры и два брата.

# sent_id = missing_id_23
# text_rus = Мы, я родилась, мои родители, мой отец всю жизнь работал в тундре.

# sent_id = missing_id_24
# text_rus = Затем, значит, он был на войне очень молодым, ему было только семнадцать, восемнадцать лет.

# sent_id = missing_id_25
# text_rus = Надо было идти в армию, значит, пришла повестка на сорок первый год, а отец двадцать третьего года рождения, значит, и война началась (букв. застала), и мой отец пошел на войну.

# sent_id = missing_id_26
# text_rus = Значит, в Омском военном училище, не военное училище, а курсы, трехмесячную подгодтовку прошел, и воевал он на Ленинградском фронте.

# sent_id = missing_id_27
# text_rus = Я родилась во время начала каслания.

# sent_id = missing_id_28
# text_rus = Когда наши родители начали каслать, ну стадо у нас (было) в колхозе "Красный Октябрь", да?

# sent_id = missing_id_29
# text_rus = Вторая оленеводческая бригада, если сказать, вторая бригада, да?

# sent_id = missing_id_30
# text_rus = И это, у нас всегда каслали за Урал.

# sent_id = missing_id_31
# text_rus = И сейчас тоже начали каслать.

# sent_id = missing_id_32
# text_rus = Ну, мама как раз беременная была, думают, может, начнем каслать и ничего, всё будет хорошо.

# sent_id = missing_id_33
# text_rus = Ну, только начали каслать, и пурга началась.

# sent_id = missing_id_34
# text_rus = Запуржило, и они обратно вернулись на место чума, возвратились на место старого чума.

# sent_id = missing_id_35
# text_rus = И тогда и я именно там и родилась.

# sent_id = missing_id_36
# text_rus = Вот и говорю, ну, кто-то ска-, вот когда-то брат Николай сказал было: патриотка.

# sent_id = missing_id_37
# text_rus = На своей, это, на своей земле хотела родиться, не хотела, не хотела там, за Уралом родиться.

# sent_id = missing_id_38
# text_rus = Так что, в никакие иностранные места не езжу.

# sent_id = missing_id_39
# text_rus = Только езжу за Урал, потому что второй день, да, мой уже там начался.

# sent_id = missing_id_40
# text_rus = Ну, я проснулась на своем месте, а на следующий день мы уже, не на второй день, в тот же день вот, уже там была.

# sent_id = missing_id_41
# text_rus = Это на Уралом, так что, мне места возле Салехарда тоже как родная родина.

# sent_id = missing_id_42
# text_rus = Ну, какая старая бабушка там будет, она и будет (повивальной бабкой).

# sent_id = missing_id_43
# text_rus = Моя мама тоже такой повивальной бабкой была: она ведь очень много это, детей взяла, приняла.

# sent_id = missing_id_44
# text_rus = Пока не стала плохой, ну, пока, не то что плохой.

# sent_id = missing_id_45
# text_rus = Пока не стала мочь, пока могла.

# sent_id = missing_id_46
# text_rus = Принимала там, брала, некоторые русские да что.

# sent_id = missing_id_47
# text_rus = И она сама ходила, это, к женщинам или к ней приводили, чтобы она приняла ребенка?

# sent_id = missing_id_48
# text_rus = Ну, это ведь няпойный чум, да, это был походный чум, только-только поставить и завтра побежать, да.

# sent_id = kpv_izva20140330-1-b-097
# text_rus =

# sent_id = kpv_izva20140330-1-b-176
# text_rus =

# sent_id = kpv_izva20140329-1-b-541
# text_rus =

# sent_id = kpv_izva20140325-2-a-094
# text_rus =

# sent_id = kpv_izva20140330-1-b-336
# text_rus =

# sent_id = missing_id_49
# text_rus =

# sent_id = missing_id_50
# text_rus =

# sent_id = missing_id_51
# text_rus =

# sent_id = kpv_izva20140324-5dom_tradici-c.190
# text_rus =

# sent_id = kpv_izva20140329-1-b-438
# text_rus =

# sent_id = kpv_izva20150403-2-b.014
# text_rus =

# sent_id = kpv_izva20150403-2-b.021
# text_rus =

# sent_id = kpv_izva20150403-2-b.062
# text_rus =

# sent_id = kpv_izva20150403-2-b.114
# text_rus =

# sent_id = kpv_vym19570000-292_1a-Vym-1-43
# text_rus =

# sent_id = missing_id_52
# text_rus =

# sent_id = kpv_vym19570000-292_1a-Vym-1-06
# text_rus =

# sent_id = kpv_vym19570000-292_1a-Vym-1-11
# text_rus =

# sent_id = kpv_vym19570000-292_1a-Vym-1-25+kpv_vym19570000-292_1a-Vym-1-26
# text_rus =

# sent_id = kpv_izva19580000-083
# text_rus =

# sent_id = kpv_izva20140404IgusevJA-b-342
# text_rus =

# sent_id = kpv_izva20140324-1-b-541
# text_rus =

# sent_id = kpv_izva19580000-145
# text_rus =

# sent_id = kpv_izva20150407-4-a.0219
# text_rus =

# sent_id = kpv_izva20140325-2-a-279
# text_rus =

# sent_id = kpv_izva20150403-3-b.0182
# text_rus =

# sent_id = kpv_izva20150403-3-b.1311
# text_rus =

# sent_id = kpv_izva20150407-1-b.125
# text_rus =

# sent_id = kpv_izva20150407-4-a.1108
# text_rus =

# sent_id = kpv_izva20140327-3-b-099
# text_rus =

Information

This section contains information about different things.

The plot below shows the ratios of xpostags. This is particularly useful for checking that there are no entirely incorrect values there. This could also be checked easily with a controlled vocabulary.

This shows the ratios of different dependency relations. The color scheme could be improved, and the display could be split by relation types, for example.

Most common adverbs:

lemma n
нин 15
зэв 13
пыр 6
весиг 5
кыдзи 5
ӧдйӧ 5
ӧні 5
сэсся 5
водз 4
дзик 4

Most common prepositions:

lemma n
у 5
в 4
для 2
до 2
с 2
без 1
на 1
от 1
по 1
через 1

Most common postpositions:

lemma n
вылын 14
бӧр 5
йылысь 5
выв 4
вылӧ 4
весьт 3
водз 3
дор 3
вӧсна 2
кодь 2
lemma n
ас 8
ичӧтик 5
лёк 4
ыджыд 4
боевӧй 3
важ 3
неыджыд 3
сэтшӧм 3
татшӧм 3
векньыдик 2
lemma n
от 2
тай 2
эськӧ 2
выйым 1
вымым 1
кӧть 1
медся 1
мися 1
пӧ 1
самӧй 1
со 1
так 1
такны 1
тоже 1
чё 1
чё-то 1
что 1
эське 1

Things to add:

  • List of lemmas that have multiple pos-tags
    • Signals that there are mistakes or that there is something that needs attention when tagging
  • Something else? I have to think about this.
BESbswyBESbswyBESbswyBESbswy