"вяхирь" meaning in All languages combined

See вяхирь on Wiktionary

Noun [Русский]

IPA: ˈvʲæxʲɪrʲ
Etymology: Происходит от ?? Forms: вя́хирь [nominative, singular], вя́хири [nominative, plural], вя́хиря [genitive, singular], вя́хирей [genitive, plural], вя́хирю [dative, singular], вя́хирям [dative, plural], вя́хиря [accusative, singular], вя́хирей [accusative, plural], вя́хирем [instrumental, singular], вя́хирями [instrumental, plural], вя́хире [prepositional, singular], вя́хирях [prepositional, plural]
  1. орнитол. крупный лесной голубь; витютень (Columba palumbus)
    Sense id: ru-вяхирь-ru-noun-tqa1vmyu Topics: ornithology
The following are not (yet) sense-disambiguated
Synonyms: витютень Hypernyms: голубь, птица Translations: alabaxta (Азербайджанский), cushat (Английский), ringdove (Английский), ring dove (Английский), ورشان (Арабский), torcaz (Арагонский), torcazo (Арагонский), հավփալ (Армянский), pagauso (Баскский), алатуба (Башкирский), вяхір (Белорусский), гривяк [masculine] (Болгарский), kudon (Бретонский), ysguthan (Валлийский), örvös galamb (Венгерский), pombo torcaz (Галисийский), pombo (Галисийский), когогӓды (Горномарийский), φάσσα (Греческий), ქედანი (Грузинский), ringdue (Датский), φάσσα [feminine] (Древнегреческий), palumbo (Идо), torcaza (Испанский), paloma torcaz (Испанский), colombaccio [masculine] (Итальянский), тхьэрыкъуэпщэху (Кабардино-черкесский), дыркеп (Казахский), tudó (Каталанский), gruchôłk (Кашубский), 斑尾林鸽 [simplified] (Китайский), 숲비둘기 (supbidulgi) (Корейский), palumbes (Латинский), lauku balodis (Латышский), keršulis (Литовский), Kohltaube (Немецкий), Ringeltaube (Немецкий), Waldtaube (Немецкий), houtduif (Нидерландский), Holtduuv (Нижнесаксонский), ringdue (Норвежский), palomba (Окситанский), biset (Пикардский), grzywacz (Польский), pombo-torcaz (Португальский), dielkoduvvá (Северносаамский), holtdüüw (Севернофризский), голуб гривнаш [Cyrillic] (Сербский), palummu (Сицилийский), hrivnák (Словацкий), holub hrivnák (Словацкий), grivar (Словенский), говкафтар (Таджикский), фохта (Таджикский), әберчен (Татарский), tahtalı güvercin (Турецкий), tahtalı (Турецкий), govkaptar (Узбекский), припутень (Украинский), mánadúgva (Фарерский), sepelkyyhky (Финский), palombe (Французский), pigeon ramier (Французский), кечал-кхокха (Чеченский), holub hřivnáč (Чешский), улаппа (Чувашский), ringduva (Шведский), cushat (Шотландский), cushie-doo (Шотландский), palumbo (Эсперанто), ringokolombo (Эсперанто), kaelustuvi (Эстонский), モリバト (Японский)

Download JSONL data for вяхирь meaning in All languages combined (7.5kB)

{
  "etymology_text": "Происходит от ??",
  "forms": [
    {
      "form": "вя́хирь",
      "tags": [
        "nominative",
        "singular"
      ]
    },
    {
      "form": "вя́хири",
      "tags": [
        "nominative",
        "plural"
      ]
    },
    {
      "form": "вя́хиря",
      "tags": [
        "genitive",
        "singular"
      ]
    },
    {
      "form": "вя́хирей",
      "tags": [
        "genitive",
        "plural"
      ]
    },
    {
      "form": "вя́хирю",
      "tags": [
        "dative",
        "singular"
      ]
    },
    {
      "form": "вя́хирям",
      "tags": [
        "dative",
        "plural"
      ]
    },
    {
      "form": "вя́хиря",
      "tags": [
        "accusative",
        "singular"
      ]
    },
    {
      "form": "вя́хирей",
      "tags": [
        "accusative",
        "plural"
      ]
    },
    {
      "form": "вя́хирем",
      "tags": [
        "instrumental",
        "singular"
      ]
    },
    {
      "form": "вя́хирями",
      "tags": [
        "instrumental",
        "plural"
      ]
    },
    {
      "form": "вя́хире",
      "tags": [
        "prepositional",
        "singular"
      ]
    },
    {
      "form": "вя́хирях",
      "tags": [
        "prepositional",
        "plural"
      ]
    }
  ],
  "hypernyms": [
    {
      "sense_index": 1,
      "word": "голубь"
    },
    {
      "sense_index": 1,
      "word": "птица"
    }
  ],
  "lang": "Русский",
  "lang_code": "ru",
  "pos": "noun",
  "senses": [
    {
      "examples": [
        {
          "author": "Владимир Солоухин",
          "date": "1967",
          "source": "НКРЯ",
          "text": "То выскочит навстречу озабоченная лиса, то перебежит дорогу деловитый работяга ежик, то вырвется с оглушительным хлопаньем крыльев дикий голубь вяхирь.",
          "title": "Третья охота"
        }
      ],
      "glosses": [
        "крупный лесной голубь; витютень (Columba palumbus)"
      ],
      "id": "ru-вяхирь-ru-noun-tqa1vmyu",
      "raw_glosses": [
        "орнитол. крупный лесной голубь; витютень (Columba palumbus)"
      ],
      "topics": [
        "ornithology"
      ]
    }
  ],
  "sounds": [
    {
      "ipa": "ˈvʲæxʲɪrʲ"
    }
  ],
  "synonyms": [
    {
      "sense_index": 1,
      "word": "витютень"
    }
  ],
  "tags": [
    "animate",
    "declension-2",
    "masculine"
  ],
  "translations": [
    {
      "lang": "Азербайджанский",
      "lang_code": "az",
      "word": "alabaxta"
    },
    {
      "lang": "Английский",
      "lang_code": "en",
      "word": "cushat"
    },
    {
      "lang": "Английский",
      "lang_code": "en",
      "word": "ringdove"
    },
    {
      "lang": "Английский",
      "lang_code": "en",
      "word": "ring dove"
    },
    {
      "lang": "Арабский",
      "lang_code": "ar",
      "word": "ورشان"
    },
    {
      "lang": "Арагонский",
      "lang_code": "an",
      "word": "torcaz"
    },
    {
      "lang": "Арагонский",
      "lang_code": "an",
      "word": "torcazo"
    },
    {
      "lang": "Армянский",
      "lang_code": "hy",
      "word": "հավփալ"
    },
    {
      "lang": "Баскский",
      "lang_code": "eu",
      "word": "pagauso"
    },
    {
      "lang": "Башкирский",
      "lang_code": "ba",
      "word": "алатуба"
    },
    {
      "lang": "Белорусский",
      "lang_code": "be",
      "word": "вяхір"
    },
    {
      "lang": "Болгарский",
      "lang_code": "bg",
      "tags": [
        "masculine"
      ],
      "word": "гривяк"
    },
    {
      "lang": "Бретонский",
      "lang_code": "br",
      "word": "kudon"
    },
    {
      "lang": "Валлийский",
      "lang_code": "cy",
      "word": "ysguthan"
    },
    {
      "lang": "Венгерский",
      "lang_code": "hu",
      "word": "örvös galamb"
    },
    {
      "lang": "Галисийский",
      "lang_code": "gl",
      "word": "pombo torcaz"
    },
    {
      "lang": "Галисийский",
      "lang_code": "gl",
      "word": "pombo"
    },
    {
      "lang": "Горномарийский",
      "lang_code": "mrj",
      "word": "когогӓды"
    },
    {
      "lang": "Греческий",
      "lang_code": "el",
      "word": "φάσσα"
    },
    {
      "lang": "Грузинский",
      "lang_code": "ka",
      "word": "ქედანი"
    },
    {
      "lang": "Датский",
      "lang_code": "da",
      "word": "ringdue"
    },
    {
      "lang": "Древнегреческий",
      "lang_code": "grc",
      "raw_tags": [
        "мёртвый язык"
      ],
      "tags": [
        "feminine"
      ],
      "word": "φάσσα"
    },
    {
      "lang": "Идо",
      "lang_code": "io",
      "raw_tags": [
        "искусственный язык"
      ],
      "word": "palumbo"
    },
    {
      "lang": "Испанский",
      "lang_code": "es",
      "word": "torcaza"
    },
    {
      "lang": "Испанский",
      "lang_code": "es",
      "word": "paloma torcaz"
    },
    {
      "lang": "Итальянский",
      "lang_code": "it",
      "tags": [
        "masculine"
      ],
      "word": "colombaccio"
    },
    {
      "lang": "Кабардино-черкесский",
      "lang_code": "kbd",
      "word": "тхьэрыкъуэпщэху"
    },
    {
      "lang": "Казахский",
      "lang_code": "kk",
      "word": "дыркеп"
    },
    {
      "lang": "Каталанский",
      "lang_code": "ca",
      "word": "tudó"
    },
    {
      "lang": "Кашубский",
      "lang_code": "csb",
      "word": "gruchôłk"
    },
    {
      "lang": "Китайский",
      "lang_code": "zh",
      "tags": [
        "simplified"
      ],
      "word": "斑尾林鸽"
    },
    {
      "lang": "Корейский",
      "lang_code": "ko",
      "roman": "supbidulgi",
      "word": "숲비둘기"
    },
    {
      "lang": "Латинский",
      "lang_code": "la",
      "word": "palumbes"
    },
    {
      "lang": "Латышский",
      "lang_code": "lv",
      "word": "lauku balodis"
    },
    {
      "lang": "Литовский",
      "lang_code": "lt",
      "word": "keršulis"
    },
    {
      "lang": "Немецкий",
      "lang_code": "de",
      "word": "Kohltaube"
    },
    {
      "lang": "Немецкий",
      "lang_code": "de",
      "word": "Ringeltaube"
    },
    {
      "lang": "Немецкий",
      "lang_code": "de",
      "word": "Waldtaube"
    },
    {
      "lang": "Нидерландский",
      "lang_code": "nl",
      "word": "houtduif"
    },
    {
      "lang": "Нижнесаксонский",
      "lang_code": "nds",
      "word": "Holtduuv"
    },
    {
      "lang": "Норвежский",
      "lang_code": "no",
      "word": "ringdue"
    },
    {
      "lang": "Окситанский",
      "lang_code": "oc",
      "word": "palomba"
    },
    {
      "lang": "Пикардский",
      "lang_code": "pcd",
      "word": "biset"
    },
    {
      "lang": "Польский",
      "lang_code": "pl",
      "word": "grzywacz"
    },
    {
      "lang": "Португальский",
      "lang_code": "pt",
      "word": "pombo-torcaz"
    },
    {
      "lang": "Северносаамский",
      "lang_code": "se",
      "word": "dielkoduvvá"
    },
    {
      "lang": "Севернофризский",
      "lang_code": "frr",
      "word": "holtdüüw"
    },
    {
      "lang": "Сербский",
      "lang_code": "sr",
      "tags": [
        "Cyrillic"
      ],
      "word": "голуб гривнаш"
    },
    {
      "lang": "Сицилийский",
      "lang_code": "scn",
      "word": "palummu"
    },
    {
      "lang": "Словацкий",
      "lang_code": "sk",
      "word": "hrivnák"
    },
    {
      "lang": "Словацкий",
      "lang_code": "sk",
      "word": "holub hrivnák"
    },
    {
      "lang": "Словенский",
      "lang_code": "sl",
      "word": "grivar"
    },
    {
      "lang": "Таджикский",
      "lang_code": "tg",
      "word": "говкафтар"
    },
    {
      "lang": "Таджикский",
      "lang_code": "tg",
      "word": "фохта"
    },
    {
      "lang": "Татарский",
      "lang_code": "tt",
      "word": "әберчен"
    },
    {
      "lang": "Турецкий",
      "lang_code": "tr",
      "word": "tahtalı güvercin"
    },
    {
      "lang": "Турецкий",
      "lang_code": "tr",
      "word": "tahtalı"
    },
    {
      "lang": "Узбекский",
      "lang_code": "uz",
      "word": "govkaptar"
    },
    {
      "lang": "Украинский",
      "lang_code": "uk",
      "word": "припутень"
    },
    {
      "lang": "Фарерский",
      "lang_code": "fo",
      "word": "mánadúgva"
    },
    {
      "lang": "Финский",
      "lang_code": "fi",
      "word": "sepelkyyhky"
    },
    {
      "lang": "Французский",
      "lang_code": "fr",
      "word": "palombe"
    },
    {
      "lang": "Французский",
      "lang_code": "fr",
      "word": "pigeon ramier"
    },
    {
      "lang": "Чеченский",
      "lang_code": "ce",
      "word": "кечал-кхокха"
    },
    {
      "lang": "Чешский",
      "lang_code": "cs",
      "word": "holub hřivnáč"
    },
    {
      "lang": "Чувашский",
      "lang_code": "cv",
      "word": "улаппа"
    },
    {
      "lang": "Шведский",
      "lang_code": "sv",
      "word": "ringduva"
    },
    {
      "lang": "Шотландский",
      "lang_code": "sco",
      "word": "cushat"
    },
    {
      "lang": "Шотландский",
      "lang_code": "sco",
      "word": "cushie-doo"
    },
    {
      "lang": "Эсперанто",
      "lang_code": "eo",
      "raw_tags": [
        "искусственный язык"
      ],
      "word": "palumbo"
    },
    {
      "lang": "Эсперанто",
      "lang_code": "eo",
      "word": "ringokolombo"
    },
    {
      "lang": "Эстонский",
      "lang_code": "et",
      "word": "kaelustuvi"
    },
    {
      "lang": "Японский",
      "lang_code": "ja",
      "word": "モリバト"
    }
  ],
  "word": "вяхирь"
}
{
  "etymology_text": "Происходит от ??",
  "forms": [
    {
      "form": "вя́хирь",
      "tags": [
        "nominative",
        "singular"
      ]
    },
    {
      "form": "вя́хири",
      "tags": [
        "nominative",
        "plural"
      ]
    },
    {
      "form": "вя́хиря",
      "tags": [
        "genitive",
        "singular"
      ]
    },
    {
      "form": "вя́хирей",
      "tags": [
        "genitive",
        "plural"
      ]
    },
    {
      "form": "вя́хирю",
      "tags": [
        "dative",
        "singular"
      ]
    },
    {
      "form": "вя́хирям",
      "tags": [
        "dative",
        "plural"
      ]
    },
    {
      "form": "вя́хиря",
      "tags": [
        "accusative",
        "singular"
      ]
    },
    {
      "form": "вя́хирей",
      "tags": [
        "accusative",
        "plural"
      ]
    },
    {
      "form": "вя́хирем",
      "tags": [
        "instrumental",
        "singular"
      ]
    },
    {
      "form": "вя́хирями",
      "tags": [
        "instrumental",
        "plural"
      ]
    },
    {
      "form": "вя́хире",
      "tags": [
        "prepositional",
        "singular"
      ]
    },
    {
      "form": "вя́хирях",
      "tags": [
        "prepositional",
        "plural"
      ]
    }
  ],
  "hypernyms": [
    {
      "sense_index": 1,
      "word": "голубь"
    },
    {
      "sense_index": 1,
      "word": "птица"
    }
  ],
  "lang": "Русский",
  "lang_code": "ru",
  "pos": "noun",
  "senses": [
    {
      "examples": [
        {
          "author": "Владимир Солоухин",
          "date": "1967",
          "source": "НКРЯ",
          "text": "То выскочит навстречу озабоченная лиса, то перебежит дорогу деловитый работяга ежик, то вырвется с оглушительным хлопаньем крыльев дикий голубь вяхирь.",
          "title": "Третья охота"
        }
      ],
      "glosses": [
        "крупный лесной голубь; витютень (Columba palumbus)"
      ],
      "raw_glosses": [
        "орнитол. крупный лесной голубь; витютень (Columba palumbus)"
      ],
      "topics": [
        "ornithology"
      ]
    }
  ],
  "sounds": [
    {
      "ipa": "ˈvʲæxʲɪrʲ"
    }
  ],
  "synonyms": [
    {
      "sense_index": 1,
      "word": "витютень"
    }
  ],
  "tags": [
    "animate",
    "declension-2",
    "masculine"
  ],
  "translations": [
    {
      "lang": "Азербайджанский",
      "lang_code": "az",
      "word": "alabaxta"
    },
    {
      "lang": "Английский",
      "lang_code": "en",
      "word": "cushat"
    },
    {
      "lang": "Английский",
      "lang_code": "en",
      "word": "ringdove"
    },
    {
      "lang": "Английский",
      "lang_code": "en",
      "word": "ring dove"
    },
    {
      "lang": "Арабский",
      "lang_code": "ar",
      "word": "ورشان"
    },
    {
      "lang": "Арагонский",
      "lang_code": "an",
      "word": "torcaz"
    },
    {
      "lang": "Арагонский",
      "lang_code": "an",
      "word": "torcazo"
    },
    {
      "lang": "Армянский",
      "lang_code": "hy",
      "word": "հավփալ"
    },
    {
      "lang": "Баскский",
      "lang_code": "eu",
      "word": "pagauso"
    },
    {
      "lang": "Башкирский",
      "lang_code": "ba",
      "word": "алатуба"
    },
    {
      "lang": "Белорусский",
      "lang_code": "be",
      "word": "вяхір"
    },
    {
      "lang": "Болгарский",
      "lang_code": "bg",
      "tags": [
        "masculine"
      ],
      "word": "гривяк"
    },
    {
      "lang": "Бретонский",
      "lang_code": "br",
      "word": "kudon"
    },
    {
      "lang": "Валлийский",
      "lang_code": "cy",
      "word": "ysguthan"
    },
    {
      "lang": "Венгерский",
      "lang_code": "hu",
      "word": "örvös galamb"
    },
    {
      "lang": "Галисийский",
      "lang_code": "gl",
      "word": "pombo torcaz"
    },
    {
      "lang": "Галисийский",
      "lang_code": "gl",
      "word": "pombo"
    },
    {
      "lang": "Горномарийский",
      "lang_code": "mrj",
      "word": "когогӓды"
    },
    {
      "lang": "Греческий",
      "lang_code": "el",
      "word": "φάσσα"
    },
    {
      "lang": "Грузинский",
      "lang_code": "ka",
      "word": "ქედანი"
    },
    {
      "lang": "Датский",
      "lang_code": "da",
      "word": "ringdue"
    },
    {
      "lang": "Древнегреческий",
      "lang_code": "grc",
      "raw_tags": [
        "мёртвый язык"
      ],
      "tags": [
        "feminine"
      ],
      "word": "φάσσα"
    },
    {
      "lang": "Идо",
      "lang_code": "io",
      "raw_tags": [
        "искусственный язык"
      ],
      "word": "palumbo"
    },
    {
      "lang": "Испанский",
      "lang_code": "es",
      "word": "torcaza"
    },
    {
      "lang": "Испанский",
      "lang_code": "es",
      "word": "paloma torcaz"
    },
    {
      "lang": "Итальянский",
      "lang_code": "it",
      "tags": [
        "masculine"
      ],
      "word": "colombaccio"
    },
    {
      "lang": "Кабардино-черкесский",
      "lang_code": "kbd",
      "word": "тхьэрыкъуэпщэху"
    },
    {
      "lang": "Казахский",
      "lang_code": "kk",
      "word": "дыркеп"
    },
    {
      "lang": "Каталанский",
      "lang_code": "ca",
      "word": "tudó"
    },
    {
      "lang": "Кашубский",
      "lang_code": "csb",
      "word": "gruchôłk"
    },
    {
      "lang": "Китайский",
      "lang_code": "zh",
      "tags": [
        "simplified"
      ],
      "word": "斑尾林鸽"
    },
    {
      "lang": "Корейский",
      "lang_code": "ko",
      "roman": "supbidulgi",
      "word": "숲비둘기"
    },
    {
      "lang": "Латинский",
      "lang_code": "la",
      "word": "palumbes"
    },
    {
      "lang": "Латышский",
      "lang_code": "lv",
      "word": "lauku balodis"
    },
    {
      "lang": "Литовский",
      "lang_code": "lt",
      "word": "keršulis"
    },
    {
      "lang": "Немецкий",
      "lang_code": "de",
      "word": "Kohltaube"
    },
    {
      "lang": "Немецкий",
      "lang_code": "de",
      "word": "Ringeltaube"
    },
    {
      "lang": "Немецкий",
      "lang_code": "de",
      "word": "Waldtaube"
    },
    {
      "lang": "Нидерландский",
      "lang_code": "nl",
      "word": "houtduif"
    },
    {
      "lang": "Нижнесаксонский",
      "lang_code": "nds",
      "word": "Holtduuv"
    },
    {
      "lang": "Норвежский",
      "lang_code": "no",
      "word": "ringdue"
    },
    {
      "lang": "Окситанский",
      "lang_code": "oc",
      "word": "palomba"
    },
    {
      "lang": "Пикардский",
      "lang_code": "pcd",
      "word": "biset"
    },
    {
      "lang": "Польский",
      "lang_code": "pl",
      "word": "grzywacz"
    },
    {
      "lang": "Португальский",
      "lang_code": "pt",
      "word": "pombo-torcaz"
    },
    {
      "lang": "Северносаамский",
      "lang_code": "se",
      "word": "dielkoduvvá"
    },
    {
      "lang": "Севернофризский",
      "lang_code": "frr",
      "word": "holtdüüw"
    },
    {
      "lang": "Сербский",
      "lang_code": "sr",
      "tags": [
        "Cyrillic"
      ],
      "word": "голуб гривнаш"
    },
    {
      "lang": "Сицилийский",
      "lang_code": "scn",
      "word": "palummu"
    },
    {
      "lang": "Словацкий",
      "lang_code": "sk",
      "word": "hrivnák"
    },
    {
      "lang": "Словацкий",
      "lang_code": "sk",
      "word": "holub hrivnák"
    },
    {
      "lang": "Словенский",
      "lang_code": "sl",
      "word": "grivar"
    },
    {
      "lang": "Таджикский",
      "lang_code": "tg",
      "word": "говкафтар"
    },
    {
      "lang": "Таджикский",
      "lang_code": "tg",
      "word": "фохта"
    },
    {
      "lang": "Татарский",
      "lang_code": "tt",
      "word": "әберчен"
    },
    {
      "lang": "Турецкий",
      "lang_code": "tr",
      "word": "tahtalı güvercin"
    },
    {
      "lang": "Турецкий",
      "lang_code": "tr",
      "word": "tahtalı"
    },
    {
      "lang": "Узбекский",
      "lang_code": "uz",
      "word": "govkaptar"
    },
    {
      "lang": "Украинский",
      "lang_code": "uk",
      "word": "припутень"
    },
    {
      "lang": "Фарерский",
      "lang_code": "fo",
      "word": "mánadúgva"
    },
    {
      "lang": "Финский",
      "lang_code": "fi",
      "word": "sepelkyyhky"
    },
    {
      "lang": "Французский",
      "lang_code": "fr",
      "word": "palombe"
    },
    {
      "lang": "Французский",
      "lang_code": "fr",
      "word": "pigeon ramier"
    },
    {
      "lang": "Чеченский",
      "lang_code": "ce",
      "word": "кечал-кхокха"
    },
    {
      "lang": "Чешский",
      "lang_code": "cs",
      "word": "holub hřivnáč"
    },
    {
      "lang": "Чувашский",
      "lang_code": "cv",
      "word": "улаппа"
    },
    {
      "lang": "Шведский",
      "lang_code": "sv",
      "word": "ringduva"
    },
    {
      "lang": "Шотландский",
      "lang_code": "sco",
      "word": "cushat"
    },
    {
      "lang": "Шотландский",
      "lang_code": "sco",
      "word": "cushie-doo"
    },
    {
      "lang": "Эсперанто",
      "lang_code": "eo",
      "raw_tags": [
        "искусственный язык"
      ],
      "word": "palumbo"
    },
    {
      "lang": "Эсперанто",
      "lang_code": "eo",
      "word": "ringokolombo"
    },
    {
      "lang": "Эстонский",
      "lang_code": "et",
      "word": "kaelustuvi"
    },
    {
      "lang": "Японский",
      "lang_code": "ja",
      "word": "モリバト"
    }
  ],
  "word": "вяхирь"
}

This page is a part of the kaikki.org machine-readable All languages combined dictionary. This dictionary is based on structured data extracted on 2024-07-06 from the ruwiktionary dump dated 2024-07-01 using wiktextract (ad53249 and b4eb25b). The data shown on this site has been post-processed and various details (e.g., extra categories) removed, some information disambiguated, and additional data merged from other sources. See the raw data download page for the unprocessed wiktextract data.

If you use this data in academic research, please cite Tatu Ylonen: Wiktextract: Wiktionary as Machine-Readable Structured Data, Proceedings of the 13th Conference on Language Resources and Evaluation (LREC), pp. 1317-1325, Marseille, 20-25 June 2022. Linking to the relevant page(s) under https://kaikki.org would also be greatly appreciated.