See orkestra in All languages combined, or Wiktionary
{ "categories": [ { "kind": "other", "name": "Daxwazên peyvan bi fransî", "parents": [], "source": "w" }, { "kind": "other", "name": "Fransî", "parents": [], "source": "w" }, { "kind": "other", "name": "Kurmancî", "parents": [], "source": "w" }, { "kind": "other", "name": "Peyvên kurmancî ji fransî", "parents": [], "source": "w" } ], "etymology_text": "Ji fransî [Peyv?]synphonie", "forms": [ { "form": "orkester" }, { "form": "orkestira" }, { "form": "opera" }, { "form": "tiyatro" } ], "lang": "Kurmancî", "lang_code": "ku", "pos": "noun", "pos_title": "Navdêr", "related": [ { "word": "konser" }, { "word": "koro" }, { "word": "senfonî" } ], "senses": [ { "glosses": [ "komek muzîkvanan ya ku bi hev re lê bi çend amûrên cuda dijenin" ], "id": "ku-orkestra-ku-noun-KD31pD9-" } ], "tags": [ "feminine" ], "translations": [ { "lang": "Albanî", "lang_code": "sq", "tags": [ "masculine" ], "word": "orkestër" }, { "lang": "Almanî", "lang_code": "de", "tags": [ "gender-neutral" ], "word": "Orchester" }, { "lang": "Altayiya başûrî", "lang_code": "alt", "roman": "orkestr", "word": "оркестр" }, { "lang": "Azerî", "lang_code": "az", "word": "orkestr" }, { "lang": "Baskî", "lang_code": "eu", "word": "orkestra" }, { "lang": "Belarusî", "lang_code": "be", "roman": "arkjéstr", "tags": [ "masculine" ], "word": "арке́стр" }, { "lang": "Bengalî", "lang_code": "bn", "roman": "ôrkeśṭra", "word": "অর্কেস্ট্রা" }, { "lang": "Bengalî", "lang_code": "bn", "roman": "badôkdôl", "word": "বাদকদল" }, { "lang": "Bulgarî", "lang_code": "bg", "roman": "orkéstǎr", "tags": [ "masculine" ], "word": "орке́стър" }, { "lang": "Burmayî", "lang_code": "my", "roman": "samcumti:wuing:", "word": "သံစုံတီးဝိုင်း" }, { "lang": "Buryatî", "lang_code": "bua", "roman": "orkjestr", "word": "оркестр" }, { "lang": "Çekî", "lang_code": "cs", "tags": [ "masculine" ], "word": "orchestr" }, { "lang": "Mandarînî", "lang_code": "cmn", "roman": "yuètuán", "word": "樂團" }, { "lang": "Mandarînî", "lang_code": "cmn", "roman": "yuèduì", "word": "樂隊" }, { "lang": "Mandarînî", "lang_code": "cmn", "roman": "guǎnxián yuètuán", "word": "管弦樂團" }, { "lang": "Mandarînî", "lang_code": "cmn", "roman": "guǎnxián yuèduì", "word": "管弦樂隊" }, { "lang": "Danmarkî", "lang_code": "da", "tags": [ "gender-neutral" ], "word": "orkester" }, { "lang": "Endonezyayî", "lang_code": "id", "word": "orkestra" }, { "lang": "Endonezyayî", "lang_code": "id", "word": "orkes" }, { "lang": "Erebî", "lang_code": "ar", "roman": "ʔōrkistrā", "tags": [ "feminine" ], "word": "أُورْكِسْتْرَا" }, { "lang": "Ermenî", "lang_code": "hy", "roman": "nvagaxumb", "word": "նվագախումբ" }, { "lang": "Esperantoyî", "lang_code": "eo", "word": "orkestro" }, { "lang": "Estonî", "lang_code": "et", "word": "orkester" }, { "lang": "Farisî", "lang_code": "fa", "roman": "orkestr", "word": "ارکستر" }, { "lang": "Fînî", "lang_code": "fi", "word": "orkesteri" }, { "lang": "Fransî", "lang_code": "fr", "tags": [ "masculine" ], "word": "orchestre" }, { "lang": "Galîsî", "lang_code": "gl", "tags": [ "feminine" ], "word": "orquestra" }, { "lang": "Gurcî", "lang_code": "ka", "roman": "orḳesṭri", "word": "ორკესტრი" }, { "lang": "Hindî", "lang_code": "hi", "roman": "bājā", "tags": [ "masculine" ], "word": "बाजा" }, { "lang": "Hindî", "lang_code": "hi", "roman": "ŏrkesṭrā", "word": "ऑर्केस्ट्रा" }, { "lang": "Holendî", "lang_code": "nl", "tags": [ "gender-neutral" ], "word": "orkest" }, { "lang": "Îbranî", "lang_code": "he", "roman": "ʾtizmoret", "tags": [ "feminine" ], "word": "תזמורת / תִּזְמֹרֶתf" }, { "lang": "Îngilîzî", "lang_code": "en", "word": "orchestra" }, { "lang": "Îrlendî", "lang_code": "ga", "tags": [ "feminine" ], "word": "ceolfhoireann" }, { "lang": "Îtalî", "lang_code": "it", "tags": [ "feminine" ], "word": "orchestra" }, { "lang": "Îzlendî", "lang_code": "is", "tags": [ "feminine" ], "word": "hljómsveit" }, { "lang": "Îzlendî", "lang_code": "is", "tags": [ "gender-neutral" ], "word": "orkestur" }, { "lang": "Japonî", "lang_code": "ja", "word": "オーケストラ" }, { "lang": "Kalalîsûtî", "lang_code": "kl", "word": "nipilersortut" }, { "lang": "Kalmîkî", "lang_code": "xal", "roman": "orkestr", "word": "оркестр" }, { "lang": "Katalanî", "lang_code": "ca", "tags": [ "feminine" ], "word": "orquestra" }, { "lang": "Kirgizî", "lang_code": "ky", "roman": "orkestr", "word": "оркестр" }, { "lang": "Koreyî", "lang_code": "ko", "roman": "okeseuteura", "word": "오케스트라" }, { "lang": "Latviyayî", "lang_code": "lv", "tags": [ "masculine" ], "word": "orķestris" }, { "lang": "Lawsî", "lang_code": "lo", "roman": "du li nyāng", "word": "ດຸລິຍາງ" }, { "lang": "Lawsî", "lang_code": "lo", "roman": "tu li nyāng", "word": "ຕຸລິຍາງ" }, { "lang": "Lawsî", "lang_code": "lo", "word": "ມະໂຫລີ" }, { "lang": "Lawsî", "lang_code": "lo", "word": "ມະໂຫຣີ" }, { "lang": "Lawsî", "lang_code": "lo", "roman": "pī phāt", "word": "ປີ່ພາດ" }, { "lang": "Lîtwanî", "lang_code": "lt", "tags": [ "masculine" ], "word": "orkestras" }, { "lang": "Makedonî", "lang_code": "mk", "roman": "orkestar", "tags": [ "masculine" ], "word": "оркестар" }, { "lang": "Malezî", "lang_code": "ms", "word": "orkestra" }, { "lang": "Maltayî", "lang_code": "mt", "tags": [ "feminine" ], "word": "orkestra" }, { "lang": "Maorî", "lang_code": "mi", "word": "tira puoro" }, { "lang": "Maorî", "lang_code": "mi", "word": "rāngai puoro" }, { "lang": "Mecarî", "lang_code": "hu", "word": "zenekar" }, { "lang": "Kirîlî", "lang_code": "mn", "roman": "najral högžim", "word": "найрал хөгжим" }, { "lang": "Normandî", "lang_code": "nrf", "tags": [ "masculine" ], "word": "orchestre" }, { "lang": "Norweciya bokmålî", "lang_code": "nb", "tags": [ "gender-neutral" ], "word": "orkester" }, { "lang": "Norweciya nînorskî", "lang_code": "nn", "tags": [ "gender-neutral" ], "word": "orkester" }, { "lang": "Ozbekî", "lang_code": "uz", "word": "orkestr" }, { "lang": "Polonî", "lang_code": "pl", "tags": [ "feminine" ], "word": "orkiestra" }, { "lang": "Portugalî", "lang_code": "pt", "tags": [ "feminine" ], "word": "orquestra" }, { "lang": "Qazaxî", "lang_code": "kk", "roman": "orkestr", "word": "оркестр" }, { "lang": "Romanyayî", "lang_code": "ro", "tags": [ "feminine" ], "word": "orchestră" }, { "lang": "Rusî", "lang_code": "ru", "roman": "orkéstr", "tags": [ "masculine" ], "word": "орке́стр" }, { "lang": "Kirîlî", "lang_code": "sh", "tags": [ "masculine" ], "word": "о̀ркестар" }, { "lang": "Latînî", "lang_code": "sh", "tags": [ "masculine" ], "word": "òrkestar" }, { "lang": "Slovakî", "lang_code": "sk", "tags": [ "masculine" ], "word": "orchester" }, { "lang": "Slovenî", "lang_code": "sl", "tags": [ "masculine" ], "word": "orkester" }, { "lang": "Spanî", "lang_code": "es", "tags": [ "feminine" ], "word": "orquesta" }, { "lang": "Swêdî", "lang_code": "sv", "tags": [ "common-gender" ], "word": "orkester" }, { "lang": "Tacikî", "lang_code": "tg", "roman": "orkestr", "word": "оркестр" }, { "lang": "Tagalogî", "lang_code": "tl", "word": "orkestra" }, { "lang": "Tayî", "lang_code": "th", "word": "ออร์เคสตรา" }, { "lang": "Tirkî", "lang_code": "tr", "word": "orkestra" }, { "lang": "Tirkmenî", "lang_code": "tk", "word": "orkestr" }, { "lang": "Tuvanî", "lang_code": "tyv", "roman": "orkestr", "word": "оркестр" }, { "lang": "Tuvanî", "lang_code": "tyv", "roman": "xögjüm", "word": "хөгжүм" }, { "lang": "Urdûyî", "lang_code": "ur", "roman": "ārkesṭrā", "word": "آرکسٹرا" }, { "lang": "Ûkraynî", "lang_code": "uk", "roman": "orkéstr", "tags": [ "masculine" ], "word": "орке́стр" }, { "lang": "Viyetnamî", "lang_code": "vi", "word": "dàn nhạc" }, { "lang": "Weylsî", "lang_code": "cy", "tags": [ "feminine" ], "word": "cerddorfa" }, { "lang": "Ximêrî", "lang_code": "km", "roman": "toriyiəngkɔɔ", "word": "តុរិយាង្គ" }, { "lang": "Ximêrî", "lang_code": "km", "roman": "piphaat", "word": "ពិផាត" }, { "lang": "Yakutî", "lang_code": "sah", "roman": "arkıastır", "word": "аркыастыр" }, { "lang": "Yakutî", "lang_code": "sah", "roman": "orkestr", "word": "оркестр" }, { "lang": "Yidîşî", "lang_code": "yi", "roman": "orkester", "word": "אָרקעסטער" }, { "lang": "Yûnanî", "lang_code": "el", "roman": "orchístra", "tags": [ "feminine" ], "word": "ορχήστρα" } ], "word": "orkestra" }
{ "categories": [ "Daxwazên peyvan bi fransî", "Fransî", "Kurmancî", "Peyvên kurmancî ji fransî" ], "etymology_text": "Ji fransî [Peyv?]synphonie", "forms": [ { "form": "orkester" }, { "form": "orkestira" }, { "form": "opera" }, { "form": "tiyatro" } ], "lang": "Kurmancî", "lang_code": "ku", "pos": "noun", "pos_title": "Navdêr", "related": [ { "word": "konser" }, { "word": "koro" }, { "word": "senfonî" } ], "senses": [ { "glosses": [ "komek muzîkvanan ya ku bi hev re lê bi çend amûrên cuda dijenin" ] } ], "tags": [ "feminine" ], "translations": [ { "lang": "Albanî", "lang_code": "sq", "tags": [ "masculine" ], "word": "orkestër" }, { "lang": "Almanî", "lang_code": "de", "tags": [ "gender-neutral" ], "word": "Orchester" }, { "lang": "Altayiya başûrî", "lang_code": "alt", "roman": "orkestr", "word": "оркестр" }, { "lang": "Azerî", "lang_code": "az", "word": "orkestr" }, { "lang": "Baskî", "lang_code": "eu", "word": "orkestra" }, { "lang": "Belarusî", "lang_code": "be", "roman": "arkjéstr", "tags": [ "masculine" ], "word": "арке́стр" }, { "lang": "Bengalî", "lang_code": "bn", "roman": "ôrkeśṭra", "word": "অর্কেস্ট্রা" }, { "lang": "Bengalî", "lang_code": "bn", "roman": "badôkdôl", "word": "বাদকদল" }, { "lang": "Bulgarî", "lang_code": "bg", "roman": "orkéstǎr", "tags": [ "masculine" ], "word": "орке́стър" }, { "lang": "Burmayî", "lang_code": "my", "roman": "samcumti:wuing:", "word": "သံစုံတီးဝိုင်း" }, { "lang": "Buryatî", "lang_code": "bua", "roman": "orkjestr", "word": "оркестр" }, { "lang": "Çekî", "lang_code": "cs", "tags": [ "masculine" ], "word": "orchestr" }, { "lang": "Mandarînî", "lang_code": "cmn", "roman": "yuètuán", "word": "樂團" }, { "lang": "Mandarînî", "lang_code": "cmn", "roman": "yuèduì", "word": "樂隊" }, { "lang": "Mandarînî", "lang_code": "cmn", "roman": "guǎnxián yuètuán", "word": "管弦樂團" }, { "lang": "Mandarînî", "lang_code": "cmn", "roman": "guǎnxián yuèduì", "word": "管弦樂隊" }, { "lang": "Danmarkî", "lang_code": "da", "tags": [ "gender-neutral" ], "word": "orkester" }, { "lang": "Endonezyayî", "lang_code": "id", "word": "orkestra" }, { "lang": "Endonezyayî", "lang_code": "id", "word": "orkes" }, { "lang": "Erebî", "lang_code": "ar", "roman": "ʔōrkistrā", "tags": [ "feminine" ], "word": "أُورْكِسْتْرَا" }, { "lang": "Ermenî", "lang_code": "hy", "roman": "nvagaxumb", "word": "նվագախումբ" }, { "lang": "Esperantoyî", "lang_code": "eo", "word": "orkestro" }, { "lang": "Estonî", "lang_code": "et", "word": "orkester" }, { "lang": "Farisî", "lang_code": "fa", "roman": "orkestr", "word": "ارکستر" }, { "lang": "Fînî", "lang_code": "fi", "word": "orkesteri" }, { "lang": "Fransî", "lang_code": "fr", "tags": [ "masculine" ], "word": "orchestre" }, { "lang": "Galîsî", "lang_code": "gl", "tags": [ "feminine" ], "word": "orquestra" }, { "lang": "Gurcî", "lang_code": "ka", "roman": "orḳesṭri", "word": "ორკესტრი" }, { "lang": "Hindî", "lang_code": "hi", "roman": "bājā", "tags": [ "masculine" ], "word": "बाजा" }, { "lang": "Hindî", "lang_code": "hi", "roman": "ŏrkesṭrā", "word": "ऑर्केस्ट्रा" }, { "lang": "Holendî", "lang_code": "nl", "tags": [ "gender-neutral" ], "word": "orkest" }, { "lang": "Îbranî", "lang_code": "he", "roman": "ʾtizmoret", "tags": [ "feminine" ], "word": "תזמורת / תִּזְמֹרֶתf" }, { "lang": "Îngilîzî", "lang_code": "en", "word": "orchestra" }, { "lang": "Îrlendî", "lang_code": "ga", "tags": [ "feminine" ], "word": "ceolfhoireann" }, { "lang": "Îtalî", "lang_code": "it", "tags": [ "feminine" ], "word": "orchestra" }, { "lang": "Îzlendî", "lang_code": "is", "tags": [ "feminine" ], "word": "hljómsveit" }, { "lang": "Îzlendî", "lang_code": "is", "tags": [ "gender-neutral" ], "word": "orkestur" }, { "lang": "Japonî", "lang_code": "ja", "word": "オーケストラ" }, { "lang": "Kalalîsûtî", "lang_code": "kl", "word": "nipilersortut" }, { "lang": "Kalmîkî", "lang_code": "xal", "roman": "orkestr", "word": "оркестр" }, { "lang": "Katalanî", "lang_code": "ca", "tags": [ "feminine" ], "word": "orquestra" }, { "lang": "Kirgizî", "lang_code": "ky", "roman": "orkestr", "word": "оркестр" }, { "lang": "Koreyî", "lang_code": "ko", "roman": "okeseuteura", "word": "오케스트라" }, { "lang": "Latviyayî", "lang_code": "lv", "tags": [ "masculine" ], "word": "orķestris" }, { "lang": "Lawsî", "lang_code": "lo", "roman": "du li nyāng", "word": "ດຸລິຍາງ" }, { "lang": "Lawsî", "lang_code": "lo", "roman": "tu li nyāng", "word": "ຕຸລິຍາງ" }, { "lang": "Lawsî", "lang_code": "lo", "word": "ມະໂຫລີ" }, { "lang": "Lawsî", "lang_code": "lo", "word": "ມະໂຫຣີ" }, { "lang": "Lawsî", "lang_code": "lo", "roman": "pī phāt", "word": "ປີ່ພາດ" }, { "lang": "Lîtwanî", "lang_code": "lt", "tags": [ "masculine" ], "word": "orkestras" }, { "lang": "Makedonî", "lang_code": "mk", "roman": "orkestar", "tags": [ "masculine" ], "word": "оркестар" }, { "lang": "Malezî", "lang_code": "ms", "word": "orkestra" }, { "lang": "Maltayî", "lang_code": "mt", "tags": [ "feminine" ], "word": "orkestra" }, { "lang": "Maorî", "lang_code": "mi", "word": "tira puoro" }, { "lang": "Maorî", "lang_code": "mi", "word": "rāngai puoro" }, { "lang": "Mecarî", "lang_code": "hu", "word": "zenekar" }, { "lang": "Kirîlî", "lang_code": "mn", "roman": "najral högžim", "word": "найрал хөгжим" }, { "lang": "Normandî", "lang_code": "nrf", "tags": [ "masculine" ], "word": "orchestre" }, { "lang": "Norweciya bokmålî", "lang_code": "nb", "tags": [ "gender-neutral" ], "word": "orkester" }, { "lang": "Norweciya nînorskî", "lang_code": "nn", "tags": [ "gender-neutral" ], "word": "orkester" }, { "lang": "Ozbekî", "lang_code": "uz", "word": "orkestr" }, { "lang": "Polonî", "lang_code": "pl", "tags": [ "feminine" ], "word": "orkiestra" }, { "lang": "Portugalî", "lang_code": "pt", "tags": [ "feminine" ], "word": "orquestra" }, { "lang": "Qazaxî", "lang_code": "kk", "roman": "orkestr", "word": "оркестр" }, { "lang": "Romanyayî", "lang_code": "ro", "tags": [ "feminine" ], "word": "orchestră" }, { "lang": "Rusî", "lang_code": "ru", "roman": "orkéstr", "tags": [ "masculine" ], "word": "орке́стр" }, { "lang": "Kirîlî", "lang_code": "sh", "tags": [ "masculine" ], "word": "о̀ркестар" }, { "lang": "Latînî", "lang_code": "sh", "tags": [ "masculine" ], "word": "òrkestar" }, { "lang": "Slovakî", "lang_code": "sk", "tags": [ "masculine" ], "word": "orchester" }, { "lang": "Slovenî", "lang_code": "sl", "tags": [ "masculine" ], "word": "orkester" }, { "lang": "Spanî", "lang_code": "es", "tags": [ "feminine" ], "word": "orquesta" }, { "lang": "Swêdî", "lang_code": "sv", "tags": [ "common-gender" ], "word": "orkester" }, { "lang": "Tacikî", "lang_code": "tg", "roman": "orkestr", "word": "оркестр" }, { "lang": "Tagalogî", "lang_code": "tl", "word": "orkestra" }, { "lang": "Tayî", "lang_code": "th", "word": "ออร์เคสตรา" }, { "lang": "Tirkî", "lang_code": "tr", "word": "orkestra" }, { "lang": "Tirkmenî", "lang_code": "tk", "word": "orkestr" }, { "lang": "Tuvanî", "lang_code": "tyv", "roman": "orkestr", "word": "оркестр" }, { "lang": "Tuvanî", "lang_code": "tyv", "roman": "xögjüm", "word": "хөгжүм" }, { "lang": "Urdûyî", "lang_code": "ur", "roman": "ārkesṭrā", "word": "آرکسٹرا" }, { "lang": "Ûkraynî", "lang_code": "uk", "roman": "orkéstr", "tags": [ "masculine" ], "word": "орке́стр" }, { "lang": "Viyetnamî", "lang_code": "vi", "word": "dàn nhạc" }, { "lang": "Weylsî", "lang_code": "cy", "tags": [ "feminine" ], "word": "cerddorfa" }, { "lang": "Ximêrî", "lang_code": "km", "roman": "toriyiəngkɔɔ", "word": "តុរិយាង្គ" }, { "lang": "Ximêrî", "lang_code": "km", "roman": "piphaat", "word": "ពិផាត" }, { "lang": "Yakutî", "lang_code": "sah", "roman": "arkıastır", "word": "аркыастыр" }, { "lang": "Yakutî", "lang_code": "sah", "roman": "orkestr", "word": "оркестр" }, { "lang": "Yidîşî", "lang_code": "yi", "roman": "orkester", "word": "אָרקעסטער" }, { "lang": "Yûnanî", "lang_code": "el", "roman": "orchístra", "tags": [ "feminine" ], "word": "ορχήστρα" } ], "word": "orkestra" }
Download raw JSONL data for orkestra meaning in Kurmancî (8.1kB)
{ "called_from": "parser/304", "msg": "HTML tag <abbr> not properly closed", "path": [ "orkestra" ], "section": "Kurmancî", "subsection": "Werger", "title": "orkestra", "trace": "started on line 1, detected on line 1" } { "called_from": "parser/1336", "msg": "no corresponding start tag found for </span>", "path": [ "orkestra" ], "section": "Kurmancî", "subsection": "Werger", "title": "orkestra", "trace": "" } { "called_from": "parser/304", "msg": "HTML tag <abbr> not properly closed", "path": [ "orkestra" ], "section": "Kurmancî", "subsection": "Werger", "title": "orkestra", "trace": "started on line 1, detected on line 1" } { "called_from": "parser/1336", "msg": "no corresponding start tag found for </span>", "path": [ "orkestra" ], "section": "Kurmancî", "subsection": "Werger", "title": "orkestra", "trace": "" } { "called_from": "parser/304", "msg": "HTML tag <abbr> not properly closed", "path": [ "orkestra" ], "section": "Kurmancî", "subsection": "Werger", "title": "orkestra", "trace": "started on line 1, detected on line 1" } { "called_from": "parser/1336", "msg": "no corresponding start tag found for </span>", "path": [ "orkestra" ], "section": "Kurmancî", "subsection": "Werger", "title": "orkestra", "trace": "" } { "called_from": "parser/304", "msg": "HTML tag <abbr> not properly closed", "path": [ "orkestra" ], "section": "Kurmancî", "subsection": "Werger", "title": "orkestra", "trace": "started on line 1, detected on line 1" } { "called_from": "parser/1336", "msg": "no corresponding start tag found for </span>", "path": [ "orkestra" ], "section": "Kurmancî", "subsection": "Werger", "title": "orkestra", "trace": "" } { "called_from": "parser/304", "msg": "HTML tag <abbr> not properly closed", "path": [ "orkestra" ], "section": "Kurmancî", "subsection": "Werger", "title": "orkestra", "trace": "started on line 1, detected on line 1" } { "called_from": "parser/1336", "msg": "no corresponding start tag found for </span>", "path": [ "orkestra" ], "section": "Kurmancî", "subsection": "Werger", "title": "orkestra", "trace": "" } { "called_from": "parser/304", "msg": "HTML tag <abbr> not properly closed", "path": [ "orkestra" ], "section": "Kurmancî", "subsection": "Werger", "title": "orkestra", "trace": "started on line 1, detected on line 1" } { "called_from": "parser/1336", "msg": "no corresponding start tag found for </span>", "path": [ "orkestra" ], "section": "Kurmancî", "subsection": "Werger", "title": "orkestra", "trace": "" }
This page is a part of the kaikki.org machine-readable Kurmancî dictionary. This dictionary is based on structured data extracted on 2025-04-10 from the kuwiktionary dump dated 2025-04-03 using wiktextract (74c5344 and fb63907). The data shown on this site has been post-processed and various details (e.g., extra categories) removed, some information disambiguated, and additional data merged from other sources. See the raw data download page for the unprocessed wiktextract data.
If you use this data in academic research, please cite Tatu Ylonen: Wiktextract: Wiktionary as Machine-Readable Structured Data, Proceedings of the 13th Conference on Language Resources and Evaluation (LREC), pp. 1317-1325, Marseille, 20-25 June 2022. Linking to the relevant page(s) under https://kaikki.org would also be greatly appreciated.