"rapaz" meaning in All languages combined

See rapaz on Wiktionary

Adjective [Galego]

Forms: rapazes [plural]
  1. rapaz, que rouba
    Sense id: pt-rapaz-gl-adj-3Oyjry7c
The following are not (yet) sense-disambiguated

Noun [Galego]

Forms: rapazes [masculine, plural], rapariga [feminine, singular], rapaza [feminine, singular], raparigas [feminine, plural], rapazas [feminine, plural]
  1. rapaz, pessoa de dez a catorze anos, jovem
    Sense id: pt-rapaz-gl-noun-pCzYToiV
  2. namorado Tags: colloquial
    Sense id: pt-rapaz-gl-noun-scHXPlQk Categories (other): Coloquialismo (Galego)
  3. aprendiz de marinheiro
    Sense id: pt-rapaz-gl-noun--788AJW5 Categories (other): Náutica (Galego) Topics: nautical
  4. grampo, ferramenta de carpinteiro que mantêm apertada e afixada a peça de madeira na que se trabalha
    Sense id: pt-rapaz-gl-noun-omLDwK7w
The following are not (yet) sense-disambiguated

Adjective [Português]

Forms: rapazes [masculine, plural]
  1. que rouba
    Sense id: pt-rapaz-pt-adj-79Lgum7s
The following are not (yet) sense-disambiguated
Synonyms: rapace, rapinante

Noun [Português]

Forms: rapazes [standard, masculine, plural], rapagão [augmentative, masculine, singular], rapagões [augmentative, masculine, plural], rapazelho [diminutive, masculine, singular], rapazote [diminutive, masculine, singular], rapazelhos [diminutive, masculine, plural], rapazotes [diminutive, masculine, plural]
  1. homem jovem
    Sense id: pt-rapaz-pt-noun-tARekyyn
  2. pajem Tags: archaic
    Sense id: pt-rapaz-pt-noun-o6oJhOQs Categories (other): Arcaísmo (Português)
  3. criado, garçom Tags: Brazil
    Sense id: pt-rapaz-pt-noun-jGPfX~xu Categories (other): Português brasileiro
  4. ser humano do gênero masculino
    Sense id: pt-rapaz-pt-noun-sqNzNmer
The following are not (yet) sense-disambiguated
Synonyms (homem jovem): moço Translations (homem jovem): Junge (Alemão), Knabe (Alemão), chico (Espanhol), niño (Espanhol), muchacho (Espanhol), bubo (Esperanto), knabo (Esperanto), garçon (Francês), gosse (Francês), ბიჭი (bitch'i) (Georgiano), νεανίας (Grego Antigo), jongen (Holandês), knaap (Holandês), boy (Inglês), lad (Inglês), ragazzo (Italiano), puer (Latim), anak laki-laki (Malaio), rapaç (Mirandês), moço (Mirandês), gutt (Norueguês Bokmål), gut (Norueguês Nynorsk), gosse (Sueco), pilt (Sueco), pojke (Sueco), mane-oan (Tétum), لڑکا (Urdu)

Inflected forms

{
  "categories": [
    {
      "kind": "other",
      "name": "!Entrada (Português)",
      "parents": [],
      "source": "w"
    },
    {
      "kind": "other",
      "name": "Adjetivo (Português)",
      "parents": [],
      "source": "w"
    },
    {
      "kind": "other",
      "name": "Entrada com etimologia (Português)",
      "parents": [],
      "source": "w"
    },
    {
      "kind": "other",
      "name": "Entrada com pronúncia (Português)",
      "parents": [],
      "source": "w"
    },
    {
      "kind": "other",
      "name": "Entrada de étimo latino (Português)",
      "parents": [],
      "source": "w"
    },
    {
      "kind": "other",
      "name": "Substantivo (Português)",
      "parents": [],
      "source": "w"
    }
  ],
  "etymology_texts": [
    "Do latim rapacem⁽ˡᵃ⁾ (pilhagem)."
  ],
  "forms": [
    {
      "form": "rapazes",
      "tags": [
        "masculine",
        "plural"
      ]
    }
  ],
  "lang": "Português",
  "lang_code": "pt",
  "pos": "adj",
  "pos_title": "Adjetivo",
  "raw_tags": [
    "comum aos dois gêneros"
  ],
  "senses": [
    {
      "glosses": [
        "que rouba"
      ],
      "id": "pt-rapaz-pt-adj-79Lgum7s"
    }
  ],
  "synonyms": [
    {
      "word": "rapace"
    },
    {
      "word": "rapinante"
    }
  ],
  "word": "rapaz"
}

{
  "categories": [
    {
      "kind": "other",
      "name": "!Entrada (Português)",
      "parents": [],
      "source": "w"
    },
    {
      "kind": "other",
      "name": "Adjetivo (Português)",
      "parents": [],
      "source": "w"
    },
    {
      "kind": "other",
      "name": "Entrada com etimologia (Português)",
      "parents": [],
      "source": "w"
    },
    {
      "kind": "other",
      "name": "Entrada com pronúncia (Português)",
      "parents": [],
      "source": "w"
    },
    {
      "kind": "other",
      "name": "Entrada de étimo latino (Português)",
      "parents": [],
      "source": "w"
    },
    {
      "kind": "other",
      "name": "Substantivo (Português)",
      "parents": [],
      "source": "w"
    }
  ],
  "etymology_texts": [
    "Do latim rapacem⁽ˡᵃ⁾ (pilhagem)."
  ],
  "forms": [
    {
      "form": "rapazes",
      "tags": [
        "standard",
        "masculine",
        "plural"
      ]
    },
    {
      "form": "rapagão",
      "tags": [
        "augmentative",
        "masculine",
        "singular"
      ]
    },
    {
      "form": "rapagões",
      "tags": [
        "augmentative",
        "masculine",
        "plural"
      ]
    },
    {
      "form": "rapazelho",
      "tags": [
        "diminutive",
        "masculine",
        "singular"
      ]
    },
    {
      "form": "rapazote",
      "tags": [
        "diminutive",
        "masculine",
        "singular"
      ]
    },
    {
      "form": "rapazelhos",
      "tags": [
        "diminutive",
        "masculine",
        "plural"
      ]
    },
    {
      "form": "rapazotes",
      "tags": [
        "diminutive",
        "masculine",
        "plural"
      ]
    }
  ],
  "lang": "Português",
  "lang_code": "pt",
  "pos": "noun",
  "pos_title": "Substantivo",
  "senses": [
    {
      "glosses": [
        "homem jovem"
      ],
      "id": "pt-rapaz-pt-noun-tARekyyn"
    },
    {
      "categories": [
        {
          "kind": "other",
          "name": "Arcaísmo (Português)",
          "parents": [],
          "source": "w"
        }
      ],
      "glosses": [
        "pajem"
      ],
      "id": "pt-rapaz-pt-noun-o6oJhOQs",
      "tags": [
        "archaic"
      ]
    },
    {
      "categories": [
        {
          "kind": "other",
          "name": "Português brasileiro",
          "parents": [],
          "source": "w"
        }
      ],
      "glosses": [
        "criado, garçom"
      ],
      "id": "pt-rapaz-pt-noun-jGPfX~xu",
      "tags": [
        "Brazil"
      ]
    },
    {
      "glosses": [
        "ser humano do gênero masculino"
      ],
      "id": "pt-rapaz-pt-noun-sqNzNmer"
    }
  ],
  "synonyms": [
    {
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "moço"
    }
  ],
  "tags": [
    "masculine"
  ],
  "translations": [
    {
      "lang": "Alemão",
      "lang_code": "de",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "Junge"
    },
    {
      "lang": "Alemão",
      "lang_code": "de",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "Knabe"
    },
    {
      "lang": "Espanhol",
      "lang_code": "es",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "chico"
    },
    {
      "lang": "Espanhol",
      "lang_code": "es",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "niño"
    },
    {
      "lang": "Espanhol",
      "lang_code": "es",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "muchacho"
    },
    {
      "lang": "Esperanto",
      "lang_code": "eo",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "bubo"
    },
    {
      "lang": "Esperanto",
      "lang_code": "eo",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "knabo"
    },
    {
      "lang": "Francês",
      "lang_code": "fr",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "garçon"
    },
    {
      "lang": "Francês",
      "lang_code": "fr",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "gosse"
    },
    {
      "lang": "Georgiano",
      "lang_code": "ka",
      "roman": "bitch'i",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "ბიჭი"
    },
    {
      "lang": "Grego Antigo",
      "lang_code": "grc",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "νεανίας"
    },
    {
      "lang": "Holandês",
      "lang_code": "nl",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "jongen"
    },
    {
      "lang": "Holandês",
      "lang_code": "nl",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "knaap"
    },
    {
      "lang": "Inglês",
      "lang_code": "en",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "boy"
    },
    {
      "lang": "Inglês",
      "lang_code": "en",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "lad"
    },
    {
      "lang": "Italiano",
      "lang_code": "it",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "ragazzo"
    },
    {
      "lang": "Latim",
      "lang_code": "la",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "puer"
    },
    {
      "lang": "Malaio",
      "lang_code": "ms",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "anak laki-laki"
    },
    {
      "lang": "Mirandês",
      "lang_code": "mwl",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "rapaç"
    },
    {
      "lang": "Mirandês",
      "lang_code": "mwl",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "moço"
    },
    {
      "lang": "Norueguês Bokmål",
      "lang_code": "nb",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "gutt"
    },
    {
      "lang": "Norueguês Nynorsk",
      "lang_code": "nn",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "gut"
    },
    {
      "lang": "Sueco",
      "lang_code": "sv",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "gosse"
    },
    {
      "lang": "Sueco",
      "lang_code": "sv",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "pilt"
    },
    {
      "lang": "Sueco",
      "lang_code": "sv",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "pojke"
    },
    {
      "lang": "Tétum",
      "lang_code": "tet",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "mane-oan"
    },
    {
      "lang": "Urdu",
      "lang_code": "ur",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "لڑکا"
    }
  ],
  "word": "rapaz"
}

{
  "categories": [
    {
      "kind": "other",
      "name": "!Entrada (Galego)",
      "parents": [],
      "source": "w"
    },
    {
      "kind": "other",
      "name": "Adjetivo (Galego)",
      "parents": [],
      "source": "w"
    },
    {
      "kind": "other",
      "name": "Substantivo (Galego)",
      "parents": [],
      "source": "w"
    }
  ],
  "forms": [
    {
      "form": "rapazes",
      "raw_tags": [
        "Comum aos dois\ngéneros/gêneros"
      ],
      "tags": [
        "plural"
      ]
    }
  ],
  "lang": "Galego",
  "lang_code": "gl",
  "pos": "adj",
  "pos_title": "Adjetivo",
  "raw_tags": [
    "comum aos dois gêneros"
  ],
  "senses": [
    {
      "glosses": [
        "rapaz, que rouba"
      ],
      "id": "pt-rapaz-gl-adj-3Oyjry7c"
    }
  ],
  "word": "rapaz"
}

{
  "categories": [
    {
      "kind": "other",
      "name": "!Entrada (Galego)",
      "parents": [],
      "source": "w"
    },
    {
      "kind": "other",
      "name": "Adjetivo (Galego)",
      "parents": [],
      "source": "w"
    },
    {
      "kind": "other",
      "name": "Substantivo (Galego)",
      "parents": [],
      "source": "w"
    }
  ],
  "forms": [
    {
      "form": "rapazes",
      "tags": [
        "masculine",
        "plural"
      ]
    },
    {
      "form": "rapariga",
      "tags": [
        "feminine",
        "singular"
      ]
    },
    {
      "form": "rapaza",
      "tags": [
        "feminine",
        "singular"
      ]
    },
    {
      "form": "raparigas",
      "tags": [
        "feminine",
        "plural"
      ]
    },
    {
      "form": "rapazas",
      "tags": [
        "feminine",
        "plural"
      ]
    }
  ],
  "lang": "Galego",
  "lang_code": "gl",
  "pos": "noun",
  "pos_title": "Substantivo",
  "senses": [
    {
      "glosses": [
        "rapaz, pessoa de dez a catorze anos, jovem"
      ],
      "id": "pt-rapaz-gl-noun-pCzYToiV"
    },
    {
      "categories": [
        {
          "kind": "other",
          "name": "Coloquialismo (Galego)",
          "parents": [],
          "source": "w"
        }
      ],
      "glosses": [
        "namorado"
      ],
      "id": "pt-rapaz-gl-noun-scHXPlQk",
      "tags": [
        "colloquial"
      ]
    },
    {
      "categories": [
        {
          "kind": "other",
          "name": "Náutica (Galego)",
          "parents": [],
          "source": "w"
        }
      ],
      "glosses": [
        "aprendiz de marinheiro"
      ],
      "id": "pt-rapaz-gl-noun--788AJW5",
      "topics": [
        "nautical"
      ]
    },
    {
      "glosses": [
        "grampo, ferramenta de carpinteiro que mantêm apertada e afixada a peça de madeira na que se trabalha"
      ],
      "id": "pt-rapaz-gl-noun-omLDwK7w"
    }
  ],
  "word": "rapaz"
}
{
  "categories": [
    "!Entrada (Galego)",
    "Adjetivo (Galego)",
    "Substantivo (Galego)"
  ],
  "forms": [
    {
      "form": "rapazes",
      "raw_tags": [
        "Comum aos dois\ngéneros/gêneros"
      ],
      "tags": [
        "plural"
      ]
    }
  ],
  "lang": "Galego",
  "lang_code": "gl",
  "pos": "adj",
  "pos_title": "Adjetivo",
  "raw_tags": [
    "comum aos dois gêneros"
  ],
  "senses": [
    {
      "glosses": [
        "rapaz, que rouba"
      ]
    }
  ],
  "word": "rapaz"
}

{
  "categories": [
    "!Entrada (Galego)",
    "Adjetivo (Galego)",
    "Substantivo (Galego)"
  ],
  "forms": [
    {
      "form": "rapazes",
      "tags": [
        "masculine",
        "plural"
      ]
    },
    {
      "form": "rapariga",
      "tags": [
        "feminine",
        "singular"
      ]
    },
    {
      "form": "rapaza",
      "tags": [
        "feminine",
        "singular"
      ]
    },
    {
      "form": "raparigas",
      "tags": [
        "feminine",
        "plural"
      ]
    },
    {
      "form": "rapazas",
      "tags": [
        "feminine",
        "plural"
      ]
    }
  ],
  "lang": "Galego",
  "lang_code": "gl",
  "pos": "noun",
  "pos_title": "Substantivo",
  "senses": [
    {
      "glosses": [
        "rapaz, pessoa de dez a catorze anos, jovem"
      ]
    },
    {
      "categories": [
        "Coloquialismo (Galego)"
      ],
      "glosses": [
        "namorado"
      ],
      "tags": [
        "colloquial"
      ]
    },
    {
      "categories": [
        "Náutica (Galego)"
      ],
      "glosses": [
        "aprendiz de marinheiro"
      ],
      "topics": [
        "nautical"
      ]
    },
    {
      "glosses": [
        "grampo, ferramenta de carpinteiro que mantêm apertada e afixada a peça de madeira na que se trabalha"
      ]
    }
  ],
  "word": "rapaz"
}

{
  "categories": [
    "!Entrada (Português)",
    "Adjetivo (Português)",
    "Entrada com etimologia (Português)",
    "Entrada com pronúncia (Português)",
    "Entrada de étimo latino (Português)",
    "Substantivo (Português)"
  ],
  "etymology_texts": [
    "Do latim rapacem⁽ˡᵃ⁾ (pilhagem)."
  ],
  "forms": [
    {
      "form": "rapazes",
      "tags": [
        "masculine",
        "plural"
      ]
    }
  ],
  "lang": "Português",
  "lang_code": "pt",
  "pos": "adj",
  "pos_title": "Adjetivo",
  "raw_tags": [
    "comum aos dois gêneros"
  ],
  "senses": [
    {
      "glosses": [
        "que rouba"
      ]
    }
  ],
  "synonyms": [
    {
      "word": "rapace"
    },
    {
      "word": "rapinante"
    }
  ],
  "word": "rapaz"
}

{
  "categories": [
    "!Entrada (Português)",
    "Adjetivo (Português)",
    "Entrada com etimologia (Português)",
    "Entrada com pronúncia (Português)",
    "Entrada de étimo latino (Português)",
    "Substantivo (Português)"
  ],
  "etymology_texts": [
    "Do latim rapacem⁽ˡᵃ⁾ (pilhagem)."
  ],
  "forms": [
    {
      "form": "rapazes",
      "tags": [
        "standard",
        "masculine",
        "plural"
      ]
    },
    {
      "form": "rapagão",
      "tags": [
        "augmentative",
        "masculine",
        "singular"
      ]
    },
    {
      "form": "rapagões",
      "tags": [
        "augmentative",
        "masculine",
        "plural"
      ]
    },
    {
      "form": "rapazelho",
      "tags": [
        "diminutive",
        "masculine",
        "singular"
      ]
    },
    {
      "form": "rapazote",
      "tags": [
        "diminutive",
        "masculine",
        "singular"
      ]
    },
    {
      "form": "rapazelhos",
      "tags": [
        "diminutive",
        "masculine",
        "plural"
      ]
    },
    {
      "form": "rapazotes",
      "tags": [
        "diminutive",
        "masculine",
        "plural"
      ]
    }
  ],
  "lang": "Português",
  "lang_code": "pt",
  "pos": "noun",
  "pos_title": "Substantivo",
  "senses": [
    {
      "glosses": [
        "homem jovem"
      ]
    },
    {
      "categories": [
        "Arcaísmo (Português)"
      ],
      "glosses": [
        "pajem"
      ],
      "tags": [
        "archaic"
      ]
    },
    {
      "categories": [
        "Português brasileiro"
      ],
      "glosses": [
        "criado, garçom"
      ],
      "tags": [
        "Brazil"
      ]
    },
    {
      "glosses": [
        "ser humano do gênero masculino"
      ]
    }
  ],
  "synonyms": [
    {
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "moço"
    }
  ],
  "tags": [
    "masculine"
  ],
  "translations": [
    {
      "lang": "Alemão",
      "lang_code": "de",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "Junge"
    },
    {
      "lang": "Alemão",
      "lang_code": "de",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "Knabe"
    },
    {
      "lang": "Espanhol",
      "lang_code": "es",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "chico"
    },
    {
      "lang": "Espanhol",
      "lang_code": "es",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "niño"
    },
    {
      "lang": "Espanhol",
      "lang_code": "es",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "muchacho"
    },
    {
      "lang": "Esperanto",
      "lang_code": "eo",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "bubo"
    },
    {
      "lang": "Esperanto",
      "lang_code": "eo",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "knabo"
    },
    {
      "lang": "Francês",
      "lang_code": "fr",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "garçon"
    },
    {
      "lang": "Francês",
      "lang_code": "fr",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "gosse"
    },
    {
      "lang": "Georgiano",
      "lang_code": "ka",
      "roman": "bitch'i",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "ბიჭი"
    },
    {
      "lang": "Grego Antigo",
      "lang_code": "grc",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "νεανίας"
    },
    {
      "lang": "Holandês",
      "lang_code": "nl",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "jongen"
    },
    {
      "lang": "Holandês",
      "lang_code": "nl",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "knaap"
    },
    {
      "lang": "Inglês",
      "lang_code": "en",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "boy"
    },
    {
      "lang": "Inglês",
      "lang_code": "en",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "lad"
    },
    {
      "lang": "Italiano",
      "lang_code": "it",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "ragazzo"
    },
    {
      "lang": "Latim",
      "lang_code": "la",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "puer"
    },
    {
      "lang": "Malaio",
      "lang_code": "ms",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "anak laki-laki"
    },
    {
      "lang": "Mirandês",
      "lang_code": "mwl",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "rapaç"
    },
    {
      "lang": "Mirandês",
      "lang_code": "mwl",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "moço"
    },
    {
      "lang": "Norueguês Bokmål",
      "lang_code": "nb",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "gutt"
    },
    {
      "lang": "Norueguês Nynorsk",
      "lang_code": "nn",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "gut"
    },
    {
      "lang": "Sueco",
      "lang_code": "sv",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "gosse"
    },
    {
      "lang": "Sueco",
      "lang_code": "sv",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "pilt"
    },
    {
      "lang": "Sueco",
      "lang_code": "sv",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "pojke"
    },
    {
      "lang": "Tétum",
      "lang_code": "tet",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "mane-oan"
    },
    {
      "lang": "Urdu",
      "lang_code": "ur",
      "sense": "homem jovem",
      "sense_index": 1,
      "word": "لڑکا"
    }
  ],
  "word": "rapaz"
}

Download raw JSONL data for rapaz meaning in All languages combined (5.7kB)


This page is a part of the kaikki.org machine-readable All languages combined dictionary. This dictionary is based on structured data extracted on 2025-05-02 from the ptwiktionary dump dated 2025-04-20 using wiktextract (bb9bcd7 and e876143). The data shown on this site has been post-processed and various details (e.g., extra categories) removed, some information disambiguated, and additional data merged from other sources. See the raw data download page for the unprocessed wiktextract data.

If you use this data in academic research, please cite Tatu Ylonen: Wiktextract: Wiktionary as Machine-Readable Structured Data, Proceedings of the 13th Conference on Language Resources and Evaluation (LREC), pp. 1317-1325, Marseille, 20-25 June 2022. Linking to the relevant page(s) under https://kaikki.org would also be greatly appreciated.