Wiktionary data extraction errors and warnings

Inflection check

List of different kinds of inflection tables. When wiktextract parses word heads and tables, it assigns the forms it encounters with tags that describe grammatical or contextual information. The tags and forms that are found in head sections and tables are kept separate from other head section and table tags, and later they are merged with other heads and tables into table types that all contain the same number of word forms with the same tags for those forms.

The information presented here is mostly for debugging, but it can also be used to find interesting word paradigms and to hunt down mistakes, typoes and badly formated Wiktionary entries. A table type that has only a few unique instances is quite likely to contain some kind of minor error in the original data.

Language ⏶ Table forms Errors (% affected words) Language Table forms ⏷ Errors (% affected words)
Slovenský 1 0 (0.00%) čeština 827 0 (0.00%)
abcházština 1 0 (0.00%) němčina 91 0 (0.00%)
admin 1 0 (0.00%) latina 63 0 (0.00%)
adygejština 2 0 (0.00%) francouzština 55 0 (0.00%)
afrikánština 1 0 (0.00%) řečtina 53 0 (0.00%)
afro-seminolská kreolština 1 0 (0.00%) polština 48 84 (0.37%)
ainština 1 0 (0.00%) švédština 46 0 (0.00%)
akkadština 1 0 (0.00%) angličtina 44 0 (0.00%)
albánština 6 38 (15.15%) ruština 39 18 (0.00%)
alemanština 1 0 (0.00%) slovenština 35 0 (0.00%)
aleutština 1 0 (0.00%) irština 32 0 (0.00%)
amharština 1 0 (0.00%) finština 28 32 (0.00%)
angličtina 44 0 (0.00%) staroslověnština 27 26 (2.75%)
arabština 3 0 (0.00%) srbština 26 360 (0.00%)
aragonština 1 2 (100.00%) japonština 24 46 (2.27%)
aramejština 1 0 (0.00%) starořečtina 23 0 (0.00%)
arménština 1 0 (0.00%) žemaitština 22 0 (0.00%)
asturština 2 2 (66.67%) litevština 20 26 (0.00%)
baskičtina 2 26 (75.00%) španělština 19 0 (0.00%)
bavorština 1 0 (0.00%) italština 19 2 (0.25%)
bengálština 1 0 (0.00%) turečtina 19 0 (0.00%)
benátština 3 0 (0.00%) portugalština 18 8 (0.00%)
bosenština 1 0 (0.00%) romština 18 2 (0.46%)
bretonština 1 0 (0.00%) nizozemština 18 14 (0.00%)
bulharština 7 0 (0.00%) estonština 16 0 (0.00%)
běloruština 3 0 (0.00%) hornolužická srbština 14 28 (0.09%)
chorvatština 13 0 (0.00%) ukrajinština 14 0 (0.00%)
dalmátština 1 0 (0.00%) hebrejština 14 450 (17.21%)
dolnolužická srbština 4 4 (0.00%) chorvatština 13 0 (0.00%)
dánština 8 20 (64.04%) slovinština 11 12 (0.00%)
erzja 1 0 (0.00%) esperanto 10 12 (19.08%)
esperanto 10 12 (19.08%) čínština 10 0 (0.00%)
estonština 16 0 (0.00%) staroangličtina 10 0 (0.00%)
farsí 1 0 (0.00%) maďarština 9 0 (0.00%)
finština 28 32 (0.00%) norština (bokmål) 9 14 (3.12%)
francouzština 55 0 (0.00%) dánština 8 20 (64.04%)
furlanština 1 0 (0.00%) lotyština 8 0 (0.00%)
galicijština 7 2 (0.00%) kašubština 8 0 (0.00%)
garífuna 1 0 (0.00%) volapük 7 0 (0.00%)
gruzínština 1 0 (0.00%) bulharština 7 0 (0.00%)
grónština 1 0 (0.00%) galicijština 7 2 (0.00%)
guernseyština 2 0 (0.00%) islandština 7 0 (0.00%)
gótština 1 0 (0.00%) klasický nahuatl 7 0 (0.00%)
hakka 1 0 (0.00%) novořečtina 7 0 (0.00%)
hebrejština 14 450 (17.21%) albánština 6 38 (15.15%)
hindština 1 0 (0.00%) okcitánština 6 0 (0.00%)
hornolužická srbština 14 28 (0.09%) ladino 5 0 (0.00%)
ido 3 0 (0.00%) rumunština 5 0 (0.00%)
interlingua 1 0 (0.00%) katalánština 5 6 (4.38%)
irština 32 0 (0.00%) srbochorvatština 5 0 (0.00%)
islandština 7 0 (0.00%) ázerbájdžánština 5 0 (0.00%)
italština 19 2 (0.25%) votština 4 0 (0.00%)
japonština 24 46 (2.27%) skotština 4 0 (0.00%)
jazyk 1 0 (0.00%) dolnolužická srbština 4 4 (0.00%)
jazyk hadza 1 0 (0.00%) ido 3 0 (0.00%)
jidiš 3 0 (0.00%) běloruština 3 0 (0.00%)
jižní min 1 0 (0.00%) tagalština 3 20 (83.93%)
jižní sotština 1 0 (0.00%) jidiš 3 0 (0.00%)
jorubština 1 0 (0.00%) velština 3 0 (0.00%)
kantonština 1 0 (0.00%) benátština 3 0 (0.00%)
karakalpačtina 1 0 (0.00%) arabština 3 0 (0.00%)
karačajsko-balkarština 1 0 (0.00%) maltština 3 0 (0.00%)
kastilština 1 0 (0.00%) vietnamština 2 0 (0.00%)
katalánština 5 6 (4.38%) norština (nynorsk) 2 0 (0.00%)
kazaština 2 0 (0.00%) čuangština 2 0 (0.00%)
kašubština 8 0 (0.00%) tagalog 2 12 (85.71%)
kirundi 1 0 (0.00%) baskičtina 2 26 (75.00%)
klasický nahuatl 7 0 (0.00%) asturština 2 2 (66.67%)
komijština 1 0 (0.00%) tádžičtina 2 0 (0.00%)
korejština 1 0 (0.00%) korsičtina 2 2 (98.59%)
kornština 1 0 (0.00%) sicilština 2 0 (0.00%)
korsičtina 2 2 (98.59%) perština 2 0 (0.00%)
kurdština 2 0 (0.00%) tuvinština 2 0 (0.00%)
ladino 5 0 (0.00%) kazaština 2 0 (0.00%)
lakotština 1 0 (0.00%) guernseyština 2 0 (0.00%)
latgalština 1 0 (0.00%) stará angličtina 2 0 (0.00%)
latina 63 0 (0.00%) kurdština 2 0 (0.00%)
limburština 1 0 (0.00%) adygejština 2 0 (0.00%)
litevština 20 26 (0.00%) osmanská turečtina 2 0 (0.00%)
livonština 1 0 (0.00%) vlámština 2 0 (0.00%)
lotyština 8 0 (0.00%) mezijazykové 1 0 (0.00%)
makedonština 1 0 (0.00%) afrikánština 1 0 (0.00%)
malajština 1 0 (0.00%) malgaština 1 0 (0.00%)
malgaština 1 0 (0.00%) bavorština 1 0 (0.00%)
maltština 3 0 (0.00%) slezština 1 30 (0.00%)
manština 1 0 (0.00%) bosenština 1 0 (0.00%)
maďarština 9 0 (0.00%) svahilština 1 0 (0.00%)
mezijazykové 1 0 (0.00%) ainština 1 0 (0.00%)
mokša 1 0 (0.00%) interlingua 1 0 (0.00%)
mongolština 1 0 (0.00%) jorubština 1 0 (0.00%)
moravština 1 0 (0.00%) aramejština 1 0 (0.00%)
nizozemština 18 14 (0.00%) aragonština 1 2 (100.00%)
norština (bokmål) 9 14 (3.12%) bretonština 1 0 (0.00%)
norština (nynorsk) 2 0 (0.00%) tašelhit 1 0 (0.00%)
novořečtina 7 0 (0.00%) somálština 1 0 (0.00%)
němčina 91 0 (0.00%) pruština 1 0 (0.00%)
okcitánština 6 0 (0.00%) jižní sotština 1 0 (0.00%)
osmanská turečtina 2 0 (0.00%) turkmenština 1 0 (0.00%)
perština 2 0 (0.00%) uzbečtina 1 0 (0.00%)
piemontština 1 0 (0.00%) makedonština 1 0 (0.00%)
polština 48 84 (0.37%) sanskrt 1 0 (0.00%)
pontská řečtina 1 0 (0.00%) čečenština 1 26 (0.00%)
portugalština 18 8 (0.00%) malajština 1 0 (0.00%)
pruština 1 0 (0.00%) latgalština 1 0 (0.00%)
pálí 1 0 (0.00%) piemontština 1 0 (0.00%)
rjúkjúština 1 0 (0.00%) telugština 1 0 (0.00%)
rjúkjúština/okinawština 1 0 (0.00%) livonština 1 0 (0.00%)
romaňolština 1 0 (0.00%) thajština 1 0 (0.00%)
romština 18 2 (0.46%) abcházština 1 0 (0.00%)
rumunština 5 0 (0.00%) staroegyptština 1 0 (0.00%)
ruština 39 18 (0.00%) sundština 1 0 (0.00%)
sanskrt 1 0 (0.00%) staroseverština 1 0 (0.00%)
sater-fríština 1 0 (0.00%) arménština 1 0 (0.00%)
sicilština 2 0 (0.00%) kantonština 1 0 (0.00%)
skotština 4 0 (0.00%) korejština 1 0 (0.00%)
slezština 1 30 (0.00%) střední horní němčina 1 0 (0.00%)
slovenština 35 0 (0.00%) jižní min 1 0 (0.00%)
slovinština 11 12 (0.00%) mongolština 1 0 (0.00%)
somálština 1 0 (0.00%) tok pisin 1 0 (0.00%)
srbochorvatština 5 0 (0.00%) rjúkjúština 1 0 (0.00%)
srbština 26 360 (0.00%) gruzínština 1 0 (0.00%)
staroangličtina 10 0 (0.00%) limburština 1 0 (0.00%)
staroegyptština 1 0 (0.00%) karakalpačtina 1 0 (0.00%)
staroseverština 1 0 (0.00%) tatarština 1 0 (0.00%)
staroslověnština 27 26 (2.75%) grónština 1 0 (0.00%)
starověká egyptština 1 0 (0.00%) bengálština 1 0 (0.00%)
staročeština 1 0 (0.00%) garífuna 1 0 (0.00%)
starořečtina 23 0 (0.00%) syrština 1 0 (0.00%)
stará angličtina 2 0 (0.00%) aleutština 1 0 (0.00%)
střední horní němčina 1 0 (0.00%) gótština 1 0 (0.00%)
středověká angličtina 1 0 (0.00%) hindština 1 0 (0.00%)
sumerština 1 0 (0.00%) starověká egyptština 1 0 (0.00%)
sundština 1 0 (0.00%) amharština 1 0 (0.00%)
svahilština 1 0 (0.00%) sater-fríština 1 0 (0.00%)
syrština 1 0 (0.00%) vilamovština 1 0 (0.00%)
tagalog 2 12 (85.71%) kirundi 1 0 (0.00%)
tagalština 3 20 (83.93%) čamorština 1 0 (0.00%)
tatarština 1 0 (0.00%) kornština 1 0 (0.00%)
tašelhit 1 0 (0.00%) manština 1 0 (0.00%)
telugština 1 0 (0.00%) erzja 1 0 (0.00%)
thajština 1 0 (0.00%) staročeština 1 0 (0.00%)
tok pisin 1 0 (0.00%) pálí 1 0 (0.00%)
turečtina 19 0 (0.00%) romaňolština 1 0 (0.00%)
turkmenština 1 0 (0.00%) hakka 1 0 (0.00%)
tuvinština 2 0 (0.00%) mokša 1 0 (0.00%)
tádžičtina 2 0 (0.00%) farsí 1 0 (0.00%)
ujgurština 1 0 (0.00%) Slovenský 1 0 (0.00%)
ukazováček 1 0 (0.00%) šorština 1 0 (0.00%)
ukrajinština 14 0 (0.00%) ujgurština 1 0 (0.00%)
urdu 1 0 (0.00%) ukazováček 1 0 (0.00%)
uzbečtina 1 0 (0.00%) alemanština 1 0 (0.00%)
velština 3 0 (0.00%) dalmátština 1 0 (0.00%)
vietnamština 2 0 (0.00%) afro-seminolská kreolština 1 0 (0.00%)
vilamovština 1 0 (0.00%) lakotština 1 0 (0.00%)
vlámština 2 0 (0.00%) furlanština 1 0 (0.00%)
volapük 7 0 (0.00%) akkadština 1 0 (0.00%)
votština 4 0 (0.00%) sumerština 1 0 (0.00%)
wiradjuri 1 0 (0.00%) karačajsko-balkarština 1 0 (0.00%)
ázerbájdžánština 5 0 (0.00%) urdu 1 0 (0.00%)
čamorština 1 0 (0.00%) pontská řečtina 1 0 (0.00%)
čečenština 1 26 (0.00%) středověká angličtina 1 0 (0.00%)
čeština 827 0 (0.00%) jazyk 1 0 (0.00%)
čuangština 2 0 (0.00%) komijština 1 0 (0.00%)
čínština 10 0 (0.00%) jazyk hadza 1 0 (0.00%)
řečtina 53 0 (0.00%) moravština 1 0 (0.00%)
šorština 1 0 (0.00%) admin 1 0 (0.00%)
španělština 19 0 (0.00%) rjúkjúština/okinawština 1 0 (0.00%)
švédština 46 0 (0.00%) kastilština 1 0 (0.00%)
žemaitština 22 0 (0.00%) wiradjuri 1 0 (0.00%)

This page is a part of the kaikki.org machine-readable dictionary. This dictionary is based on structured data extracted on 2026-03-11 from the cswiktionary dump dated 2026-03-01 using wiktextract (602557e and 59dc20b). The data shown on this site has been post-processed and various details (e.g., extra categories) removed, some information disambiguated, and additional data merged from other sources. See the raw data download page for the unprocessed wiktextract data.

If you use this data in academic research, please cite Tatu Ylonen: Wiktextract: Wiktionary as Machine-Readable Structured Data, Proceedings of the 13th Conference on Language Resources and Evaluation (LREC), pp. 1317-1325, Marseille, 20-25 June 2022. Linking to the relevant page(s) under https://kaikki.org would also be greatly appreciated.