Wiktionary data extraction errors and warnings

Inflection check

List of different kinds of inflection tables. When wiktextract parses word heads and tables, it assigns the forms it encounters with tags that describe grammatical or contextual information. The tags and forms that are found in head sections and tables are kept separate from other head section and table tags, and later they are merged with other heads and tables into table types that all contain the same number of word forms with the same tags for those forms.

The information presented here is mostly for debugging, but it can also be used to find interesting word paradigms and to hunt down mistakes, typoes and badly formated Wiktionary entries. A table type that has only a few unique instances is quite likely to contain some kind of minor error in the original data.

Language ⏶ Table forms Errors (% affected words) Language Table forms ⏷ Errors (% affected words)
Slovenský 1 0 (0.00%) čeština 805 0 (0.00%)
abcházština 1 0 (0.00%) němčina 89 0 (0.00%)
admin 1 0 (0.00%) latina 63 0 (0.00%)
adygejština 2 0 (0.00%) řečtina 52 0 (0.00%)
afrikánština 1 0 (0.00%) polština 50 84 (0.38%)
afro-seminolská kreolština 1 0 (0.00%) francouzština 45 854 (0.00%)
akkadština 1 0 (0.00%) švédština 42 94 (0.38%)
albánština 5 38 (12.50%) angličtina 41 46 (20.28%)
alemanština 1 0 (0.00%) ruština 39 18 (0.00%)
aleutština 1 0 (0.00%) slovenština 34 6 (2.32%)
amharština 1 0 (0.00%) irština 32 0 (0.00%)
angličtina 41 46 (20.28%) finština 27 64 (0.00%)
arabština 3 0 (0.00%) staroslověnština 27 34 (2.75%)
aragonština 1 2 (100.00%) srbština 25 312 (1.06%)
aramejština 1 0 (0.00%) japonština 25 136 (2.33%)
arménština 1 0 (0.00%) starořečtina 23 0 (0.00%)
asturština 2 2 (66.67%) žemaitština 22 0 (0.00%)
baskičtina 2 26 (75.00%) litevština 20 26 (0.00%)
bavorština 1 0 (0.00%) italština 19 348 (0.25%)
bengálština 1 0 (0.00%) turečtina 18 0 (0.00%)
benátština 3 0 (0.00%) španělština 17 0 (0.00%)
bosenština 1 0 (0.00%) romština 17 2 (1.38%)
bretonština 1 0 (0.00%) portugalština 16 12 (0.00%)
bulharština 6 0 (0.00%) hornolužická srbština 14 28 (0.09%)
běloruština 3 0 (0.00%) nizozemština 14 14 (0.00%)
chorvatština 13 0 (0.00%) hebrejština 14 500 (19.64%)
dalmátština 1 0 (0.00%) chorvatština 13 0 (0.00%)
dolnolužická srbština 4 4 (0.00%) estonština 13 0 (0.00%)
dánština 7 28 (64.04%) ukrajinština 12 0 (0.00%)
erzja 1 0 (0.00%) slovinština 11 12 (0.00%)
esperanto 10 18 (19.19%) esperanto 10 18 (19.19%)
estonština 13 0 (0.00%) čínština 10 0 (0.00%)
farsí 1 0 (0.00%) staroangličtina 10 0 (0.00%)
finština 27 64 (0.00%) maďarština 9 0 (0.00%)
francouzština 45 854 (0.00%) norština (bokmål) 9 14 (3.12%)
furlanština 1 0 (0.00%) lotyština 8 0 (0.00%)
galicijština 6 4 (0.00%) kašubština 8 0 (0.00%)
gruzínština 1 0 (0.00%) volapük 7 0 (0.00%)
grónština 1 0 (0.00%) dánština 7 28 (64.04%)
guernseyština 2 12 (50.00%) islandština 7 0 (0.00%)
gótština 1 0 (0.00%) klasický nahuatl 7 0 (0.00%)
hakka 1 0 (0.00%) novořečtina 7 0 (0.00%)
hebrejština 14 500 (19.64%) bulharština 6 0 (0.00%)
hindština 1 0 (0.00%) galicijština 6 4 (0.00%)
hornolužická srbština 14 28 (0.09%) ladino 5 0 (0.00%)
ido 3 0 (0.00%) rumunština 5 0 (0.00%)
interlingua 1 0 (0.00%) albánština 5 38 (12.50%)
irština 32 0 (0.00%) katalánština 5 6 (4.48%)
islandština 7 0 (0.00%) okcitánština 5 0 (0.00%)
italština 19 348 (0.25%) srbochorvatština 5 0 (0.00%)
japonština 25 136 (2.33%) ázerbájdžánština 5 0 (0.00%)
jazyk hadza 1 0 (0.00%) skotština 4 0 (0.00%)
jidiš 3 0 (0.00%) dolnolužická srbština 4 4 (0.00%)
jižní min 1 0 (0.00%) ido 3 0 (0.00%)
jižní sotština 1 0 (0.00%) běloruština 3 0 (0.00%)
jorubština 1 0 (0.00%) votština 3 0 (0.00%)
kantonština 1 0 (0.00%) tagalština 3 20 (83.93%)
karakalpačtina 1 0 (0.00%) jidiš 3 0 (0.00%)
karačajsko-balkarština 1 0 (0.00%) velština 3 0 (0.00%)
kastilština 1 0 (0.00%) benátština 3 0 (0.00%)
katalánština 5 6 (4.48%) arabština 3 0 (0.00%)
kazaština 2 0 (0.00%) maltština 3 0 (0.00%)
kašubština 8 0 (0.00%) vietnamština 2 0 (0.00%)
kirundi 1 0 (0.00%) norština (nynorsk) 2 0 (0.00%)
klasický nahuatl 7 0 (0.00%) čuangština 2 0 (0.00%)
komijština 1 0 (0.00%) tagalog 2 8 (92.31%)
korejština 1 0 (0.00%) baskičtina 2 26 (75.00%)
kornština 1 0 (0.00%) asturština 2 2 (66.67%)
korsičtina 2 2 (98.57%) tádžičtina 2 0 (0.00%)
kurdština 2 0 (0.00%) korsičtina 2 2 (98.57%)
ladino 5 0 (0.00%) sicilština 2 0 (0.00%)
lakotština 1 0 (0.00%) perština 2 0 (0.00%)
latgalština 1 0 (0.00%) tuvinština 2 0 (0.00%)
latina 63 0 (0.00%) kazaština 2 0 (0.00%)
limburština 1 0 (0.00%) guernseyština 2 12 (50.00%)
litevština 20 26 (0.00%) stará angličtina 2 0 (0.00%)
livonština 1 0 (0.00%) kurdština 2 0 (0.00%)
lotyština 8 0 (0.00%) adygejština 2 0 (0.00%)
makedonština 1 0 (0.00%) vlámština 2 0 (0.00%)
malajština 1 0 (0.00%) mezijazykové 1 0 (0.00%)
malgaština 1 0 (0.00%) afrikánština 1 0 (0.00%)
maltština 3 0 (0.00%) malgaština 1 0 (0.00%)
manština 1 0 (0.00%) bavorština 1 0 (0.00%)
maďarština 9 0 (0.00%) slezština 1 30 (0.00%)
mezijazykové 1 0 (0.00%) bosenština 1 0 (0.00%)
mokša 1 0 (0.00%) svahilština 1 0 (0.00%)
mongolština 1 0 (0.00%) interlingua 1 0 (0.00%)
moravština 1 0 (0.00%) jorubština 1 0 (0.00%)
nizozemština 14 14 (0.00%) aramejština 1 0 (0.00%)
norština (bokmål) 9 14 (3.12%) aragonština 1 2 (100.00%)
norština (nynorsk) 2 0 (0.00%) bretonština 1 0 (0.00%)
novořečtina 7 0 (0.00%) tašelhit 1 0 (0.00%)
němčina 89 0 (0.00%) somálština 1 0 (0.00%)
okcitánština 5 0 (0.00%) pruština 1 0 (0.00%)
osmanská turečtina 1 0 (0.00%) jižní sotština 1 0 (0.00%)
perština 2 0 (0.00%) turkmenština 1 0 (0.00%)
piemontština 1 0 (0.00%) uzbečtina 1 0 (0.00%)
polština 50 84 (0.38%) makedonština 1 0 (0.00%)
pontská řečtina 1 0 (0.00%) sanskrt 1 0 (0.00%)
portugalština 16 12 (0.00%) čečenština 1 26 (0.00%)
pruština 1 0 (0.00%) malajština 1 0 (0.00%)
pálí 1 0 (0.00%) latgalština 1 0 (0.00%)
rjúkjúština 1 0 (0.00%) piemontština 1 0 (0.00%)
rjúkjúština/okinawština 1 0 (0.00%) telugština 1 0 (0.00%)
romaňolština 1 0 (0.00%) livonština 1 0 (0.00%)
romština 17 2 (1.38%) thajština 1 0 (0.00%)
rumunština 5 0 (0.00%) abcházština 1 0 (0.00%)
ruština 39 18 (0.00%) staroegyptština 1 0 (0.00%)
sanskrt 1 0 (0.00%) staroseverština 1 0 (0.00%)
sater-fríština 1 0 (0.00%) výslovnost 1 0 (0.00%)
sicilština 2 0 (0.00%) arménština 1 0 (0.00%)
skotština 4 0 (0.00%) kantonština 1 0 (0.00%)
slezština 1 30 (0.00%) korejština 1 0 (0.00%)
slovenština 34 6 (2.32%) střední horní němčina 1 0 (0.00%)
slovinština 11 12 (0.00%) jižní min 1 0 (0.00%)
somálština 1 0 (0.00%) mongolština 1 0 (0.00%)
srbochorvatština 5 0 (0.00%) tok pisin 1 0 (0.00%)
srbština 25 312 (1.06%) rjúkjúština 1 0 (0.00%)
staroangličtina 10 0 (0.00%) gruzínština 1 0 (0.00%)
staroegyptština 1 0 (0.00%) limburština 1 0 (0.00%)
staroseverština 1 0 (0.00%) karakalpačtina 1 0 (0.00%)
staroslověnština 27 34 (2.75%) grónština 1 0 (0.00%)
starověká egyptština 1 0 (0.00%) bengálština 1 0 (0.00%)
staročeština 1 0 (0.00%) syrština 1 0 (0.00%)
starořečtina 23 0 (0.00%) aleutština 1 0 (0.00%)
stará angličtina 2 0 (0.00%) gótština 1 0 (0.00%)
střední horní němčina 1 0 (0.00%) hindština 1 0 (0.00%)
středověká angličtina 1 0 (0.00%) starověká egyptština 1 0 (0.00%)
sumerština 1 0 (0.00%) amharština 1 0 (0.00%)
svahilština 1 0 (0.00%) sater-fríština 1 0 (0.00%)
syrština 1 0 (0.00%) vilamovština 1 0 (0.00%)
tagalog 2 8 (92.31%) kirundi 1 0 (0.00%)
tagalština 3 20 (83.93%) čamorština 1 0 (0.00%)
tašelhit 1 0 (0.00%) kornština 1 0 (0.00%)
telugština 1 0 (0.00%) manština 1 0 (0.00%)
thajština 1 0 (0.00%) osmanská turečtina 1 0 (0.00%)
tok pisin 1 0 (0.00%) erzja 1 0 (0.00%)
turečtina 18 0 (0.00%) staročeština 1 0 (0.00%)
turkmenština 1 0 (0.00%) pálí 1 0 (0.00%)
tuvinština 2 0 (0.00%) romaňolština 1 0 (0.00%)
tádžičtina 2 0 (0.00%) hakka 1 0 (0.00%)
ujgurština 1 0 (0.00%) mokša 1 0 (0.00%)
ukazováček 1 0 (0.00%) farsí 1 0 (0.00%)
ukrajinština 12 0 (0.00%) Slovenský 1 0 (0.00%)
urdu 1 0 (0.00%) šorština 1 0 (0.00%)
uzbečtina 1 0 (0.00%) ujgurština 1 0 (0.00%)
velština 3 0 (0.00%) ukazováček 1 0 (0.00%)
vietnamština 2 0 (0.00%) alemanština 1 0 (0.00%)
vilamovština 1 0 (0.00%) dalmátština 1 0 (0.00%)
vlámština 2 0 (0.00%) afro-seminolská kreolština 1 0 (0.00%)
volapük 7 0 (0.00%) lakotština 1 0 (0.00%)
votština 3 0 (0.00%) furlanština 1 0 (0.00%)
výslovnost 1 0 (0.00%) akkadština 1 0 (0.00%)
ázerbájdžánština 5 0 (0.00%) sumerština 1 0 (0.00%)
čamorština 1 0 (0.00%) karačajsko-balkarština 1 0 (0.00%)
čečenština 1 26 (0.00%) urdu 1 0 (0.00%)
čeština 805 0 (0.00%) pontská řečtina 1 0 (0.00%)
čuangština 2 0 (0.00%) středověká angličtina 1 0 (0.00%)
čínština 10 0 (0.00%) komijština 1 0 (0.00%)
řečtina 52 0 (0.00%) jazyk hadza 1 0 (0.00%)
šorština 1 0 (0.00%) moravština 1 0 (0.00%)
španělština 17 0 (0.00%) admin 1 0 (0.00%)
švédština 42 94 (0.38%) rjúkjúština/okinawština 1 0 (0.00%)
žemaitština 22 0 (0.00%) kastilština 1 0 (0.00%)

This page is a part of the kaikki.org machine-readable dictionary. This dictionary is based on structured data extracted on 2025-10-07 from the cswiktionary dump dated 2025-10-01 using wiktextract (19bd8d3 and 1ab82da). The data shown on this site has been post-processed and various details (e.g., extra categories) removed, some information disambiguated, and additional data merged from other sources. See the raw data download page for the unprocessed wiktextract data.

If you use this data in academic research, please cite Tatu Ylonen: Wiktextract: Wiktionary as Machine-Readable Structured Data, Proceedings of the 13th Conference on Language Resources and Evaluation (LREC), pp. 1317-1325, Marseille, 20-25 June 2022. Linking to the relevant page(s) under https://kaikki.org would also be greatly appreciated.