Wiktionary data extraction errors and warnings

Inflection check

List of different kinds of inflection tables. When wiktextract parses word heads and tables, it assigns the forms it encounters with tags that describe grammatical or contextual information. The tags and forms that are found in head sections and tables are kept separate from other head section and table tags, and later they are merged with other heads and tables into table types that all contain the same number of word forms with the same tags for those forms.

The information presented here is mostly for debugging, but it can also be used to find interesting word paradigms and to hunt down mistakes, typoes and badly formated Wiktionary entries. A table type that has only a few unique instances is quite likely to contain some kind of minor error in the original data.

Language ⏶ Table forms Errors (% affected words) Language Table forms ⏷ Errors (% affected words)
Slovenský 1 0 (0.00%) čeština 806 0 (0.00%)
abcházština 1 0 (0.00%) němčina 89 0 (0.00%)
admin 1 0 (0.00%) latina 63 0 (0.00%)
adygejština 2 0 (0.00%) francouzština 55 0 (0.00%)
afrikánština 1 0 (0.00%) řečtina 52 0 (0.00%)
afro-seminolská kreolština 1 0 (0.00%) polština 50 84 (0.38%)
akkadština 1 0 (0.00%) angličtina 44 0 (0.00%)
albánština 5 38 (12.50%) švédština 43 74 (0.38%)
alemanština 1 0 (0.00%) ruština 39 18 (0.00%)
aleutština 1 0 (0.00%) slovenština 35 0 (0.00%)
amharština 1 0 (0.00%) irština 32 0 (0.00%)
angličtina 44 0 (0.00%) finština 28 40 (0.00%)
arabština 3 0 (0.00%) staroslověnština 27 28 (2.75%)
aragonština 1 2 (100.00%) srbština 26 360 (0.00%)
aramejština 1 0 (0.00%) japonština 25 136 (2.32%)
arménština 1 0 (0.00%) starořečtina 23 0 (0.00%)
asturština 2 2 (66.67%) žemaitština 22 0 (0.00%)
baskičtina 2 52 (75.00%) litevština 20 26 (0.00%)
bavorština 1 0 (0.00%) italština 19 2 (0.25%)
bengálština 1 0 (0.00%) turečtina 19 0 (0.00%)
benátština 3 0 (0.00%) španělština 18 0 (0.00%)
bosenština 1 0 (0.00%) romština 18 2 (0.46%)
bretonština 1 0 (0.00%) portugalština 17 8 (0.00%)
bulharština 6 0 (0.00%) hornolužická srbština 14 28 (0.09%)
běloruština 3 0 (0.00%) nizozemština 14 10 (0.00%)
chorvatština 13 0 (0.00%) hebrejština 14 474 (19.60%)
dalmátština 1 0 (0.00%) chorvatština 13 0 (0.00%)
dolnolužická srbština 4 4 (0.00%) estonština 13 0 (0.00%)
dánština 7 20 (64.04%) ukrajinština 13 0 (0.00%)
erzja 1 0 (0.00%) slovinština 11 12 (0.00%)
esperanto 10 12 (19.19%) esperanto 10 12 (19.19%)
estonština 13 0 (0.00%) čínština 10 0 (0.00%)
farsí 1 0 (0.00%) staroangličtina 10 0 (0.00%)
finština 28 40 (0.00%) maďarština 9 0 (0.00%)
francouzština 55 0 (0.00%) norština (bokmål) 9 14 (3.12%)
furlanština 1 0 (0.00%) lotyština 8 0 (0.00%)
galicijština 6 2 (0.00%) kašubština 8 0 (0.00%)
gruzínština 1 0 (0.00%) volapük 7 0 (0.00%)
grónština 1 0 (0.00%) dánština 7 20 (64.04%)
guernseyština 2 0 (0.00%) islandština 7 0 (0.00%)
gótština 1 0 (0.00%) klasický nahuatl 7 0 (0.00%)
hakka 1 0 (0.00%) novořečtina 7 0 (0.00%)
hebrejština 14 474 (19.60%) bulharština 6 0 (0.00%)
hindština 1 0 (0.00%) galicijština 6 2 (0.00%)
hornolužická srbština 14 28 (0.09%) ladino 5 0 (0.00%)
ido 3 0 (0.00%) rumunština 5 0 (0.00%)
interlingua 1 0 (0.00%) albánština 5 38 (12.50%)
irština 32 0 (0.00%) katalánština 5 6 (4.48%)
islandština 7 0 (0.00%) okcitánština 5 0 (0.00%)
italština 19 2 (0.25%) srbochorvatština 5 0 (0.00%)
japonština 25 136 (2.32%) ázerbájdžánština 5 0 (0.00%)
jazyk hadza 1 0 (0.00%) skotština 4 0 (0.00%)
jidiš 3 0 (0.00%) dolnolužická srbština 4 4 (0.00%)
jižní min 1 0 (0.00%) ido 3 0 (0.00%)
jižní sotština 1 0 (0.00%) běloruština 3 0 (0.00%)
jorubština 1 0 (0.00%) votština 3 0 (0.00%)
kantonština 1 0 (0.00%) tagalština 3 18 (83.93%)
karakalpačtina 1 0 (0.00%) jidiš 3 0 (0.00%)
karačajsko-balkarština 1 0 (0.00%) velština 3 0 (0.00%)
kastilština 1 0 (0.00%) benátština 3 0 (0.00%)
katalánština 5 6 (4.48%) arabština 3 0 (0.00%)
kazaština 2 0 (0.00%) maltština 3 0 (0.00%)
kašubština 8 0 (0.00%) vietnamština 2 0 (0.00%)
kirundi 1 0 (0.00%) norština (nynorsk) 2 0 (0.00%)
klasický nahuatl 7 0 (0.00%) čuangština 2 0 (0.00%)
komijština 1 0 (0.00%) tagalog 2 8 (92.31%)
korejština 1 0 (0.00%) baskičtina 2 52 (75.00%)
kornština 1 0 (0.00%) asturština 2 2 (66.67%)
korsičtina 2 2 (98.57%) tádžičtina 2 0 (0.00%)
kurdština 2 0 (0.00%) korsičtina 2 2 (98.57%)
ladino 5 0 (0.00%) sicilština 2 0 (0.00%)
lakotština 1 0 (0.00%) perština 2 0 (0.00%)
latgalština 1 0 (0.00%) tuvinština 2 0 (0.00%)
latina 63 0 (0.00%) kazaština 2 0 (0.00%)
limburština 1 0 (0.00%) guernseyština 2 0 (0.00%)
litevština 20 26 (0.00%) stará angličtina 2 0 (0.00%)
livonština 1 0 (0.00%) kurdština 2 0 (0.00%)
lotyština 8 0 (0.00%) adygejština 2 0 (0.00%)
makedonština 1 0 (0.00%) osmanská turečtina 2 0 (0.00%)
malajština 1 0 (0.00%) vlámština 2 0 (0.00%)
malgaština 1 0 (0.00%) mezijazykové 1 0 (0.00%)
maltština 3 0 (0.00%) afrikánština 1 0 (0.00%)
manština 1 0 (0.00%) malgaština 1 0 (0.00%)
maďarština 9 0 (0.00%) bavorština 1 0 (0.00%)
mezijazykové 1 0 (0.00%) slezština 1 30 (0.00%)
mokša 1 0 (0.00%) bosenština 1 0 (0.00%)
mongolština 1 0 (0.00%) svahilština 1 0 (0.00%)
moravština 1 0 (0.00%) interlingua 1 0 (0.00%)
nizozemština 14 10 (0.00%) jorubština 1 0 (0.00%)
norština (bokmål) 9 14 (3.12%) aramejština 1 0 (0.00%)
norština (nynorsk) 2 0 (0.00%) aragonština 1 2 (100.00%)
novořečtina 7 0 (0.00%) bretonština 1 0 (0.00%)
němčina 89 0 (0.00%) tašelhit 1 0 (0.00%)
okcitánština 5 0 (0.00%) somálština 1 0 (0.00%)
osmanská turečtina 2 0 (0.00%) pruština 1 0 (0.00%)
perština 2 0 (0.00%) jižní sotština 1 0 (0.00%)
piemontština 1 0 (0.00%) turkmenština 1 0 (0.00%)
polština 50 84 (0.38%) uzbečtina 1 0 (0.00%)
pontská řečtina 1 0 (0.00%) makedonština 1 0 (0.00%)
portugalština 17 8 (0.00%) sanskrt 1 0 (0.00%)
pruština 1 0 (0.00%) čečenština 1 26 (0.00%)
pálí 1 0 (0.00%) malajština 1 0 (0.00%)
rjúkjúština 1 0 (0.00%) latgalština 1 0 (0.00%)
rjúkjúština/okinawština 1 0 (0.00%) piemontština 1 0 (0.00%)
romaňolština 1 0 (0.00%) telugština 1 0 (0.00%)
romština 18 2 (0.46%) livonština 1 0 (0.00%)
rumunština 5 0 (0.00%) thajština 1 0 (0.00%)
ruština 39 18 (0.00%) abcházština 1 0 (0.00%)
sanskrt 1 0 (0.00%) staroegyptština 1 0 (0.00%)
sater-fríština 1 0 (0.00%) staroseverština 1 0 (0.00%)
sicilština 2 0 (0.00%) výslovnost 1 0 (0.00%)
skotština 4 0 (0.00%) arménština 1 0 (0.00%)
slezština 1 30 (0.00%) kantonština 1 0 (0.00%)
slovenština 35 0 (0.00%) korejština 1 0 (0.00%)
slovinština 11 12 (0.00%) střední horní němčina 1 0 (0.00%)
somálština 1 0 (0.00%) jižní min 1 0 (0.00%)
srbochorvatština 5 0 (0.00%) mongolština 1 0 (0.00%)
srbština 26 360 (0.00%) tok pisin 1 0 (0.00%)
staroangličtina 10 0 (0.00%) rjúkjúština 1 0 (0.00%)
staroegyptština 1 0 (0.00%) gruzínština 1 0 (0.00%)
staroseverština 1 0 (0.00%) limburština 1 0 (0.00%)
staroslověnština 27 28 (2.75%) karakalpačtina 1 0 (0.00%)
starověká egyptština 1 0 (0.00%) tatarština 1 0 (0.00%)
staročeština 1 0 (0.00%) grónština 1 0 (0.00%)
starořečtina 23 0 (0.00%) bengálština 1 0 (0.00%)
stará angličtina 2 0 (0.00%) syrština 1 0 (0.00%)
střední horní němčina 1 0 (0.00%) aleutština 1 0 (0.00%)
středověká angličtina 1 0 (0.00%) gótština 1 0 (0.00%)
sumerština 1 0 (0.00%) hindština 1 0 (0.00%)
svahilština 1 0 (0.00%) starověká egyptština 1 0 (0.00%)
syrština 1 0 (0.00%) amharština 1 0 (0.00%)
tagalog 2 8 (92.31%) sater-fríština 1 0 (0.00%)
tagalština 3 18 (83.93%) vilamovština 1 0 (0.00%)
tatarština 1 0 (0.00%) kirundi 1 0 (0.00%)
tašelhit 1 0 (0.00%) čamorština 1 0 (0.00%)
telugština 1 0 (0.00%) kornština 1 0 (0.00%)
thajština 1 0 (0.00%) manština 1 0 (0.00%)
tok pisin 1 0 (0.00%) erzja 1 0 (0.00%)
turečtina 19 0 (0.00%) staročeština 1 0 (0.00%)
turkmenština 1 0 (0.00%) pálí 1 0 (0.00%)
tuvinština 2 0 (0.00%) romaňolština 1 0 (0.00%)
tádžičtina 2 0 (0.00%) hakka 1 0 (0.00%)
ujgurština 1 0 (0.00%) mokša 1 0 (0.00%)
ukazováček 1 0 (0.00%) farsí 1 0 (0.00%)
ukrajinština 13 0 (0.00%) Slovenský 1 0 (0.00%)
urdu 1 0 (0.00%) šorština 1 0 (0.00%)
uzbečtina 1 0 (0.00%) ujgurština 1 0 (0.00%)
velština 3 0 (0.00%) ukazováček 1 0 (0.00%)
vietnamština 2 0 (0.00%) alemanština 1 0 (0.00%)
vilamovština 1 0 (0.00%) dalmátština 1 0 (0.00%)
vlámština 2 0 (0.00%) afro-seminolská kreolština 1 0 (0.00%)
volapük 7 0 (0.00%) lakotština 1 0 (0.00%)
votština 3 0 (0.00%) furlanština 1 0 (0.00%)
výslovnost 1 0 (0.00%) akkadština 1 0 (0.00%)
ázerbájdžánština 5 0 (0.00%) sumerština 1 0 (0.00%)
čamorština 1 0 (0.00%) karačajsko-balkarština 1 0 (0.00%)
čečenština 1 26 (0.00%) urdu 1 0 (0.00%)
čeština 806 0 (0.00%) pontská řečtina 1 0 (0.00%)
čuangština 2 0 (0.00%) středověká angličtina 1 0 (0.00%)
čínština 10 0 (0.00%) komijština 1 0 (0.00%)
řečtina 52 0 (0.00%) jazyk hadza 1 0 (0.00%)
šorština 1 0 (0.00%) moravština 1 0 (0.00%)
španělština 18 0 (0.00%) admin 1 0 (0.00%)
švédština 43 74 (0.38%) rjúkjúština/okinawština 1 0 (0.00%)
žemaitština 22 0 (0.00%) kastilština 1 0 (0.00%)

This page is a part of the kaikki.org machine-readable dictionary. This dictionary is based on structured data extracted on 2025-10-28 from the cswiktionary dump dated 2025-10-20 using wiktextract (b9d36ff and 0a198a9). The data shown on this site has been post-processed and various details (e.g., extra categories) removed, some information disambiguated, and additional data merged from other sources. See the raw data download page for the unprocessed wiktextract data.

If you use this data in academic research, please cite Tatu Ylonen: Wiktextract: Wiktionary as Machine-Readable Structured Data, Proceedings of the 13th Conference on Language Resources and Evaluation (LREC), pp. 1317-1325, Marseille, 20-25 June 2022. Linking to the relevant page(s) under https://kaikki.org would also be greatly appreciated.