Wiktionary data extraction errors and warnings

Inflection check

List of different kinds of inflection tables. When wiktextract parses word heads and tables, it assigns the forms it encounters with tags that describe grammatical or contextual information. The tags and forms that are found in head sections and tables are kept separate from other head section and table tags, and later they are merged with other heads and tables into table types that all contain the same number of word forms with the same tags for those forms.

The information presented here is mostly for debugging, but it can also be used to find interesting word paradigms and to hunt down mistakes, typoes and badly formated Wiktionary entries. A table type that has only a few unique instances is quite likely to contain some kind of minor error in the original data.

Language ⏶ Table forms Errors (% affected words) Language Table forms ⏷ Errors (% affected words)
Slovenský 1 0 (0.00%) čeština 816 0 (0.00%)
abcházština 1 0 (0.00%) němčina 91 0 (0.00%)
admin 1 0 (0.00%) latina 63 0 (0.00%)
adygejština 2 0 (0.00%) francouzština 55 0 (0.00%)
afrikánština 1 0 (0.00%) řečtina 53 0 (0.00%)
afro-seminolská kreolština 1 0 (0.00%) polština 48 84 (0.38%)
akkadština 1 0 (0.00%) švédština 46 0 (0.00%)
albánština 5 38 (11.11%) angličtina 44 0 (0.00%)
alemanština 1 0 (0.00%) ruština 39 18 (0.00%)
aleutština 1 0 (0.00%) slovenština 35 0 (0.00%)
amharština 1 0 (0.00%) irština 32 0 (0.00%)
angličtina 44 0 (0.00%) finština 28 32 (0.00%)
arabština 3 0 (0.00%) staroslověnština 27 26 (2.75%)
aragonština 1 2 (100.00%) srbština 26 360 (0.00%)
aramejština 1 0 (0.00%) japonština 23 46 (2.26%)
arménština 1 0 (0.00%) starořečtina 23 0 (0.00%)
asturština 2 2 (66.67%) žemaitština 22 0 (0.00%)
baskičtina 2 26 (75.00%) litevština 20 26 (0.00%)
bavorština 1 0 (0.00%) španělština 19 0 (0.00%)
bengálština 1 0 (0.00%) turečtina 19 0 (0.00%)
benátština 3 0 (0.00%) italština 18 2 (0.25%)
bosenština 1 0 (0.00%) portugalština 18 8 (0.00%)
bretonština 1 0 (0.00%) romština 18 2 (0.46%)
bulharština 6 0 (0.00%) nizozemština 17 10 (0.00%)
běloruština 3 0 (0.00%) hornolužická srbština 14 28 (0.09%)
chorvatština 13 0 (0.00%) hebrejština 14 484 (17.27%)
dalmátština 1 0 (0.00%) chorvatština 13 0 (0.00%)
dolnolužická srbština 4 4 (0.00%) estonština 13 0 (0.00%)
dánština 8 12 (64.04%) ukrajinština 13 0 (0.00%)
erzja 1 0 (0.00%) slovinština 11 12 (0.00%)
esperanto 10 12 (19.19%) esperanto 10 12 (19.19%)
estonština 13 0 (0.00%) čínština 10 0 (0.00%)
farsí 1 0 (0.00%) staroangličtina 10 0 (0.00%)
finština 28 32 (0.00%) maďarština 9 0 (0.00%)
francouzština 55 0 (0.00%) norština (bokmål) 9 14 (3.12%)
furlanština 1 0 (0.00%) dánština 8 12 (64.04%)
galicijština 7 2 (0.00%) lotyština 8 0 (0.00%)
gruzínština 1 0 (0.00%) kašubština 8 0 (0.00%)
grónština 1 0 (0.00%) volapük 7 0 (0.00%)
guernseyština 2 0 (0.00%) galicijština 7 2 (0.00%)
gótština 1 0 (0.00%) islandština 7 0 (0.00%)
hakka 1 0 (0.00%) klasický nahuatl 7 0 (0.00%)
hebrejština 14 484 (17.27%) novořečtina 7 0 (0.00%)
hindština 1 0 (0.00%) bulharština 6 0 (0.00%)
hornolužická srbština 14 28 (0.09%) okcitánština 6 0 (0.00%)
ido 3 0 (0.00%) ladino 5 0 (0.00%)
interlingua 1 0 (0.00%) rumunština 5 0 (0.00%)
irština 32 0 (0.00%) albánština 5 38 (11.11%)
islandština 7 0 (0.00%) katalánština 5 6 (4.44%)
italština 18 2 (0.25%) srbochorvatština 5 0 (0.00%)
japonština 23 46 (2.26%) ázerbájdžánština 5 0 (0.00%)
jazyk 1 0 (0.00%) skotština 4 0 (0.00%)
jazyk hadza 1 0 (0.00%) dolnolužická srbština 4 4 (0.00%)
jidiš 3 0 (0.00%) ido 3 0 (0.00%)
jižní min 1 0 (0.00%) běloruština 3 0 (0.00%)
jižní sotština 1 0 (0.00%) votština 3 0 (0.00%)
jorubština 1 0 (0.00%) tagalština 3 18 (83.93%)
kantonština 1 0 (0.00%) jidiš 3 0 (0.00%)
karakalpačtina 1 0 (0.00%) velština 3 0 (0.00%)
karačajsko-balkarština 1 0 (0.00%) benátština 3 0 (0.00%)
kastilština 1 0 (0.00%) arabština 3 0 (0.00%)
katalánština 5 6 (4.44%) maltština 3 0 (0.00%)
kazaština 2 0 (0.00%) vietnamština 2 0 (0.00%)
kašubština 8 0 (0.00%) norština (nynorsk) 2 0 (0.00%)
kirundi 1 0 (0.00%) čuangština 2 0 (0.00%)
klasický nahuatl 7 0 (0.00%) tagalog 2 8 (85.71%)
komijština 1 0 (0.00%) baskičtina 2 26 (75.00%)
korejština 1 0 (0.00%) asturština 2 2 (66.67%)
kornština 1 0 (0.00%) tádžičtina 2 0 (0.00%)
korsičtina 2 2 (98.59%) korsičtina 2 2 (98.59%)
kurdština 2 0 (0.00%) sicilština 2 0 (0.00%)
ladino 5 0 (0.00%) perština 2 0 (0.00%)
lakotština 1 0 (0.00%) tuvinština 2 0 (0.00%)
latgalština 1 0 (0.00%) kazaština 2 0 (0.00%)
latina 63 0 (0.00%) guernseyština 2 0 (0.00%)
limburština 1 0 (0.00%) stará angličtina 2 0 (0.00%)
litevština 20 26 (0.00%) kurdština 2 0 (0.00%)
livonština 1 0 (0.00%) adygejština 2 0 (0.00%)
lotyština 8 0 (0.00%) osmanská turečtina 2 0 (0.00%)
makedonština 1 0 (0.00%) vlámština 2 0 (0.00%)
malajština 1 0 (0.00%) mezijazykové 1 0 (0.00%)
malgaština 1 0 (0.00%) afrikánština 1 0 (0.00%)
maltština 3 0 (0.00%) malgaština 1 0 (0.00%)
manština 1 0 (0.00%) bavorština 1 0 (0.00%)
maďarština 9 0 (0.00%) slezština 1 30 (0.00%)
mezijazykové 1 0 (0.00%) bosenština 1 0 (0.00%)
mokša 1 0 (0.00%) svahilština 1 0 (0.00%)
mongolština 1 0 (0.00%) interlingua 1 0 (0.00%)
moravština 1 0 (0.00%) jorubština 1 0 (0.00%)
nizozemština 17 10 (0.00%) aramejština 1 0 (0.00%)
norština (bokmål) 9 14 (3.12%) aragonština 1 2 (100.00%)
norština (nynorsk) 2 0 (0.00%) bretonština 1 0 (0.00%)
novořečtina 7 0 (0.00%) tašelhit 1 0 (0.00%)
němčina 91 0 (0.00%) somálština 1 0 (0.00%)
okcitánština 6 0 (0.00%) pruština 1 0 (0.00%)
osmanská turečtina 2 0 (0.00%) jižní sotština 1 0 (0.00%)
perština 2 0 (0.00%) turkmenština 1 0 (0.00%)
piemontština 1 0 (0.00%) uzbečtina 1 0 (0.00%)
polština 48 84 (0.38%) makedonština 1 0 (0.00%)
pontská řečtina 1 0 (0.00%) sanskrt 1 0 (0.00%)
portugalština 18 8 (0.00%) čečenština 1 26 (0.00%)
pruština 1 0 (0.00%) malajština 1 0 (0.00%)
pálí 1 0 (0.00%) latgalština 1 0 (0.00%)
rjúkjúština 1 0 (0.00%) piemontština 1 0 (0.00%)
rjúkjúština/okinawština 1 0 (0.00%) telugština 1 0 (0.00%)
romaňolština 1 0 (0.00%) livonština 1 0 (0.00%)
romština 18 2 (0.46%) thajština 1 0 (0.00%)
rumunština 5 0 (0.00%) abcházština 1 0 (0.00%)
ruština 39 18 (0.00%) staroegyptština 1 0 (0.00%)
sanskrt 1 0 (0.00%) staroseverština 1 0 (0.00%)
sater-fríština 1 0 (0.00%) výslovnost 1 0 (0.00%)
sicilština 2 0 (0.00%) arménština 1 0 (0.00%)
skotština 4 0 (0.00%) kantonština 1 0 (0.00%)
slezština 1 30 (0.00%) korejština 1 0 (0.00%)
slovenština 35 0 (0.00%) střední horní němčina 1 0 (0.00%)
slovinština 11 12 (0.00%) jižní min 1 0 (0.00%)
somálština 1 0 (0.00%) mongolština 1 0 (0.00%)
srbochorvatština 5 0 (0.00%) tok pisin 1 0 (0.00%)
srbština 26 360 (0.00%) rjúkjúština 1 0 (0.00%)
staroangličtina 10 0 (0.00%) gruzínština 1 0 (0.00%)
staroegyptština 1 0 (0.00%) limburština 1 0 (0.00%)
staroseverština 1 0 (0.00%) karakalpačtina 1 0 (0.00%)
staroslověnština 27 26 (2.75%) tatarština 1 0 (0.00%)
starověká egyptština 1 0 (0.00%) grónština 1 0 (0.00%)
staročeština 1 0 (0.00%) bengálština 1 0 (0.00%)
starořečtina 23 0 (0.00%) syrština 1 0 (0.00%)
stará angličtina 2 0 (0.00%) aleutština 1 0 (0.00%)
střední horní němčina 1 0 (0.00%) gótština 1 0 (0.00%)
středověká angličtina 1 0 (0.00%) hindština 1 0 (0.00%)
sumerština 1 0 (0.00%) starověká egyptština 1 0 (0.00%)
svahilština 1 0 (0.00%) amharština 1 0 (0.00%)
syrština 1 0 (0.00%) sater-fríština 1 0 (0.00%)
tagalog 2 8 (85.71%) vilamovština 1 0 (0.00%)
tagalština 3 18 (83.93%) kirundi 1 0 (0.00%)
tatarština 1 0 (0.00%) čamorština 1 0 (0.00%)
tašelhit 1 0 (0.00%) kornština 1 0 (0.00%)
telugština 1 0 (0.00%) manština 1 0 (0.00%)
thajština 1 0 (0.00%) erzja 1 0 (0.00%)
tok pisin 1 0 (0.00%) staročeština 1 0 (0.00%)
turečtina 19 0 (0.00%) pálí 1 0 (0.00%)
turkmenština 1 0 (0.00%) romaňolština 1 0 (0.00%)
tuvinština 2 0 (0.00%) hakka 1 0 (0.00%)
tádžičtina 2 0 (0.00%) mokša 1 0 (0.00%)
ujgurština 1 0 (0.00%) farsí 1 0 (0.00%)
ukazováček 1 0 (0.00%) Slovenský 1 0 (0.00%)
ukrajinština 13 0 (0.00%) šorština 1 0 (0.00%)
urdu 1 0 (0.00%) ujgurština 1 0 (0.00%)
uzbečtina 1 0 (0.00%) ukazováček 1 0 (0.00%)
velština 3 0 (0.00%) alemanština 1 0 (0.00%)
vietnamština 2 0 (0.00%) dalmátština 1 0 (0.00%)
vilamovština 1 0 (0.00%) afro-seminolská kreolština 1 0 (0.00%)
vlámština 2 0 (0.00%) lakotština 1 0 (0.00%)
volapük 7 0 (0.00%) furlanština 1 0 (0.00%)
votština 3 0 (0.00%) akkadština 1 0 (0.00%)
výslovnost 1 0 (0.00%) sumerština 1 0 (0.00%)
ázerbájdžánština 5 0 (0.00%) karačajsko-balkarština 1 0 (0.00%)
čamorština 1 0 (0.00%) urdu 1 0 (0.00%)
čečenština 1 26 (0.00%) pontská řečtina 1 0 (0.00%)
čeština 816 0 (0.00%) středověká angličtina 1 0 (0.00%)
čuangština 2 0 (0.00%) jazyk 1 0 (0.00%)
čínština 10 0 (0.00%) komijština 1 0 (0.00%)
řečtina 53 0 (0.00%) jazyk hadza 1 0 (0.00%)
šorština 1 0 (0.00%) moravština 1 0 (0.00%)
španělština 19 0 (0.00%) admin 1 0 (0.00%)
švédština 46 0 (0.00%) rjúkjúština/okinawština 1 0 (0.00%)
žemaitština 22 0 (0.00%) kastilština 1 0 (0.00%)

This page is a part of the kaikki.org machine-readable dictionary. This dictionary is based on structured data extracted on 2025-11-21 from the cswiktionary dump dated 2025-11-01 using wiktextract (2f66b98 and a050b89). The data shown on this site has been post-processed and various details (e.g., extra categories) removed, some information disambiguated, and additional data merged from other sources. See the raw data download page for the unprocessed wiktextract data.

If you use this data in academic research, please cite Tatu Ylonen: Wiktextract: Wiktionary as Machine-Readable Structured Data, Proceedings of the 13th Conference on Language Resources and Evaluation (LREC), pp. 1317-1325, Marseille, 20-25 June 2022. Linking to the relevant page(s) under https://kaikki.org would also be greatly appreciated.