Wiktionary data extraction errors and warnings

Inflection check

List of different kinds of inflection tables. When wiktextract parses word heads and tables, it assigns the forms it encounters with tags that describe grammatical or contextual information. The tags and forms that are found in head sections and tables are kept separate from other head section and table tags, and later they are merged with other heads and tables into table types that all contain the same number of word forms with the same tags for those forms.

The information presented here is mostly for debugging, but it can also be used to find interesting word paradigms and to hunt down mistakes, typoes and badly formated Wiktionary entries. A table type that has only a few unique instances is quite likely to contain some kind of minor error in the original data.

Language ⏶ Table forms Errors (% affected words) Language Table forms ⏷ Errors (% affected words)
Абазинский 1 0 (0.00%) Русский 224 84 (0.03%)
Абхазский 2 0 (0.00%) Украинский 66 10 (0.12%)
Аварский 1 0 (0.00%) Латинский 47 0 (0.00%)
Адыгейский 2 0 (0.00%) Чешский 45 60 (0.00%)
Азербайджанский 5 6 (0.93%) Польский 35 0 (0.00%)
Албанский 4 0 (0.00%) Немецкий 35 34 (13.08%)
Алтайский 2 24 (20.00%) Шведский 31 54 (0.12%)
Амхарский 1 0 (0.00%) Белорусский 28 100 (1.30%)
Английский 16 8 (0.24%) Старославянский 26 4 (0.10%)
Английский (австралийский диалект) 2 0 (0.00%) Татарский 26 832 (24.37%)
Английский (американский) 2 6 (37.50%) Сербский 23 234 (0.07%)
Арабский 3 0 (0.00%) Болгарский 17 0 (0.00%)
Арагонский 1 0 (0.00%) Вепсский 17 1456 (32.49%)
Армянский 7 0 (0.00%) Греческий 17 0 (0.00%)
Астурийский 1 0 (0.00%) Английский 16 8 (0.24%)
Африкаанс 3 14 (0.53%) Исландский 16 0 (0.00%)
Баскский 4 146 (85.93%) Датский 15 30 (4.71%)
Башкирский 7 4 (0.11%) Нидерландский 14 6 (0.00%)
Белорусский 28 100 (1.30%) Русский (дореформенная орфография) 14 110 (23.29%)
Белорусский (тарашкевица) 2 12 (0.00%) Древнегреческий 14 130 (6.25%)
Бенгальский 1 0 (0.00%) Финский 13 26 (1.71%)
Болгарский 17 0 (0.00%) Румынский 13 34 (0.10%)
Боснийский 7 0 (0.00%) Литовский 12 0 (0.00%)
Бретонский 1 0 (0.00%) Готский 12 132 (0.10%)
Будухский 1 0 (0.00%) Цыганский 11 128 (0.89%)
Бурятский 1 0 (0.00%) Французский 10 4 (0.11%)
Валлийский 3 806 (96.18%) Словенский 10 12 (0.00%)
Валлонский 1 0 (0.00%) Латышский 10 0 (0.00%)
Венгерский 4 190 (0.69%) Иврит 9 0 (0.00%)
Венетский 1 0 (0.00%) Норвежский 8 2 (0.09%)
Вепсский 17 1456 (32.49%) Хорватский 8 20 (0.00%)
Верхнелужицкий 2 28 (33.33%) Фарерский 8 32 (0.83%)
Водский 3 84 (0.00%) Суахили 8 42 (25.00%)
Волапюк 2 0 (0.00%) Киргизский 7 12 (0.00%)
Галисийский 1 0 (0.00%) Башкирский 7 4 (0.11%)
Годоберинский 1 0 (0.00%) Боснийский 7 0 (0.00%)
Готский 12 132 (0.10%) Эстонский 7 0 (0.00%)
Греческий 17 0 (0.00%) Словацкий 7 0 (0.00%)
Грузинский 5 8 (0.41%) Турецкий 7 188 (0.19%)
Гэльский (шотландский) 1 0 (0.00%) Древневерхненемецкий 7 0 (0.00%)
Датский 15 30 (4.71%) Армянский 7 0 (0.00%)
Древнеанглийский 5 0 (0.00%) Древнерусский 6 42 (0.00%)
Древнеармянский 1 2 (100.00%) Итальянский 6 4 (0.03%)
Древневерхненемецкий 7 0 (0.00%) Ирландский 6 28 (0.00%)
Древнегреческий 14 130 (6.25%) Узбекский 6 318 (93.61%)
Древнегреческий (аттический) 1 10 (0.00%) Удмуртский 5 210 (28.52%)
Древнегреческий (ионический) 1 10 (0.00%) Казахский 5 0 (0.00%)
Древнерусский 6 42 (0.00%) Церковнославянский 5 0 (0.00%)
Древнесаксонский 1 8 (0.00%) Осетинский 5 0 (0.00%)
Древнескандинавский 1 0 (0.00%) Эсперанто 5 0 (0.00%)
Иврит 9 0 (0.00%) Древнеанглийский 5 0 (0.00%)
Идо 3 0 (0.00%) Азербайджанский 5 6 (0.93%)
Ижорский 1 24 (0.00%) Китайский (Гуаньхуа) 5 0 (0.00%)
Интерлингва 1 0 (0.00%) Карельский 5 120 (56.52%)
Ирландский 6 28 (0.00%) Латгальский 5 2 (30.77%)
Исландский 16 0 (0.00%) Грузинский 5 8 (0.41%)
Испанский 4 0 (0.00%) Туркменский 4 0 (0.00%)
Итальянский 6 4 (0.03%) Испанский 4 0 (0.00%)
Кабардино-черкесский 1 0 (0.00%) Венгерский 4 190 (0.69%)
Казахский 5 0 (0.00%) Албанский 4 0 (0.00%)
Калмыцкий 2 18 (11.94%) Португальский 4 0 (0.00%)
Каннада 1 0 (0.00%) Монгольский 4 42 (3.03%)
Каракалпакский 1 0 (0.00%) Баскский 4 146 (85.93%)
Карачаево-балкарский 1 0 (0.00%) Сербохорватский 4 14 (0.00%)
Карельский 5 120 (56.52%) Нивхский 4 60 (40.00%)
Каталанский 2 0 (0.00%) Таджикский 3 56 (2.30%)
Кашубский 2 0 (0.00%) Македонский 3 74 (100.00%)
Квенья 2 92 (100.00%) Чеченский 3 32 (55.00%)
Киргизский 7 12 (0.00%) Коми-зырянский 3 40 (0.00%)
Китайский (Гуаньхуа) 5 0 (0.00%) Африкаанс 3 14 (0.53%)
Китайский иероглиф 3 2 (25.00%) Нижнелужицкий 3 0 (0.00%)
Коми-зырянский 3 40 (0.00%) Китайский иероглиф 3 2 (25.00%)
Коми-пермяцкий 1 0 (0.00%) Валлийский 3 806 (96.18%)
Корякский 1 0 (0.00%) Идо 3 0 (0.00%)
Крымскотатарский 1 0 (0.00%) Сибирскотатарский 3 30 (50.00%)
Кумыкский 1 0 (0.00%) Хинди 3 18 (28.57%)
Курдский 2 0 (0.00%) Арабский 3 0 (0.00%)
Латгальский 5 2 (30.77%) Водский 3 84 (0.00%)
Латинский 47 0 (0.00%) Малаялам 3 0 (0.00%)
Латышский 10 0 (0.00%) Якутский 2 0 (0.00%)
Лезгинский 1 0 (0.00%) Пали 2 2 (8.49%)
Ливвиковский 1 0 (0.00%) Волапюк 2 0 (0.00%)
Литовский 12 0 (0.00%) Каталанский 2 0 (0.00%)
Луганда 1 0 (0.00%) Старофранцузский 2 8 (0.00%)
Людиковский 1 0 (0.00%) Курдский 2 0 (0.00%)
Люсьен I 1 0 (0.00%) Адыгейский 2 0 (0.00%)
Мадж I 1 0 (0.00%) Верхнелужицкий 2 28 (33.33%)
Македонский 3 74 (100.00%) Ягнобский 2 8 (0.00%)
Малагасийский 1 10 (100.00%) Абхазский 2 0 (0.00%)
Малаялам 3 0 (0.00%) Алтайский 2 24 (20.00%)
Мальтийский 1 0 (0.00%) Калмыцкий 2 18 (11.94%)
Маньчжурский 1 0 (0.00%) Хакасский 2 342 (22.50%)
Мередит I 1 0 (0.00%) Шорский 2 14 (0.00%)
Мишель I 1 0 (0.00%) Английский (американский) 2 6 (37.50%)
Мокшанский 1 0 (0.00%) Словянски 2 0 (0.00%)
Монгольский 4 42 (3.03%) Кашубский 2 0 (0.00%)
Мэй I 1 0 (0.00%) Османский 2 14 (33.33%)
Мэт I 1 0 (0.00%) Белорусский (тарашкевица) 2 12 (0.00%)
Нанайский 1 0 (0.00%) Квенья 2 92 (100.00%)
Немецкий 35 34 (13.08%) Немецкий (швейцарский) 2 0 (0.00%)
Немецкий (австрийский) 1 0 (0.00%) Английский (австралийский диалект) 2 0 (0.00%)
Немецкий (швейцарский) 2 0 (0.00%) Праславянский 2 28 (0.00%)
Ненецкий 1 0 (0.00%) Аварский 1 0 (0.00%)
Нивхский 4 60 (40.00%) Лезгинский 1 0 (0.00%)
Нидерландский 14 6 (0.00%) Мокшанский 1 0 (0.00%)
Нижнелужицкий 3 0 (0.00%) Карачаево-балкарский 1 0 (0.00%)
Ногайский 1 0 (0.00%) Коми-пермяцкий 1 0 (0.00%)
Нол I 1 0 (0.00%) Крымскотатарский 1 0 (0.00%)
Нолл I 1 0 (0.00%) Эвенкийский 1 0 (0.00%)
Норвежский 8 2 (0.09%) Кумыкский 1 0 (0.00%)
Норвежский (букмол) 1 0 (0.00%) Тувинский 1 0 (0.00%)
Норвежский (нюнорск) 1 0 (0.00%) Интерлингва 1 0 (0.00%)
Ноэль I 1 0 (0.00%) Галисийский 1 0 (0.00%)
Обри I 1 0 (0.00%) Чувашский 1 0 (0.00%)
Окситанский 1 0 (0.00%) Древнесаксонский 1 8 (0.00%)
Осетинский 5 0 (0.00%) Русинский 1 0 (0.00%)
Османский 2 14 (33.33%) Словио 1 0 (0.00%)
Пали 2 2 (8.49%) Мальтийский 1 0 (0.00%)
Панджаби 1 0 (0.00%) Кабардино-черкесский 1 0 (0.00%)
Пао 1 0 (0.00%) Древнескандинавский 1 0 (0.00%)
Персидский 1 2 (100.00%) Окситанский 1 0 (0.00%)
Польский 35 0 (0.00%) Фризский 1 0 (0.00%)
Португальский 4 0 (0.00%) Арагонский 1 0 (0.00%)
Португальский (бразильский) 1 0 (0.00%) Астурийский 1 0 (0.00%)
Праславянский 2 28 (0.00%) Сицилийский 1 0 (0.00%)
Пьемонтский 1 0 (0.00%) Бурятский 1 0 (0.00%)
Румынский 13 34 (0.10%) Малагасийский 1 10 (100.00%)
Русинский 1 0 (0.00%) Японский 1 132 (100.00%)
Русский 224 84 (0.03%) Ногайский 1 0 (0.00%)
Русский (дореформенная орфография) 14 110 (23.29%) Гэльский (шотландский) 1 0 (0.00%)
Сербохорватский 4 14 (0.00%) Ненецкий 1 0 (0.00%)
Сербский 23 234 (0.07%) Бретонский 1 0 (0.00%)
Сибирскотатарский 3 30 (50.00%) Пьемонтский 1 0 (0.00%)
Сингальский 1 0 (0.00%) Абазинский 1 0 (0.00%)
Сицилийский 1 0 (0.00%) Хантыйский 1 0 (0.00%)
Словацкий 7 0 (0.00%) Нанайский 1 0 (0.00%)
Словенский 10 12 (0.00%) Ливвиковский 1 0 (0.00%)
Словио 1 0 (0.00%) Людиковский 1 0 (0.00%)
Словянски 2 0 (0.00%) Эве 1 0 (0.00%)
Старославянский 26 4 (0.10%) Норвежский (нюнорск) 1 0 (0.00%)
Старофранцузский 2 8 (0.00%) Древнеармянский 1 2 (100.00%)
Суахили 8 42 (25.00%) Бенгальский 1 0 (0.00%)
Таджикский 3 56 (2.30%) Панджаби 1 0 (0.00%)
Тамильский 1 0 (0.00%) Каракалпакский 1 0 (0.00%)
Татарский 26 832 (24.37%) Ижорский 1 24 (0.00%)
Тейлор II 1 0 (0.00%) Чукотский 1 0 (0.00%)
Тейлор III 1 0 (0.00%) Годоберинский 1 0 (0.00%)
Тибетский 1 0 (0.00%) Персидский 1 2 (100.00%)
Тина I 1 0 (0.00%) Каннада 1 0 (0.00%)
Тувинский 1 0 (0.00%) Валлонский 1 0 (0.00%)
Турецкий 7 188 (0.19%) Норвежский (букмол) 1 0 (0.00%)
Туркменский 4 0 (0.00%) Урду 1 6 (0.00%)
Удмуртский 5 210 (28.52%) Тамильский 1 0 (0.00%)
Узбекский 6 318 (93.61%) Будухский 1 0 (0.00%)
Украинский 66 10 (0.12%) Венетский 1 0 (0.00%)
Урду 1 6 (0.00%) Корякский 1 0 (0.00%)
Фарерский 8 32 (0.83%) Немецкий (австрийский) 1 0 (0.00%)
Финский 13 26 (1.71%) Португальский (бразильский) 1 0 (0.00%)
Флоранс I 1 0 (0.00%) Хирагана 1 2 (100.00%)
Флоренс I 1 0 (0.00%) Луганда 1 0 (0.00%)
Французский 10 4 (0.11%) Ямайский креольский 1 0 (0.00%)
Фризский 1 0 (0.00%) Древнегреческий (ионический) 1 10 (0.00%)
Фрэнсис I 1 0 (0.00%) Древнегреческий (аттический) 1 10 (0.00%)
Хакасский 2 342 (22.50%) Маньчжурский 1 0 (0.00%)
Хантыйский 1 0 (0.00%) Амхарский 1 0 (0.00%)
Хинди 3 18 (28.57%) Мишель I 1 0 (0.00%)
Хирагана 1 2 (100.00%) Сингальский 1 0 (0.00%)
Хорватский 8 20 (0.00%) Тибетский 1 0 (0.00%)
Церковнославянский 5 0 (0.00%) Тина I 1 0 (0.00%)
Цыганский 11 128 (0.89%) Мадж I 1 0 (0.00%)
Чеченский 3 32 (55.00%) Тейлор II 1 0 (0.00%)
Чешский 45 60 (0.00%) Тейлор III 1 0 (0.00%)
Чувашский 1 0 (0.00%) Флоренс I 1 0 (0.00%)
Чукотский 1 0 (0.00%) Шелли I 1 0 (0.00%)
Шведский 31 54 (0.12%) Пао 1 0 (0.00%)
Шелли I 1 0 (0.00%) Нол I 1 0 (0.00%)
Шеннон I 1 0 (0.00%) Мэй I 1 0 (0.00%)
Шорский 2 14 (0.00%) Фрэнсис I 1 0 (0.00%)
Эве 1 0 (0.00%) Шеннон I 1 0 (0.00%)
Эвелин I 1 0 (0.00%) Мередит I 1 0 (0.00%)
Эвенкийский 1 0 (0.00%) Мэт I 1 0 (0.00%)
Эсперанто 5 0 (0.00%) Люсьен I 1 0 (0.00%)
Эстонский 7 0 (0.00%) Нолл I 1 0 (0.00%)
Ягнобский 2 8 (0.00%) Ноэль I 1 0 (0.00%)
Якутский 2 0 (0.00%) Обри I 1 0 (0.00%)
Ямайский креольский 1 0 (0.00%) Флоранс I 1 0 (0.00%)
Японский 1 132 (100.00%) Эвелин I 1 0 (0.00%)

This page is a part of the kaikki.org machine-readable dictionary. This dictionary is based on structured data extracted on 2026-05-05 from the ruwiktionary dump dated 2026-05-01 using wiktextract (f69e205 and 9452535). The data shown on this site has been post-processed and various details (e.g., extra categories) removed, some information disambiguated, and additional data merged from other sources. See the raw data download page for the unprocessed wiktextract data.

If you use this data in academic research, please cite Tatu Ylonen: Wiktextract: Wiktionary as Machine-Readable Structured Data, Proceedings of the 13th Conference on Language Resources and Evaluation (LREC), pp. 1317-1325, Marseille, 20-25 June 2022. Linking to the relevant page(s) under https://kaikki.org would also be greatly appreciated.