Wiktionary data extraction errors and warnings

Inflection check

List of different kinds of inflection tables. When wiktextract parses word heads and tables, it assigns the forms it encounters with tags that describe grammatical or contextual information. The tags and forms that are found in head sections and tables are kept separate from other head section and table tags, and later they are merged with other heads and tables into table types that all contain the same number of word forms with the same tags for those forms.

The information presented here is mostly for debugging, but it can also be used to find interesting word paradigms and to hunt down mistakes, typoes and badly formated Wiktionary entries. A table type that has only a few unique instances is quite likely to contain some kind of minor error in the original data.

Language ⏶ Table forms Errors (% affected words) Language Table forms ⏷ Errors (% affected words)
Абазинский 1 0 (0.00%) Русский 194 114 (0.03%)
Абхазский 2 0 (0.00%) Украинский 47 36 (7.59%)
Аварский 1 0 (0.00%) Латинский 34 0 (0.00%)
Авис I 1 0 (0.00%) Белорусский 24 26 (7.38%)
Адыгейский 2 0 (0.00%) Татарский 21 840 (24.39%)
Азербайджанский 6 6 (0.93%) Польский 19 0 (0.00%)
Албанский 7 0 (0.00%) Английский 18 16 (0.24%)
Алтайский 2 0 (0.00%) Чешский 17 0 (0.00%)
Амхарский 1 0 (0.00%) Немецкий 16 56 (12.20%)
Английский 18 16 (0.24%) Шведский 15 56 (8.07%)
Английский (австралийский диалект) 2 0 (0.00%) Нидерландский 15 12 (35.73%)
Английский (американский) 2 6 (37.50%) Старославянский 14 22 (0.09%)
Арабский 3 0 (0.00%) Финский 12 24 (0.68%)
Арабша 1 0 (0.00%) Вепсский 12 1362 (32.13%)
Арагонский 1 0 (0.00%) Болгарский 11 0 (0.00%)
Армянский 6 0 (0.00%) Датский 10 52 (4.58%)
Астурийский 1 0 (0.00%) Сербский 9 174 (0.07%)
Африкаанс 3 6 (0.60%) Румынский 9 72 (38.93%)
Баскский 3 44 (82.91%) Русский (дореформенная орфография) 9 24 (23.29%)
Башкирский 5 4 (0.11%) Греческий 9 0 (0.00%)
Беверли I 1 0 (0.00%) Албанский 7 0 (0.00%)
Белорусский 24 26 (7.38%) Словацкий 7 0 (0.00%)
Белорусский (тарашкевица) 1 0 (0.00%) Турецкий 7 164 (0.18%)
Бенгальский 1 0 (0.00%) Готский 7 0 (0.00%)
Болгарский 11 0 (0.00%) Итальянский 6 4 (0.03%)
Боснийский 3 0 (0.00%) Норвежский 6 4 (0.10%)
Бретонский 1 0 (0.00%) Французский 6 2 (0.14%)
Будухский 1 0 (0.00%) Фарерский 6 32 (3.33%)
Бурятский 1 0 (0.00%) Латышский 6 0 (0.00%)
Валлийский 3 778 (96.15%) Азербайджанский 6 6 (0.93%)
Валлонский 1 0 (0.00%) Узбекский 6 1058 (99.97%)
Венгерский 4 96 (0.70%) Армянский 6 0 (0.00%)
Венетский 1 0 (0.00%) Древнегреческий 6 0 (0.00%)
Вепсский 12 1362 (32.13%) Древнерусский 5 0 (0.00%)
Верхнелужицкий 2 0 (0.00%) Казахский 5 0 (0.00%)
Водский 1 2 (0.00%) Башкирский 5 4 (0.11%)
Волапюк 2 0 (0.00%) Исландский 5 0 (0.00%)
Галисийский 3 0 (0.00%) Словенский 5 0 (0.00%)
Годоберинский 1 0 (0.00%) Хорватский 5 0 (0.00%)
Готский 7 0 (0.00%) Эстонский 5 0 (0.00%)
Греческий 9 0 (0.00%) Литовский 5 0 (0.00%)
Грузинский 4 6 (0.42%) Церковнославянский 5 0 (0.00%)
Гэльский (шотландский) 1 0 (0.00%) Ирландский 5 4 (0.00%)
Датский 10 52 (4.58%) Древневерхненемецкий 5 0 (0.00%)
Древнеанглийский 2 0 (0.00%) Цыганский 5 0 (0.00%)
Древнеармянский 1 2 (100.00%) Латгальский 5 2 (30.77%)
Древневерхненемецкий 5 0 (0.00%) Киргизский 4 0 (0.00%)
Древнегреческий 6 0 (0.00%) Туркменский 4 0 (0.00%)
Древнегреческий (аттический) 1 0 (0.00%) Венгерский 4 96 (0.70%)
Древнегреческий (ионический) 1 0 (0.00%) Португальский 4 0 (0.00%)
Древнеисландский 1 0 (0.00%) Карельский 4 0 (0.00%)
Древнерусский 5 0 (0.00%) Сербохорватский 4 0 (0.00%)
Древнесаксонский 1 0 (0.00%) Суахили 4 0 (0.00%)
Иврит 3 0 (0.00%) Грузинский 4 6 (0.42%)
Идо 1 0 (0.00%) Таджикский 3 48 (2.35%)
Ижорский 1 2 (0.00%) Македонский 3 10 (33.33%)
Интерлингва 1 0 (0.00%) Удмуртский 3 226 (28.43%)
Ирландский 5 4 (0.00%) Эсперанто 3 0 (0.00%)
Исландский 5 0 (0.00%) Галисийский 3 0 (0.00%)
Испанский 3 0 (0.00%) Испанский 3 0 (0.00%)
Итальянский 6 4 (0.03%) Боснийский 3 0 (0.00%)
Кабардино-черкесский 1 0 (0.00%) Африкаанс 3 6 (0.60%)
Казахский 5 0 (0.00%) Иврит 3 0 (0.00%)
Калмыцкий 2 0 (0.00%) Окситанский 3 0 (0.00%)
Каннада 1 0 (0.00%) Китайский иероглиф 3 6 (25.00%)
Каракалпакский 1 0 (0.00%) Валлийский 3 778 (96.15%)
Карачаево-балкарский 1 0 (0.00%) Монгольский 3 0 (0.00%)
Карельский 4 0 (0.00%) Китайский (Гуаньхуа) 3 0 (0.00%)
Каталанский 2 0 (0.00%) Баскский 3 44 (82.91%)
Кашубский 3 0 (0.00%) Арабский 3 0 (0.00%)
Квенья 1 14 (0.00%) Кашубский 3 0 (0.00%)
Киргизский 4 0 (0.00%) Нивхский 3 0 (0.00%)
Китайский (Гуаньхуа) 3 0 (0.00%) Малаялам 3 0 (0.00%)
Китайский иероглиф 3 6 (25.00%) Чеченский 2 0 (0.00%)
Коми-зырянский 2 240 (91.18%) Якутский 2 12 (0.00%)
Коми-пермяцкий 1 0 (0.00%) Осетинский 2 0 (0.00%)
Констанс I 1 0 (0.00%) Коми-зырянский 2 240 (91.18%)
Кортни I 1 0 (0.00%) Пали 2 2 (9.35%)
Корякский 1 0 (0.00%) Волапюк 2 0 (0.00%)
Кристин I 1 0 (0.00%) Каталанский 2 0 (0.00%)
Кумыкский 1 0 (0.00%) Древнеанглийский 2 0 (0.00%)
Курдский 2 0 (0.00%) Курдский 2 0 (0.00%)
Латгальский 5 2 (30.77%) Мальтийский 2 0 (0.00%)
Латинский 34 0 (0.00%) Адыгейский 2 0 (0.00%)
Латышский 6 0 (0.00%) Верхнелужицкий 2 0 (0.00%)
Лезгинский 1 0 (0.00%) Фризский 2 0 (0.00%)
Ливвиковский 1 0 (0.00%) Нижнелужицкий 2 0 (0.00%)
Лиз II 1 0 (0.00%) Абхазский 2 0 (0.00%)
Литовский 5 0 (0.00%) Алтайский 2 0 (0.00%)
Лоранс I 1 0 (0.00%) Калмыцкий 2 0 (0.00%)
Луганда 1 0 (0.00%) Хакасский 2 0 (0.00%)
Людиковский 1 0 (0.00%) Шорский 2 0 (0.00%)
Люсьен I 1 0 (0.00%) Английский (американский) 2 6 (37.50%)
Мадж I 1 0 (0.00%) Сибирскотатарский 2 0 (0.00%)
Македонский 3 10 (33.33%) Хинди 2 4 (28.57%)
Малагасийский 1 4 (100.00%) Османский 2 2 (33.33%)
Малаялам 3 0 (0.00%) Португальский (бразильский) 2 0 (0.00%)
Мальтийский 2 0 (0.00%) Немецкий (швейцарский) 2 0 (0.00%)
Маньчжурский 1 0 (0.00%) Английский (австралийский диалект) 2 0 (0.00%)
Мег I 1 0 (0.00%) Аварский 1 0 (0.00%)
Мередит I 1 0 (0.00%) Мокшанский 1 0 (0.00%)
Мишель I 1 0 (0.00%) Лезгинский 1 0 (0.00%)
Мокшанский 1 0 (0.00%) Карачаево-балкарский 1 0 (0.00%)
Монгольский 3 0 (0.00%) Коми-пермяцкий 1 0 (0.00%)
Мэй I 1 0 (0.00%) Эвенкийский 1 0 (0.00%)
Мэрион I 1 0 (0.00%) Кумыкский 1 0 (0.00%)
Мэт I 1 0 (0.00%) Тувинский 1 0 (0.00%)
Нанайский 1 0 (0.00%) Интерлингва 1 0 (0.00%)
Нат I 1 0 (0.00%) Старофранцузский 1 0 (0.00%)
Немецкий 16 56 (12.20%) Чувашский 1 0 (0.00%)
Немецкий (австрийский) 1 0 (0.00%) Древнесаксонский 1 0 (0.00%)
Немецкий (швейцарский) 2 0 (0.00%) Словио 1 0 (0.00%)
Ненецкий 1 0 (0.00%) Кабардино-черкесский 1 0 (0.00%)
Нивхский 3 0 (0.00%) Древнеисландский 1 0 (0.00%)
Нидерландский 15 12 (35.73%) Арагонский 1 0 (0.00%)
Нижнелужицкий 2 0 (0.00%) Астурийский 1 0 (0.00%)
Ногайский 1 0 (0.00%) Сицилийский 1 0 (0.00%)
Нол I 1 0 (0.00%) Идо 1 0 (0.00%)
Нолл I 1 0 (0.00%) Бурятский 1 0 (0.00%)
Норвежский 6 4 (0.10%) Малагасийский 1 4 (100.00%)
Норвежский (букмол) 1 0 (0.00%) Японский 1 98 (100.00%)
Норвежский (нюнорск) 1 0 (0.00%) Ногайский 1 0 (0.00%)
Ноэль I 1 0 (0.00%) Гэльский (шотландский) 1 0 (0.00%)
Нэт I 1 0 (0.00%) Ненецкий 1 0 (0.00%)
Обри I 1 0 (0.00%) Бретонский 1 0 (0.00%)
Окситанский 3 0 (0.00%) Пьемонтский 1 0 (0.00%)
Осетинский 2 0 (0.00%) Абазинский 1 0 (0.00%)
Османский 2 2 (33.33%) Хантыйский 1 0 (0.00%)
Пали 2 2 (9.35%) Нанайский 1 0 (0.00%)
Панджаби 1 0 (0.00%) Ливвиковский 1 0 (0.00%)
Пао 1 0 (0.00%) Людиковский 1 0 (0.00%)
Персидский 1 2 (100.00%) Эве 1 0 (0.00%)
Польский 19 0 (0.00%) Словянски 1 0 (0.00%)
Португальский 4 0 (0.00%) Норвежский (нюнорск) 1 0 (0.00%)
Португальский (бразильский) 2 0 (0.00%) Древнеармянский 1 2 (100.00%)
Праславянский 1 0 (0.00%) Бенгальский 1 0 (0.00%)
Пьемонтский 1 0 (0.00%) Панджаби 1 0 (0.00%)
Румынский 9 72 (38.93%) Каракалпакский 1 0 (0.00%)
Русский 194 114 (0.03%) Ижорский 1 2 (0.00%)
Русский (дореформенная орфография) 9 24 (23.29%) Чукотский 1 0 (0.00%)
Сербохорватский 4 0 (0.00%) Годоберинский 1 0 (0.00%)
Сербский 9 174 (0.07%) Водский 1 2 (0.00%)
Сибирскотатарский 2 0 (0.00%) Персидский 1 2 (100.00%)
Сингальский 1 0 (0.00%) Каннада 1 0 (0.00%)
Сицилийский 1 0 (0.00%) Валлонский 1 0 (0.00%)
Словацкий 7 0 (0.00%) Норвежский (букмол) 1 0 (0.00%)
Словенский 5 0 (0.00%) Урду 1 0 (0.00%)
Словио 1 0 (0.00%) Тамильский 1 0 (0.00%)
Словянски 1 0 (0.00%) Будухский 1 0 (0.00%)
Старославянский 14 22 (0.09%) Венетский 1 0 (0.00%)
Старофранцузский 1 0 (0.00%) Корякский 1 0 (0.00%)
Суахили 4 0 (0.00%) Немецкий (австрийский) 1 0 (0.00%)
Таджикский 3 48 (2.35%) Белорусский (тарашкевица) 1 0 (0.00%)
Тамильский 1 0 (0.00%) Хирагана 1 2 (100.00%)
Татарский 21 840 (24.39%) Луганда 1 0 (0.00%)
Тейлор II 1 0 (0.00%) Ямайский креольский 1 0 (0.00%)
Тейлор III 1 0 (0.00%) Квенья 1 14 (0.00%)
Тибетский 1 0 (0.00%) Древнегреческий (ионический) 1 0 (0.00%)
Тина I 1 0 (0.00%) Древнегреческий (аттический) 1 0 (0.00%)
Тувинский 1 0 (0.00%) Маньчжурский 1 0 (0.00%)
Турецкий 7 164 (0.18%) Амхарский 1 0 (0.00%)
Туркменский 4 0 (0.00%) Арабша 1 0 (0.00%)
Удмуртский 3 226 (28.43%) Мишель I 1 0 (0.00%)
Узбекский 6 1058 (99.97%) Сингальский 1 0 (0.00%)
Украинский 47 36 (7.59%) Тибетский 1 0 (0.00%)
Урду 1 0 (0.00%) Праславянский 1 0 (0.00%)
Фарерский 6 32 (3.33%) Тина I 1 0 (0.00%)
Финский 12 24 (0.68%) Мадж I 1 0 (0.00%)
Флоранс I 1 0 (0.00%) Мег I 1 0 (0.00%)
Флоренс I 1 0 (0.00%) Тейлор II 1 0 (0.00%)
Французский 6 2 (0.14%) Тейлор III 1 0 (0.00%)
Фризский 2 0 (0.00%) Флоренс I 1 0 (0.00%)
Фрэнсис I 1 0 (0.00%) Шелли I 1 0 (0.00%)
Хакасский 2 0 (0.00%) Лиз II 1 0 (0.00%)
Хантыйский 1 0 (0.00%) Пао 1 0 (0.00%)
Хинди 2 4 (28.57%) Нол I 1 0 (0.00%)
Хирагана 1 2 (100.00%) Мэй I 1 0 (0.00%)
Хорватский 5 0 (0.00%) Фрэнсис I 1 0 (0.00%)
Хоуп III 1 0 (0.00%) Шеннон I 1 0 (0.00%)
Церковнославянский 5 0 (0.00%) Хоуп III 1 0 (0.00%)
Цыганский 5 0 (0.00%) Констанс I 1 0 (0.00%)
Чеченский 2 0 (0.00%) Беверли I 1 0 (0.00%)
Чешский 17 0 (0.00%) Авис I 1 0 (0.00%)
Чувашский 1 0 (0.00%) Кристин I 1 0 (0.00%)
Чукотский 1 0 (0.00%) Мередит I 1 0 (0.00%)
Шведский 15 56 (8.07%) Мэт I 1 0 (0.00%)
Шелли I 1 0 (0.00%) Люсьен I 1 0 (0.00%)
Шеннон I 1 0 (0.00%) Мэрион I 1 0 (0.00%)
Шорский 2 0 (0.00%) Нолл I 1 0 (0.00%)
Эве 1 0 (0.00%) Ноэль I 1 0 (0.00%)
Эвелин I 1 0 (0.00%) Лоранс I 1 0 (0.00%)
Эвенкийский 1 0 (0.00%) Нэт I 1 0 (0.00%)
Эсперанто 3 0 (0.00%) Нат I 1 0 (0.00%)
Эстонский 5 0 (0.00%) Обри I 1 0 (0.00%)
Якутский 2 12 (0.00%) Флоранс I 1 0 (0.00%)
Ямайский креольский 1 0 (0.00%) Эвелин I 1 0 (0.00%)
Японский 1 98 (100.00%) Кортни I 1 0 (0.00%)

This page is a part of the kaikki.org machine-readable dictionary. This dictionary is based on structured data extracted on 2025-07-19 from the ruwiktionary dump dated 2025-07-02 using wiktextract (45c4a21 and f1c2b61). The data shown on this site has been post-processed and various details (e.g., extra categories) removed, some information disambiguated, and additional data merged from other sources. See the raw data download page for the unprocessed wiktextract data.

If you use this data in academic research, please cite Tatu Ylonen: Wiktextract: Wiktionary as Machine-Readable Structured Data, Proceedings of the 13th Conference on Language Resources and Evaluation (LREC), pp. 1317-1325, Marseille, 20-25 June 2022. Linking to the relevant page(s) under https://kaikki.org would also be greatly appreciated.