Wiktionary data extraction errors and warnings

Inflection check

List of different kinds of inflection tables. When wiktextract parses word heads and tables, it assigns the forms it encounters with tags that describe grammatical or contextual information. The tags and forms that are found in head sections and tables are kept separate from other head section and table tags, and later they are merged with other heads and tables into table types that all contain the same number of word forms with the same tags for those forms.

The information presented here is mostly for debugging, but it can also be used to find interesting word paradigms and to hunt down mistakes, typoes and badly formated Wiktionary entries. A table type that has only a few unique instances is quite likely to contain some kind of minor error in the original data.

Language ⏶ Table forms Errors (% affected words) Language Table forms ⏷ Errors (% affected words)
Абазинский 1 0 (0.00%) Русский 253 80 (0.03%)
Абхазский 2 0 (0.00%) Латинский 47 0 (0.00%)
Аварский 1 0 (0.00%) Чешский 45 60 (0.00%)
Авис I 1 0 (0.00%) Польский 35 0 (0.00%)
Адыгейский 2 0 (0.00%) Украинский 34 8 (0.03%)
Азербайджанский 5 6 (0.93%) Немецкий 34 38 (13.03%)
Албанский 4 0 (0.00%) Шведский 29 56 (0.12%)
Алтайский 2 24 (20.00%) Старославянский 26 4 (0.10%)
Амхарский 1 0 (0.00%) Татарский 26 832 (24.37%)
Английский 16 8 (0.24%) Сербский 23 234 (0.07%)
Английский (австралийский диалект) 2 0 (0.00%) Белорусский 21 164 (2.87%)
Английский (американский) 2 6 (37.50%) Болгарский 17 0 (0.00%)
Арабский 3 0 (0.00%) Вепсский 17 1456 (32.23%)
Арагонский 1 0 (0.00%) Греческий 17 0 (0.00%)
Армянский 7 0 (0.00%) Английский 16 8 (0.24%)
Астурийский 1 0 (0.00%) Исландский 16 0 (0.00%)
Африкаанс 3 14 (0.57%) Датский 14 48 (4.74%)
Баскский 4 146 (85.93%) Нидерландский 14 6 (0.00%)
Башкирский 7 22 (0.11%) Русский (дореформенная орфография) 14 110 (23.45%)
Беверли I 1 0 (0.00%) Финский 13 26 (1.71%)
Белорусский 21 164 (2.87%) Румынский 13 34 (0.10%)
Белорусский (тарашкевица) 2 12 (0.00%) Древнегреческий 13 110 (6.47%)
Бенгальский 1 0 (0.00%) Литовский 12 0 (0.00%)
Болгарский 17 0 (0.00%) Готский 12 132 (0.10%)
Боснийский 7 0 (0.00%) Цыганский 11 128 (0.89%)
Бретонский 1 0 (0.00%) Словенский 10 12 (0.00%)
Будухский 1 0 (0.00%) Латышский 10 0 (0.00%)
Бурятский 1 0 (0.00%) Французский 9 4 (0.11%)
Валлийский 3 790 (96.18%) Иврит 9 0 (0.00%)
Валлонский 1 0 (0.00%) Норвежский 8 18 (0.10%)
Венгерский 4 190 (0.71%) Хорватский 8 20 (0.00%)
Венетский 1 0 (0.00%) Фарерский 8 32 (0.83%)
Вепсский 17 1456 (32.23%) Суахили 8 42 (25.00%)
Верхнелужицкий 3 42 (66.67%) Киргизский 7 22 (0.00%)
Водский 3 84 (0.00%) Башкирский 7 22 (0.11%)
Волапюк 2 0 (0.00%) Боснийский 7 0 (0.00%)
Галисийский 1 0 (0.00%) Эстонский 7 0 (0.00%)
Годоберинский 1 0 (0.00%) Словацкий 7 0 (0.00%)
Готский 12 132 (0.10%) Турецкий 7 188 (0.19%)
Греческий 17 0 (0.00%) Армянский 7 0 (0.00%)
Грузинский 5 8 (0.42%) Древнерусский 6 42 (0.00%)
Гэльский (шотландский) 1 0 (0.00%) Итальянский 6 4 (0.03%)
Датский 14 48 (4.74%) Ирландский 6 28 (0.00%)
Древнеанглийский 5 0 (0.00%) Древневерхненемецкий 6 48 (4.11%)
Древнеармянский 1 2 (100.00%) Узбекский 6 326 (93.75%)
Древневерхненемецкий 6 48 (4.11%) Удмуртский 5 272 (28.43%)
Древнегреческий 13 110 (6.47%) Казахский 5 0 (0.00%)
Древнегреческий (аттический) 1 10 (0.00%) Церковнославянский 5 0 (0.00%)
Древнегреческий (ионический) 1 10 (0.00%) Осетинский 5 0 (0.00%)
Древнеисландский 1 0 (0.00%) Эсперанто 5 0 (0.00%)
Древнерусский 6 42 (0.00%) Древнеанглийский 5 0 (0.00%)
Древнесаксонский 1 8 (0.00%) Азербайджанский 5 6 (0.93%)
Иврит 9 0 (0.00%) Карельский 5 120 (56.52%)
Идо 3 0 (0.00%) Латгальский 5 2 (30.77%)
Ижорский 1 24 (0.00%) Грузинский 5 8 (0.42%)
Интерлингва 1 0 (0.00%) Туркменский 4 0 (0.00%)
Ирландский 6 28 (0.00%) Испанский 4 0 (0.00%)
Исландский 16 0 (0.00%) Венгерский 4 190 (0.71%)
Испанский 4 0 (0.00%) Албанский 4 0 (0.00%)
Итальянский 6 4 (0.03%) Португальский 4 0 (0.00%)
Кабардино-черкесский 1 0 (0.00%) Монгольский 4 42 (3.03%)
Казахский 5 0 (0.00%) Китайский (Гуаньхуа) 4 0 (0.00%)
Калмыцкий 2 18 (11.94%) Баскский 4 146 (85.93%)
Каннада 1 0 (0.00%) Сербохорватский 4 14 (0.00%)
Каракалпакский 1 0 (0.00%) Нивхский 4 60 (40.00%)
Карачаево-балкарский 1 0 (0.00%) Таджикский 3 56 (2.30%)
Карельский 5 120 (56.52%) Македонский 3 68 (100.00%)
Каталанский 2 0 (0.00%) Чеченский 3 32 (55.00%)
Кашубский 2 0 (0.00%) Коми-зырянский 3 40 (0.00%)
Квенья 2 92 (100.00%) Африкаанс 3 14 (0.57%)
Киргизский 7 22 (0.00%) Верхнелужицкий 3 42 (66.67%)
Китайский (Гуаньхуа) 4 0 (0.00%) Нижнелужицкий 3 0 (0.00%)
Китайский иероглиф 3 2 (25.00%) Китайский иероглиф 3 2 (25.00%)
Коми-зырянский 3 40 (0.00%) Валлийский 3 790 (96.18%)
Коми-пермяцкий 1 0 (0.00%) Идо 3 0 (0.00%)
Констанс I 1 0 (0.00%) Сибирскотатарский 3 30 (50.00%)
Кортни I 1 0 (0.00%) Хинди 3 18 (28.57%)
Корякский 1 0 (0.00%) Арабский 3 0 (0.00%)
Кристин I 1 0 (0.00%) Водский 3 84 (0.00%)
Кумыкский 1 20 (0.00%) Малаялам 3 0 (0.00%)
Курдский 2 0 (0.00%) Якутский 2 0 (0.00%)
Латгальский 5 2 (30.77%) Пали 2 18 (8.49%)
Латинский 47 0 (0.00%) Волапюк 2 0 (0.00%)
Латышский 10 0 (0.00%) Каталанский 2 0 (0.00%)
Лезгинский 1 0 (0.00%) Старофранцузский 2 8 (0.00%)
Ливвиковский 1 0 (0.00%) Курдский 2 0 (0.00%)
Литовский 12 0 (0.00%) Адыгейский 2 0 (0.00%)
Лоранс I 1 0 (0.00%) Ягнобский 2 8 (0.00%)
Луганда 1 0 (0.00%) Абхазский 2 0 (0.00%)
Людиковский 1 0 (0.00%) Алтайский 2 24 (20.00%)
Люсьен I 1 0 (0.00%) Калмыцкий 2 18 (11.94%)
Мадж I 1 0 (0.00%) Хакасский 2 342 (22.50%)
Македонский 3 68 (100.00%) Шорский 2 14 (0.00%)
Малагасийский 1 10 (100.00%) Английский (американский) 2 6 (37.50%)
Малаялам 3 0 (0.00%) Словянски 2 0 (0.00%)
Мальтийский 1 0 (0.00%) Кашубский 2 0 (0.00%)
Маньчжурский 1 0 (0.00%) Османский 2 14 (33.33%)
Мередит I 1 0 (0.00%) Белорусский (тарашкевица) 2 12 (0.00%)
Мишель I 1 0 (0.00%) Квенья 2 92 (100.00%)
Мокшанский 1 0 (0.00%) Немецкий (швейцарский) 2 0 (0.00%)
Монгольский 4 42 (3.03%) Английский (австралийский диалект) 2 0 (0.00%)
Мэй I 1 0 (0.00%) Праславянский 2 28 (0.00%)
Мэрион I 1 0 (0.00%) Аварский 1 0 (0.00%)
Мэт I 1 0 (0.00%) Лезгинский 1 0 (0.00%)
Нанайский 1 0 (0.00%) Мокшанский 1 0 (0.00%)
Немецкий 34 38 (13.03%) Карачаево-балкарский 1 0 (0.00%)
Немецкий (австрийский) 1 0 (0.00%) Коми-пермяцкий 1 0 (0.00%)
Немецкий (швейцарский) 2 0 (0.00%) Эвенкийский 1 0 (0.00%)
Ненецкий 1 0 (0.00%) Кумыкский 1 20 (0.00%)
Нивхский 4 60 (40.00%) Тувинский 1 0 (0.00%)
Нидерландский 14 6 (0.00%) Интерлингва 1 0 (0.00%)
Нижнелужицкий 3 0 (0.00%) Галисийский 1 0 (0.00%)
Ногайский 1 0 (0.00%) Чувашский 1 0 (0.00%)
Нол I 1 0 (0.00%) Древнесаксонский 1 8 (0.00%)
Нолл I 1 0 (0.00%) Словио 1 0 (0.00%)
Норвежский 8 18 (0.10%) Мальтийский 1 0 (0.00%)
Норвежский (букмол) 1 0 (0.00%) Кабардино-черкесский 1 0 (0.00%)
Норвежский (нюнорск) 1 0 (0.00%) Древнеисландский 1 0 (0.00%)
Ноэль I 1 0 (0.00%) Окситанский 1 0 (0.00%)
Нэт I 1 0 (0.00%) Фризский 1 0 (0.00%)
Обри I 1 0 (0.00%) Арагонский 1 0 (0.00%)
Окситанский 1 0 (0.00%) Астурийский 1 0 (0.00%)
Осетинский 5 0 (0.00%) Сицилийский 1 0 (0.00%)
Османский 2 14 (33.33%) Бурятский 1 0 (0.00%)
Пали 2 18 (8.49%) Малагасийский 1 10 (100.00%)
Панджаби 1 0 (0.00%) Японский 1 2 (100.00%)
Пао 1 0 (0.00%) Ногайский 1 0 (0.00%)
Персидский 1 2 (100.00%) Гэльский (шотландский) 1 0 (0.00%)
Польский 35 0 (0.00%) Ненецкий 1 0 (0.00%)
Португальский 4 0 (0.00%) Бретонский 1 0 (0.00%)
Португальский (бразильский) 1 0 (0.00%) Пьемонтский 1 0 (0.00%)
Праславянский 2 28 (0.00%) Абазинский 1 0 (0.00%)
Пьемонтский 1 0 (0.00%) Хантыйский 1 0 (0.00%)
Румынский 13 34 (0.10%) Нанайский 1 0 (0.00%)
Русский 253 80 (0.03%) Ливвиковский 1 0 (0.00%)
Русский (дореформенная орфография) 14 110 (23.45%) Людиковский 1 0 (0.00%)
Сербохорватский 4 14 (0.00%) Эве 1 0 (0.00%)
Сербский 23 234 (0.07%) Норвежский (нюнорск) 1 0 (0.00%)
Сибирскотатарский 3 30 (50.00%) Древнеармянский 1 2 (100.00%)
Сингальский 1 0 (0.00%) Бенгальский 1 0 (0.00%)
Сицилийский 1 0 (0.00%) Панджаби 1 0 (0.00%)
Словацкий 7 0 (0.00%) Каракалпакский 1 0 (0.00%)
Словенский 10 12 (0.00%) Ижорский 1 24 (0.00%)
Словио 1 0 (0.00%) Чукотский 1 0 (0.00%)
Словянски 2 0 (0.00%) Годоберинский 1 0 (0.00%)
Старославянский 26 4 (0.10%) Персидский 1 2 (100.00%)
Старофранцузский 2 8 (0.00%) Каннада 1 0 (0.00%)
Суахили 8 42 (25.00%) Валлонский 1 0 (0.00%)
Таджикский 3 56 (2.30%) Норвежский (букмол) 1 0 (0.00%)
Тамильский 1 0 (0.00%) Урду 1 6 (0.00%)
Татарский 26 832 (24.37%) Тамильский 1 0 (0.00%)
Тейлор II 1 0 (0.00%) Будухский 1 0 (0.00%)
Тейлор III 1 0 (0.00%) Венетский 1 0 (0.00%)
Тибетский 1 0 (0.00%) Корякский 1 0 (0.00%)
Тина I 1 0 (0.00%) Немецкий (австрийский) 1 0 (0.00%)
Тувинский 1 0 (0.00%) Португальский (бразильский) 1 0 (0.00%)
Турецкий 7 188 (0.19%) Хирагана 1 2 (100.00%)
Туркменский 4 0 (0.00%) Луганда 1 0 (0.00%)
Удмуртский 5 272 (28.43%) Ямайский креольский 1 0 (0.00%)
Узбекский 6 326 (93.75%) Древнегреческий (ионический) 1 10 (0.00%)
Украинский 34 8 (0.03%) Древнегреческий (аттический) 1 10 (0.00%)
Урду 1 6 (0.00%) Маньчжурский 1 0 (0.00%)
Фарерский 8 32 (0.83%) Амхарский 1 0 (0.00%)
Финский 13 26 (1.71%) Мишель I 1 0 (0.00%)
Флоранс I 1 0 (0.00%) Сингальский 1 0 (0.00%)
Флоренс I 1 0 (0.00%) Тибетский 1 0 (0.00%)
Французский 9 4 (0.11%) Тина I 1 0 (0.00%)
Фризский 1 0 (0.00%) Мадж I 1 0 (0.00%)
Фрэнсис I 1 0 (0.00%) Тейлор II 1 0 (0.00%)
Хакасский 2 342 (22.50%) Тейлор III 1 0 (0.00%)
Хантыйский 1 0 (0.00%) Флоренс I 1 0 (0.00%)
Хинди 3 18 (28.57%) Шелли I 1 0 (0.00%)
Хирагана 1 2 (100.00%) Пао 1 0 (0.00%)
Хорватский 8 20 (0.00%) Нол I 1 0 (0.00%)
Церковнославянский 5 0 (0.00%) Мэй I 1 0 (0.00%)
Цыганский 11 128 (0.89%) Фрэнсис I 1 0 (0.00%)
Чеченский 3 32 (55.00%) Шеннон I 1 0 (0.00%)
Чешский 45 60 (0.00%) Констанс I 1 0 (0.00%)
Чувашский 1 0 (0.00%) Беверли I 1 0 (0.00%)
Чукотский 1 0 (0.00%) Авис I 1 0 (0.00%)
Шведский 29 56 (0.12%) Кристин I 1 0 (0.00%)
Шелли I 1 0 (0.00%) Мередит I 1 0 (0.00%)
Шеннон I 1 0 (0.00%) Мэт I 1 0 (0.00%)
Шорский 2 14 (0.00%) Люсьен I 1 0 (0.00%)
Эве 1 0 (0.00%) Мэрион I 1 0 (0.00%)
Эвелин I 1 0 (0.00%) Нолл I 1 0 (0.00%)
Эвенкийский 1 0 (0.00%) Ноэль I 1 0 (0.00%)
Эсперанто 5 0 (0.00%) Лоранс I 1 0 (0.00%)
Эстонский 7 0 (0.00%) Нэт I 1 0 (0.00%)
Ягнобский 2 8 (0.00%) Обри I 1 0 (0.00%)
Якутский 2 0 (0.00%) Флоранс I 1 0 (0.00%)
Ямайский креольский 1 0 (0.00%) Эвелин I 1 0 (0.00%)
Японский 1 2 (100.00%) Кортни I 1 0 (0.00%)

This page is a part of the kaikki.org machine-readable dictionary. This dictionary is based on structured data extracted on 2026-01-09 from the ruwiktionary dump dated 2026-01-02 using wiktextract (96027d6 and 9905b1f). The data shown on this site has been post-processed and various details (e.g., extra categories) removed, some information disambiguated, and additional data merged from other sources. See the raw data download page for the unprocessed wiktextract data.

If you use this data in academic research, please cite Tatu Ylonen: Wiktextract: Wiktionary as Machine-Readable Structured Data, Proceedings of the 13th Conference on Language Resources and Evaluation (LREC), pp. 1317-1325, Marseille, 20-25 June 2022. Linking to the relevant page(s) under https://kaikki.org would also be greatly appreciated.