Wiktionary data extraction errors and warnings

Inflection check

List of different kinds of inflection tables. When wiktextract parses word heads and tables, it assigns the forms it encounters with tags that describe grammatical or contextual information. The tags and forms that are found in head sections and tables are kept separate from other head section and table tags, and later they are merged with other heads and tables into table types that all contain the same number of word forms with the same tags for those forms.

The information presented here is mostly for debugging, but it can also be used to find interesting word paradigms and to hunt down mistakes, typoes and badly formated Wiktionary entries. A table type that has only a few unique instances is quite likely to contain some kind of minor error in the original data.

Language ⏶ Table forms Errors (% affected words) Language Table forms ⏷ Errors (% affected words)
Абазинский 1 0 (0.00%) Русский 152 96 (0.03%)
Абхазский 2 0 (0.00%) Украинский 45 54 (7.65%)
Аварский 1 0 (0.00%) Латинский 34 0 (0.00%)
Авис I 1 0 (0.00%) Белорусский 23 24 (1.50%)
Адыгейский 2 0 (0.00%) Татарский 21 840 (24.38%)
Азербайджанский 6 6 (0.93%) Польский 19 0 (0.00%)
Албанский 7 4 (0.52%) Английский 18 20 (5.07%)
Алтайский 2 0 (0.00%) Чешский 17 0 (0.00%)
Амхарский 1 0 (0.00%) Немецкий 16 56 (12.39%)
Английский 18 20 (5.07%) Шведский 15 56 (8.06%)
Английский (австралийский диалект) 2 0 (0.00%) Нидерландский 15 12 (35.62%)
Английский (американский) 2 6 (37.50%) Старославянский 14 22 (0.09%)
Арабский 3 0 (0.00%) Финский 12 24 (0.68%)
Арагонский 1 4 (100.00%) Вепсский 12 1362 (32.13%)
Армянский 6 0 (0.00%) Болгарский 11 0 (0.00%)
Астурийский 1 0 (0.00%) Датский 10 52 (4.58%)
Африкаанс 2 10 (100.00%) Русский (дореформенная орфография) 10 14 (23.78%)
Баскский 3 44 (82.91%) Сербский 9 174 (0.07%)
Башкирский 5 4 (0.11%) Румынский 9 72 (38.84%)
Беверли I 1 0 (0.00%) Греческий 9 0 (0.00%)
Белорусский 23 24 (1.50%) Албанский 7 4 (0.52%)
Белорусский (тарашкевица) 1 0 (0.00%) Словацкий 7 0 (0.00%)
Бенгальский 1 0 (0.00%) Турецкий 7 164 (0.18%)
Болгарский 11 0 (0.00%) Иврит 7 0 (0.00%)
Боснийский 3 0 (0.00%) Готский 7 0 (0.00%)
Бретонский 2 4 (85.42%) Норвежский 6 4 (0.10%)
Будухский 1 0 (0.00%) Французский 6 6 (0.42%)
Бурятский 1 0 (0.00%) Фарерский 6 32 (3.33%)
Валлийский 3 788 (96.15%) Эстонский 6 4 (23.66%)
Валлонский 1 0 (0.00%) Латышский 6 0 (0.00%)
Венгерский 3 100 (96.83%) Азербайджанский 6 6 (0.93%)
Венетский 1 0 (0.00%) Узбекский 6 876 (99.97%)
Вепсский 12 1362 (32.13%) Армянский 6 0 (0.00%)
Верхнелужицкий 2 0 (0.00%) Древнегреческий 6 0 (0.00%)
Водский 1 2 (0.00%) Древнерусский 5 0 (0.00%)
Волапюк 2 0 (0.00%) Казахский 5 0 (0.00%)
Галисийский 2 4 (99.71%) Башкирский 5 4 (0.11%)
Годоберинский 1 0 (0.00%) Исландский 5 0 (0.00%)
Готский 7 0 (0.00%) Словенский 5 0 (0.00%)
Греческий 9 0 (0.00%) Хорватский 5 0 (0.00%)
Грузинский 4 6 (0.42%) Литовский 5 0 (0.00%)
Гэльский (шотландский) 1 0 (0.00%) Церковнославянский 5 0 (0.00%)
Датский 10 52 (4.58%) Ирландский 5 4 (0.00%)
Древнеанглийский 2 0 (0.00%) Древневерхненемецкий 5 0 (0.00%)
Древнеармянский 1 2 (100.00%) Цыганский 5 0 (0.00%)
Древневерхненемецкий 5 0 (0.00%) Латгальский 5 4 (30.77%)
Древнегреческий 6 0 (0.00%) Киргизский 4 0 (0.00%)
Древнегреческий (аттический) 1 0 (0.00%) Туркменский 4 0 (0.00%)
Древнегреческий (ионический) 1 0 (0.00%) Карельский 4 0 (0.00%)
Древнеисландский 1 0 (0.00%) Сербохорватский 4 0 (0.00%)
Древнерусский 5 0 (0.00%) Суахили 4 0 (0.00%)
Древнесаксонский 1 0 (0.00%) Грузинский 4 6 (0.42%)
Иврит 7 0 (0.00%) Таджикский 3 48 (2.33%)
Идо 1 0 (0.00%) Македонский 3 10 (33.33%)
Ижорский 1 2 (0.00%) Удмуртский 3 184 (28.43%)
Интерлингва 1 0 (0.00%) Итальянский 3 4 (87.09%)
Ирландский 5 4 (0.00%) Эсперанто 3 0 (0.00%)
Исландский 5 0 (0.00%) Испанский 3 4 (63.95%)
Испанский 3 4 (63.95%) Венгерский 3 100 (96.83%)
Итальянский 3 4 (87.09%) Боснийский 3 0 (0.00%)
Кабардино-черкесский 1 0 (0.00%) Китайский иероглиф 3 2 (25.00%)
Казахский 5 0 (0.00%) Валлийский 3 788 (96.15%)
Калмыцкий 2 0 (0.00%) Монгольский 3 0 (0.00%)
Каннада 1 0 (0.00%) Китайский (Гуаньхуа) 3 0 (0.00%)
Каракалпакский 1 0 (0.00%) Баскский 3 44 (82.91%)
Карачаево-балкарский 1 0 (0.00%) Арабский 3 0 (0.00%)
Карельский 4 0 (0.00%) Кашубский 3 0 (0.00%)
Каталанский 1 4 (100.00%) Нивхский 3 0 (0.00%)
Кашубский 3 0 (0.00%) Малаялам 3 0 (0.00%)
Квенья 1 14 (0.00%) Чеченский 2 0 (0.00%)
Киргизский 4 0 (0.00%) Якутский 2 12 (0.00%)
Китайский (Гуаньхуа) 3 0 (0.00%) Осетинский 2 0 (0.00%)
Китайский иероглиф 3 2 (25.00%) Коми-зырянский 2 240 (93.18%)
Коми-зырянский 2 240 (93.18%) Пали 2 2 (8.49%)
Коми-пермяцкий 1 0 (0.00%) Волапюк 2 0 (0.00%)
Констанс I 1 0 (0.00%) Галисийский 2 4 (99.71%)
Кортни I 1 0 (0.00%) Древнеанглийский 2 0 (0.00%)
Корякский 1 0 (0.00%) Курдский 2 0 (0.00%)
Кристин I 1 0 (0.00%) Африкаанс 2 10 (100.00%)
Кумыкский 1 0 (0.00%) Португальский 2 4 (99.25%)
Курдский 2 0 (0.00%) Мальтийский 2 0 (0.00%)
Латгальский 5 4 (30.77%) Адыгейский 2 0 (0.00%)
Латинский 34 0 (0.00%) Верхнелужицкий 2 0 (0.00%)
Латышский 6 0 (0.00%) Фризский 2 0 (0.00%)
Лезгинский 1 0 (0.00%) Нижнелужицкий 2 0 (0.00%)
Ливвиковский 1 0 (0.00%) Абхазский 2 0 (0.00%)
Лиз II 1 0 (0.00%) Алтайский 2 0 (0.00%)
Литовский 5 0 (0.00%) Калмыцкий 2 0 (0.00%)
Лоранс I 1 0 (0.00%) Хакасский 2 0 (0.00%)
Луганда 1 0 (0.00%) Шорский 2 0 (0.00%)
Людиковский 1 0 (0.00%) Бретонский 2 4 (85.42%)
Люсьен I 1 0 (0.00%) Английский (американский) 2 6 (37.50%)
Мадж I 1 0 (0.00%) Сибирскотатарский 2 0 (0.00%)
Македонский 3 10 (33.33%) Хинди 2 4 (28.57%)
Малагасийский 1 4 (100.00%) Османский 2 2 (33.33%)
Малаялам 3 0 (0.00%) Португальский (бразильский) 2 4 (88.89%)
Мальтийский 2 0 (0.00%) Немецкий (швейцарский) 2 0 (0.00%)
Маньчжурский 1 0 (0.00%) Английский (австралийский диалект) 2 0 (0.00%)
Мег I 1 0 (0.00%) Аварский 1 0 (0.00%)
Мередит I 1 0 (0.00%) Мокшанский 1 0 (0.00%)
Мишель I 1 0 (0.00%) Лезгинский 1 0 (0.00%)
Мокшанский 1 0 (0.00%) Карачаево-балкарский 1 0 (0.00%)
Монгольский 3 0 (0.00%) Коми-пермяцкий 1 0 (0.00%)
Мэй I 1 0 (0.00%) Эвенкийский 1 0 (0.00%)
Мэрион I 1 0 (0.00%) Кумыкский 1 0 (0.00%)
Мэт I 1 0 (0.00%) Тувинский 1 0 (0.00%)
Нанайский 1 0 (0.00%) Интерлингва 1 0 (0.00%)
Нат I 1 0 (0.00%) Каталанский 1 4 (100.00%)
Немецкий 16 56 (12.39%) Старофранцузский 1 0 (0.00%)
Немецкий (австрийский) 1 0 (0.00%) Чувашский 1 0 (0.00%)
Немецкий (швейцарский) 2 0 (0.00%) Древнесаксонский 1 0 (0.00%)
Ненецкий 1 0 (0.00%) Словио 1 0 (0.00%)
Нивхский 3 0 (0.00%) Кабардино-черкесский 1 0 (0.00%)
Нидерландский 15 12 (35.62%) Древнеисландский 1 0 (0.00%)
Нижнелужицкий 2 0 (0.00%) Окситанский 1 4 (100.00%)
Ногайский 1 0 (0.00%) Арагонский 1 4 (100.00%)
Нол I 1 0 (0.00%) Астурийский 1 0 (0.00%)
Нолл I 1 0 (0.00%) Сицилийский 1 4 (100.00%)
Норвежский 6 4 (0.10%) Идо 1 0 (0.00%)
Норвежский (букмол) 1 0 (0.00%) Бурятский 1 0 (0.00%)
Норвежский (нюнорск) 1 0 (0.00%) Ягнобский 1 0 (0.00%)
Ноэль I 1 0 (0.00%) Малагасийский 1 4 (100.00%)
Нэт I 1 0 (0.00%) Японский 1 2 (100.00%)
Обри I 1 0 (0.00%) Ногайский 1 0 (0.00%)
Окситанский 1 4 (100.00%) Гэльский (шотландский) 1 0 (0.00%)
Осетинский 2 0 (0.00%) Ненецкий 1 0 (0.00%)
Османский 2 2 (33.33%) Пьемонтский 1 0 (0.00%)
Пали 2 2 (8.49%) Абазинский 1 0 (0.00%)
Панджаби 1 0 (0.00%) Хантыйский 1 0 (0.00%)
Пао 1 0 (0.00%) Нанайский 1 0 (0.00%)
Персидский 1 2 (100.00%) Ливвиковский 1 0 (0.00%)
Польский 19 0 (0.00%) Людиковский 1 0 (0.00%)
Португальский 2 4 (99.25%) Эве 1 4 (100.00%)
Португальский (бразильский) 2 4 (88.89%) Словянски 1 0 (0.00%)
Праславянский 1 0 (0.00%) Норвежский (нюнорск) 1 0 (0.00%)
Пьемонтский 1 0 (0.00%) Древнеармянский 1 2 (100.00%)
Румынский 9 72 (38.84%) Бенгальский 1 0 (0.00%)
Русский 152 96 (0.03%) Панджаби 1 0 (0.00%)
Русский (дореформенная орфография) 10 14 (23.78%) Каракалпакский 1 0 (0.00%)
Сербохорватский 4 0 (0.00%) Ижорский 1 2 (0.00%)
Сербский 9 174 (0.07%) Чукотский 1 0 (0.00%)
Сибирскотатарский 2 0 (0.00%) Годоберинский 1 0 (0.00%)
Сингальский 1 0 (0.00%) Водский 1 2 (0.00%)
Сицилийский 1 4 (100.00%) Персидский 1 2 (100.00%)
Словацкий 7 0 (0.00%) Каннада 1 0 (0.00%)
Словенский 5 0 (0.00%) Валлонский 1 0 (0.00%)
Словио 1 0 (0.00%) Норвежский (букмол) 1 0 (0.00%)
Словянски 1 0 (0.00%) Урду 1 0 (0.00%)
Старославянский 14 22 (0.09%) Тамильский 1 0 (0.00%)
Старофранцузский 1 0 (0.00%) Будухский 1 0 (0.00%)
Суахили 4 0 (0.00%) Венетский 1 0 (0.00%)
Таджикский 3 48 (2.33%) Корякский 1 0 (0.00%)
Тамильский 1 0 (0.00%) Немецкий (австрийский) 1 0 (0.00%)
Татарский 21 840 (24.38%) Белорусский (тарашкевица) 1 0 (0.00%)
Тейлор II 1 0 (0.00%) Хирагана 1 2 (100.00%)
Тейлор III 1 0 (0.00%) Луганда 1 0 (0.00%)
Тибетский 1 0 (0.00%) Ямайский креольский 1 0 (0.00%)
Тина I 1 0 (0.00%) Квенья 1 14 (0.00%)
Тувинский 1 0 (0.00%) Древнегреческий (ионический) 1 0 (0.00%)
Турецкий 7 164 (0.18%) Древнегреческий (аттический) 1 0 (0.00%)
Туркменский 4 0 (0.00%) Маньчжурский 1 0 (0.00%)
Удмуртский 3 184 (28.43%) Амхарский 1 0 (0.00%)
Узбекский 6 876 (99.97%) Мишель I 1 0 (0.00%)
Украинский 45 54 (7.65%) Сингальский 1 0 (0.00%)
Урду 1 0 (0.00%) Тибетский 1 0 (0.00%)
Фарерский 6 32 (3.33%) Праславянский 1 0 (0.00%)
Финский 12 24 (0.68%) Тина I 1 0 (0.00%)
Флоранс I 1 0 (0.00%) Мадж I 1 0 (0.00%)
Флоренс I 1 0 (0.00%) Мег I 1 0 (0.00%)
Французский 6 6 (0.42%) Тейлор II 1 0 (0.00%)
Фризский 2 0 (0.00%) Тейлор III 1 0 (0.00%)
Фрэнсис I 1 0 (0.00%) Флоренс I 1 0 (0.00%)
Хакасский 2 0 (0.00%) Шелли I 1 0 (0.00%)
Хантыйский 1 0 (0.00%) Лиз II 1 0 (0.00%)
Хинди 2 4 (28.57%) Пао 1 0 (0.00%)
Хирагана 1 2 (100.00%) Нол I 1 0 (0.00%)
Хорватский 5 0 (0.00%) Мэй I 1 0 (0.00%)
Церковнославянский 5 0 (0.00%) Фрэнсис I 1 0 (0.00%)
Цыганский 5 0 (0.00%) Шеннон I 1 0 (0.00%)
Чеченский 2 0 (0.00%) Констанс I 1 0 (0.00%)
Чешский 17 0 (0.00%) Беверли I 1 0 (0.00%)
Чувашский 1 0 (0.00%) Авис I 1 0 (0.00%)
Чукотский 1 0 (0.00%) Кристин I 1 0 (0.00%)
Шведский 15 56 (8.06%) Мередит I 1 0 (0.00%)
Шелли I 1 0 (0.00%) Мэт I 1 0 (0.00%)
Шеннон I 1 0 (0.00%) Люсьен I 1 0 (0.00%)
Шорский 2 0 (0.00%) Мэрион I 1 0 (0.00%)
Эве 1 4 (100.00%) Нолл I 1 0 (0.00%)
Эвелин I 1 0 (0.00%) Ноэль I 1 0 (0.00%)
Эвенкийский 1 0 (0.00%) Лоранс I 1 0 (0.00%)
Эсперанто 3 0 (0.00%) Нэт I 1 0 (0.00%)
Эстонский 6 4 (23.66%) Нат I 1 0 (0.00%)
Ягнобский 1 0 (0.00%) Обри I 1 0 (0.00%)
Якутский 2 12 (0.00%) Флоранс I 1 0 (0.00%)
Ямайский креольский 1 0 (0.00%) Эвелин I 1 0 (0.00%)
Японский 1 2 (100.00%) Кортни I 1 0 (0.00%)

This page is a part of the kaikki.org machine-readable dictionary. This dictionary is based on structured data extracted on 2025-10-03 from the ruwiktionary dump dated 2025-09-20 using wiktextract (ea0d853 and 1ab82da). The data shown on this site has been post-processed and various details (e.g., extra categories) removed, some information disambiguated, and additional data merged from other sources. See the raw data download page for the unprocessed wiktextract data.

If you use this data in academic research, please cite Tatu Ylonen: Wiktextract: Wiktionary as Machine-Readable Structured Data, Proceedings of the 13th Conference on Language Resources and Evaluation (LREC), pp. 1317-1325, Marseille, 20-25 June 2022. Linking to the relevant page(s) under https://kaikki.org would also be greatly appreciated.