Wiktionary data extraction errors and warnings

Inflection check

List of different kinds of inflection tables. When wiktextract parses word heads and tables, it assigns the forms it encounters with tags that describe grammatical or contextual information. The tags and forms that are found in head sections and tables are kept separate from other head section and table tags, and later they are merged with other heads and tables into table types that all contain the same number of word forms with the same tags for those forms.

The information presented here is mostly for debugging, but it can also be used to find interesting word paradigms and to hunt down mistakes, typoes and badly formated Wiktionary entries. A table type that has only a few unique instances is quite likely to contain some kind of minor error in the original data.

Language ⏶ Table forms Errors (% affected words) Language Table forms ⏷ Errors (% affected words)
กรีก 1 2 (100.00%) ไทย 8 10 (25.74%)
กรีกแบบไมซีนี 1 2 (100.00%) อีสาน 2 2 (95.24%)
กรีนแลนด์ 1 2 (100.00%) ร่วม 2 4 (100.00%)
กอท 1 2 (100.00%) อาร์มีเนีย 2 2 (87.50%)
กอทแบบไครเมีย 1 2 (100.00%) ฟินแลนด์ 1 2 (100.00%)
กะยาตะวันตก 1 2 (100.00%) คำเมือง 1 2 (100.00%)
กะเหรี่ยงสะกอ 1 2 (100.00%) ปักษ์ใต้ 1 2 (100.00%)
กะเหรี่ยงโปตะวันตก 1 2 (100.00%) เขมรเหนือ 1 2 (100.00%)
กาตาลา 1 6 (100.00%) เอสเปรันโต 1 4 (100.00%)
กาปัมปางัน 1 4 (100.00%) อังกฤษ 1 2 (100.00%)
กาลิเซีย 1 2 (100.00%) ดัตช์ 1 2 (100.00%)
กาลิเซีย-โปรตุเกสเก่า 1 2 (100.00%) ฝรั่งเศส 1 2 (100.00%)
กาโร 1 2 (100.00%) ละติน 1 2 (100.00%)
คอร์นวอลล์ 1 2 (100.00%) จ้วง 1 2 (100.00%)
คาชุบ 1 2 (100.00%) เช็ก 1 4 (100.00%)
คาซัค 1 2 (100.00%) ญี่ปุ่น 1 2 (100.00%)
คำตี้ 1 2 (100.00%) เวียดนาม 1 2 (100.00%)
คำเมือง 1 2 (100.00%) ญ้อ 1 2 (100.00%)
คุชราต 1 2 (100.00%) กาตาลา 1 6 (100.00%)
จอร์เจีย 1 4 (100.00%) เซอร์โบ-โครเอเชีย 1 4 (100.00%)
จามตะวันตก 1 2 (100.00%) เดนมาร์ก 1 2 (100.00%)
จามตะวันออก 1 2 (100.00%) นอร์เวย์แบบนือนอสก์ 1 2 (100.00%)
จ้วง 1 2 (100.00%) นอร์เวย์แบบบุ๊กมอล 1 2 (100.00%)
ชวาเก่า 1 2 (100.00%) นอร์สเก่า 1 4 (100.00%)
ซอร์บตอนล่าง 1 2 (100.00%) โปรตุเกส 1 6 (100.00%)
ซาซา 1 2 (100.00%) โปแลนด์ 1 2 (100.00%)
ซุนดา 1 2 (100.00%) เยอรมัน 1 2 (100.00%)
ญัฮกุร 1 2 (100.00%) โรมาเนีย 1 2 (100.00%)
ญี่ปุ่น 1 2 (100.00%) สวีเดน 1 2 (100.00%)
ญ้อ 1 2 (100.00%) อังกฤษเก่า 1 2 (100.00%)
ดัตช์ 1 2 (100.00%) อินโดนีเซีย 1 2 (100.00%)
ตั่ย 1 4 (100.00%) ไอริช 1 4 (100.00%)
ตากาล็อก 1 4 (100.00%) เกาหลี 1 4 (100.00%)
ตุรกี 1 2 (100.00%) โรฮีนจา 1 8 (100.00%)
ทมิฬ 1 2 (100.00%) อูรักลาโวยจ 1 2 (100.00%)
ทะวืง 1 2 (100.00%) อิตาลี 1 2 (100.00%)
ทิเบต 1 2 (100.00%) สเปน 1 4 (100.00%)
นอร์มัน 1 4 (100.00%) มาเลเซีย 1 2 (100.00%)
นอร์สเก่า 1 4 (100.00%) ญัฮกุร 1 2 (100.00%)
นอร์เวย์แบบนือนอสก์ 1 2 (100.00%) แสก 1 2 (100.00%)
นอร์เวย์แบบบุ๊กมอล 1 2 (100.00%) บาลี 1 2 (100.00%)
นาอูรู 1 2 (100.00%) ฮินดี 1 2 (100.00%)
บัลแกเรีย 1 4 (100.00%) แอฟริคานส์ 1 4 (100.00%)
บาลี 1 2 (100.00%) สกอต 1 2 (100.00%)
บาวาเรีย 1 2 (100.00%) นอร์มัน 1 4 (100.00%)
บาสก์ 1 2 (100.00%) อะตง 1 2 (100.00%)
บาหลี 1 2 (100.00%) แอลเบเนีย 1 6 (100.00%)
ปรากฤต 1 8 (100.00%) ลัตเวีย 1 4 (100.00%)
ปักษ์ใต้ 1 2 (100.00%) ลิทัวเนีย 1 2 (100.00%)
ปัญจาบ 1 8 (100.00%) สันสกฤต 1 4 (100.00%)
ปู้อี 1 2 (100.00%) เนปาล 1 4 (100.00%)
ฝรั่งเศส 1 2 (100.00%) มราฐี 1 2 (100.00%)
ฝรั่งเศสกลาง 1 2 (100.00%) ฮังการี 1 2 (100.00%)
ฝรั่งเศสเก่า 1 2 (100.00%) ฝรั่งเศสกลาง 1 2 (100.00%)
พม่า 1 2 (100.00%) ฝรั่งเศสเก่า 1 2 (100.00%)
ฟรียูลี 1 2 (100.00%) อุตซิตา 1 2 (100.00%)
ฟินแลนด์ 1 2 (100.00%) อุตซิตาเก่า 1 2 (100.00%)
ฟูลา 1 2 (100.00%) ปู้อี 1 2 (100.00%)
มณีปุระ 1 6 (100.00%) กรีก 1 2 (100.00%)
มราฐี 1 2 (100.00%) อูรดู 1 2 (100.00%)
มลยาฬัม 1 2 (100.00%) เบงกอล 1 2 (100.00%)
มลายูแบบปัตตานี 1 4 (100.00%) พม่า 1 2 (100.00%)
มองโกเลีย 1 2 (100.00%) เขมร 1 2 (100.00%)
มอญ 1 2 (100.00%) มลายูแบบปัตตานี 1 4 (100.00%)
มอญแบบไทย 1 2 (100.00%) ฮีบรู 1 8 (100.00%)
มาราเนา 1 2 (100.00%) รัสเซีย 1 2 (100.00%)
มาร์แชลล์ 1 2 (100.00%) ลาว 1 4 (100.00%)
มาเลเซีย 1 2 (100.00%) ตุรกี 1 2 (100.00%)
มือไทย 1 2 (100.00%) โภชปุระ 1 2 (100.00%)
ม้งขาว 1 2 (100.00%) เนวาร์ 1 2 (100.00%)
ยอง 1 2 (100.00%) กาลิเซีย 1 2 (100.00%)
ยูเครน 1 4 (100.00%) เปอร์เซีย 1 2 (100.00%)
รัสเซีย 1 2 (100.00%) อาหรับ 1 2 (100.00%)
ร่วม 2 4 (100.00%) ม้งขาว 1 2 (100.00%)
ลอมบาร์ด 1 10 (100.00%) มองโกเลีย 1 2 (100.00%)
ละติน 1 2 (100.00%) อุยกูร์ 1 2 (100.00%)
ลัซ 1 16 (100.00%) บัลแกเรีย 1 4 (100.00%)
ลัตเวีย 1 4 (100.00%) ยูเครน 1 4 (100.00%)
ลาดิน 1 2 (100.00%) เอสโตเนีย 1 2 (100.00%)
ลาดิโน 1 2 (100.00%) ไอซ์แลนด์ 1 4 (100.00%)
ลาว 1 4 (100.00%) มอญ 1 2 (100.00%)
ลิทัวเนีย 1 2 (100.00%) ไหล 1 2 (100.00%)
ลีโวเนีย 1 2 (100.00%) ทะวืง 1 2 (100.00%)
สกอต 1 2 (100.00%) ไทใหญ่ 1 2 (100.00%)
สวาฮีลี 1 2 (100.00%) ไทลื้อ 1 2 (100.00%)
สวีเดน 1 2 (100.00%) กะเหรี่ยงสะกอ 1 2 (100.00%)
สวีเดนเก่า 1 4 (100.00%) กะเหรี่ยงโปตะวันตก 1 2 (100.00%)
สันถาลี 1 4 (100.00%) เลอเวือะตะวันออก 1 4 (100.00%)
สันสกฤต 1 4 (100.00%) คำตี้ 1 2 (100.00%)
สิงหล 1 2 (100.00%) บาหลี 1 2 (100.00%)
สเปน 1 4 (100.00%) ฟรียูลี 1 2 (100.00%)
อะตง 1 2 (100.00%) แดลเมเชีย 1 2 (100.00%)
อักษรกรีก 1 2 (100.00%) เซบัวโน 1 2 (100.00%)
อังกฤษ 1 2 (100.00%) ตากาล็อก 1 4 (100.00%)
อังกฤษเก่า 1 2 (100.00%) บาสก์ 1 2 (100.00%)
อัมฮารา 1 2 (100.00%) ลาดิโน 1 2 (100.00%)
อัสสัม 1 2 (100.00%) กาลิเซีย-โปรตุเกสเก่า 1 2 (100.00%)
อาข่า 1 2 (100.00%) สวาฮีลี 1 2 (100.00%)
อารามายา 1 2 (100.00%) เคิร์ดเหนือ 1 6 (100.00%)
อาร์มีเนีย 2 2 (87.50%) ฮุนสริก 1 2 (100.00%)
อาหม 1 2 (100.00%) เยอรมันสูงเก่า 1 2 (100.00%)
อาหรับ 1 2 (100.00%) คอร์นวอลล์ 1 2 (100.00%)
อิตาลี 1 2 (100.00%) ชวาเก่า 1 2 (100.00%)
อินุกติตุต 1 2 (100.00%) เวลส์ 1 2 (100.00%)
อินโดนีเซีย 1 2 (100.00%) จามตะวันตก 1 2 (100.00%)
อีสาน 2 2 (95.24%) จามตะวันออก 1 2 (100.00%)
อุตซิตา 1 2 (100.00%) โรมานช์ 1 2 (100.00%)
อุตซิตาเก่า 1 2 (100.00%) มาราเนา 1 2 (100.00%)
อุยกูร์ 1 2 (100.00%) เยอรมันแบบแอเลอแมนนี 1 2 (100.00%)
อูรดู 1 2 (100.00%) เรอหวั่ง 1 2 (100.00%)
อูรักลาโวยจ 1 2 (100.00%) ไอริชเก่า 1 2 (100.00%)
อเวสตะ 1 2 (100.00%) กาปัมปางัน 1 4 (100.00%)
ฮังการี 1 2 (100.00%) เลอเวือะตะวันตก 1 2 (100.00%)
ฮินดี 1 2 (100.00%) เขิน 1 2 (100.00%)
ฮีบรู 1 8 (100.00%) ตั่ย 1 4 (100.00%)
ฮุนสริก 1 2 (100.00%) ลาดิน 1 2 (100.00%)
เกชัว 1 2 (100.00%) ทมิฬ 1 2 (100.00%)
เกาหลี 1 4 (100.00%) คาซัค 1 2 (100.00%)
เขมร 1 2 (100.00%) ยอง 1 2 (100.00%)
เขมรเก่า 1 30 (100.00%) เขมรเก่า 1 30 (100.00%)
เขมรเหนือ 1 2 (100.00%) มอญแบบไทย 1 2 (100.00%)
เขิน 1 2 (100.00%) ไทดำ 1 2 (100.00%)
เคิร์ดเหนือ 1 6 (100.00%) ไทขาว 1 2 (100.00%)
เชจู 1 8 (100.00%) เวเนโต 1 8 (100.00%)
เชเยนน์ 1 2 (100.00%) ซุนดา 1 2 (100.00%)
เชโรกี 1 2 (100.00%) ซาซา 1 2 (100.00%)
เช็ก 1 4 (100.00%) เชเยนน์ 1 2 (100.00%)
เซบัวโน 1 2 (100.00%) สิงหล 1 2 (100.00%)
เซอร์โบ-โครเอเชีย 1 4 (100.00%) กอท 1 2 (100.00%)
เดนมาร์ก 1 2 (100.00%) กรีนแลนด์ 1 2 (100.00%)
เตลูกู 1 2 (100.00%) กอทแบบไครเมีย 1 2 (100.00%)
เนปาล 1 4 (100.00%) จอร์เจีย 1 4 (100.00%)
เนวาร์ 1 2 (100.00%) บาวาเรีย 1 2 (100.00%)
เบงกอล 1 2 (100.00%) ทิเบต 1 2 (100.00%)
เปอร์เซีย 1 2 (100.00%) ไอนุ 1 2 (100.00%)
เยอรมัน 1 2 (100.00%) อัสสัม 1 2 (100.00%)
เยอรมันสูงเก่า 1 2 (100.00%) ปัญจาบ 1 8 (100.00%)
เยอรมันแบบแอเลอแมนนี 1 2 (100.00%) โอริยา 1 2 (100.00%)
เรอหวั่ง 1 2 (100.00%) เตลูกู 1 2 (100.00%)
เลอเวือะตะวันตก 1 2 (100.00%) มลยาฬัม 1 2 (100.00%)
เลอเวือะตะวันออก 1 4 (100.00%) อัมฮารา 1 2 (100.00%)
เวลส์ 1 2 (100.00%) อาหม 1 2 (100.00%)
เวียดนาม 1 2 (100.00%) มาร์แชลล์ 1 2 (100.00%)
เวเนโต 1 8 (100.00%) โยรูบา 1 2 (100.00%)
เอสเปรันโต 1 4 (100.00%) กาโร 1 2 (100.00%)
เอสโตเนีย 1 2 (100.00%) อเวสตะ 1 2 (100.00%)
เฮาซา 1 2 (100.00%) อินุกติตุต 1 2 (100.00%)
แดลเมเชีย 1 2 (100.00%) ไว 1 2 (100.00%)
แบกเตรีย 1 2 (100.00%) คุชราต 1 2 (100.00%)
แมงซ์ 1 2 (100.00%) เชโรกี 1 2 (100.00%)
แสก 1 2 (100.00%) ไทใต้คง 1 2 (100.00%)
แอฟริคานส์ 1 4 (100.00%) เกชัว 1 2 (100.00%)
แอลเบเนีย 1 6 (100.00%) กรีกแบบไมซีนี 1 2 (100.00%)
โปรตุเกส 1 6 (100.00%) ซอร์บตอนล่าง 1 2 (100.00%)
โปแลนด์ 1 2 (100.00%) กะยาตะวันตก 1 2 (100.00%)
โภชปุระ 1 2 (100.00%) สวีเดนเก่า 1 4 (100.00%)
โยรูบา 1 2 (100.00%) อักษรกรีก 1 2 (100.00%)
โรมานช์ 1 2 (100.00%) คาชุบ 1 2 (100.00%)
โรมาเนีย 1 2 (100.00%) ปรากฤต 1 8 (100.00%)
โรฮีนจา 1 8 (100.00%) ลอมบาร์ด 1 10 (100.00%)
โอริยา 1 2 (100.00%) ฟูลา 1 2 (100.00%)
ไทขาว 1 2 (100.00%) มณีปุระ 1 6 (100.00%)
ไทดำ 1 2 (100.00%) มือไทย 1 2 (100.00%)
ไทย 8 10 (25.74%) เฮาซา 1 2 (100.00%)
ไทลื้อ 1 2 (100.00%) นาอูรู 1 2 (100.00%)
ไทใต้คง 1 2 (100.00%) อาข่า 1 2 (100.00%)
ไทใหญ่ 1 2 (100.00%) เชจู 1 8 (100.00%)
ไว 1 2 (100.00%) อารามายา 1 2 (100.00%)
ไหล 1 2 (100.00%) แบกเตรีย 1 2 (100.00%)
ไอซ์แลนด์ 1 4 (100.00%) ลัซ 1 16 (100.00%)
ไอนุ 1 2 (100.00%) สันถาลี 1 4 (100.00%)
ไอริช 1 4 (100.00%) ลีโวเนีย 1 2 (100.00%)
ไอริชเก่า 1 2 (100.00%) แมงซ์ 1 2 (100.00%)

This page is a part of the kaikki.org machine-readable dictionary. This dictionary is based on structured data extracted on 2025-06-01 from the thwiktionary dump dated 2025-05-20 using wiktextract (3dadd05 and f1c2b61). The data shown on this site has been post-processed and various details (e.g., extra categories) removed, some information disambiguated, and additional data merged from other sources. See the raw data download page for the unprocessed wiktextract data.

If you use this data in academic research, please cite Tatu Ylonen: Wiktextract: Wiktionary as Machine-Readable Structured Data, Proceedings of the 13th Conference on Language Resources and Evaluation (LREC), pp. 1317-1325, Marseille, 20-25 June 2022. Linking to the relevant page(s) under https://kaikki.org would also be greatly appreciated.