"lematización" meaning in All languages combined

See lematización on Wiktionary

Noun [Español]

IPA: [le.ma.t̪i.saˈsjon], [le.ma.t̪i.θaˈθjon] Forms: lematización
Rhymes: on Etymology: De lema y el sufijo -ción. Etymology templates: {{etimología|sufijo|lema|ción}} De lema y el sufijo -ción
  1. Proceso que consiste en reducir una palabra a su raíz o forma canónica, similar al stemming pero de forma más sofisticada ya que cuenta adicionalmente con un corpus específico sobre el idioma con información detallada sobre las flexiones de las palabras más comunes e irregulares.
    Sense id: es-lematización-es-noun-L0viNMFK Categories (other): ES:Informática, ES:Lingüística Topics: computing, linguistics
The following are not (yet) sense-disambiguated
{
  "categories": [
    {
      "kind": "other",
      "name": "ES:Palabras agudas",
      "parents": [],
      "source": "w"
    },
    {
      "kind": "other",
      "name": "ES:Palabras pentasílabas",
      "parents": [],
      "source": "w"
    },
    {
      "kind": "other",
      "name": "ES:Rimas:on",
      "parents": [],
      "source": "w"
    },
    {
      "kind": "other",
      "name": "ES:Sustantivos",
      "parents": [],
      "source": "w"
    },
    {
      "kind": "other",
      "name": "ES:Sustantivos masculinos",
      "parents": [],
      "source": "w"
    },
    {
      "kind": "other",
      "name": "Español",
      "parents": [],
      "source": "w"
    }
  ],
  "etymology_templates": [
    {
      "args": {
        "1": "sufijo",
        "2": "lema",
        "3": "ción"
      },
      "expansion": "De lema y el sufijo -ción",
      "name": "etimología"
    }
  ],
  "etymology_text": "De lema y el sufijo -ción.",
  "extra_sounds": {
    "acentuación": "aguda",
    "longitud silábica": "pentasílaba"
  },
  "forms": [
    {
      "form": "lematización",
      "raw_tags": [
        "Singularia tantum"
      ]
    }
  ],
  "hyphenation": "le-ma-ti-za-ción",
  "lang": "Español",
  "lang_code": "es",
  "pos": "noun",
  "pos_title": "sustantivo masculino",
  "senses": [
    {
      "categories": [
        {
          "kind": "other",
          "name": "ES:Informática",
          "parents": [],
          "source": "w"
        },
        {
          "kind": "other",
          "name": "ES:Lingüística",
          "parents": [],
          "source": "w"
        }
      ],
      "glosses": [
        "Proceso que consiste en reducir una palabra a su raíz o forma canónica, similar al stemming pero de forma más sofisticada ya que cuenta adicionalmente con un corpus específico sobre el idioma con información detallada sobre las flexiones de las palabras más comunes e irregulares."
      ],
      "id": "es-lematización-es-noun-L0viNMFK",
      "sense_index": "1",
      "topics": [
        "computing",
        "linguistics"
      ]
    }
  ],
  "sounds": [
    {
      "ipa": "[le.ma.t̪i.saˈsjon]",
      "raw_tags": [
        "seseante"
      ]
    },
    {
      "ipa": "[le.ma.t̪i.θaˈθjon]",
      "raw_tags": [
        "no seseante"
      ]
    },
    {
      "rhymes": "on"
    }
  ],
  "tags": [
    "masculine"
  ],
  "word": "lematización"
}
{
  "categories": [
    "ES:Palabras agudas",
    "ES:Palabras pentasílabas",
    "ES:Rimas:on",
    "ES:Sustantivos",
    "ES:Sustantivos masculinos",
    "Español"
  ],
  "etymology_templates": [
    {
      "args": {
        "1": "sufijo",
        "2": "lema",
        "3": "ción"
      },
      "expansion": "De lema y el sufijo -ción",
      "name": "etimología"
    }
  ],
  "etymology_text": "De lema y el sufijo -ción.",
  "extra_sounds": {
    "acentuación": "aguda",
    "longitud silábica": "pentasílaba"
  },
  "forms": [
    {
      "form": "lematización",
      "raw_tags": [
        "Singularia tantum"
      ]
    }
  ],
  "hyphenation": "le-ma-ti-za-ción",
  "lang": "Español",
  "lang_code": "es",
  "pos": "noun",
  "pos_title": "sustantivo masculino",
  "senses": [
    {
      "categories": [
        "ES:Informática",
        "ES:Lingüística"
      ],
      "glosses": [
        "Proceso que consiste en reducir una palabra a su raíz o forma canónica, similar al stemming pero de forma más sofisticada ya que cuenta adicionalmente con un corpus específico sobre el idioma con información detallada sobre las flexiones de las palabras más comunes e irregulares."
      ],
      "sense_index": "1",
      "topics": [
        "computing",
        "linguistics"
      ]
    }
  ],
  "sounds": [
    {
      "ipa": "[le.ma.t̪i.saˈsjon]",
      "raw_tags": [
        "seseante"
      ]
    },
    {
      "ipa": "[le.ma.t̪i.θaˈθjon]",
      "raw_tags": [
        "no seseante"
      ]
    },
    {
      "rhymes": "on"
    }
  ],
  "tags": [
    "masculine"
  ],
  "word": "lematización"
}

Download raw JSONL data for lematización meaning in All languages combined (1.2kB)

{
  "called_from": "extractor/es/page/parse_entries/69",
  "msg": "Found unexpected nodes [<HTML(references){} >] in section [['Referencias y notas']]",
  "path": [
    "lematización"
  ],
  "section": "unknown",
  "subsection": "",
  "title": "lematización",
  "trace": ""
}

This page is a part of the kaikki.org machine-readable All languages combined dictionary. This dictionary is based on structured data extracted on 2024-11-06 from the eswiktionary dump dated 2024-10-20 using wiktextract (fbeafe8 and 7f03c9b). The data shown on this site has been post-processed and various details (e.g., extra categories) removed, some information disambiguated, and additional data merged from other sources. See the raw data download page for the unprocessed wiktextract data.

If you use this data in academic research, please cite Tatu Ylonen: Wiktextract: Wiktionary as Machine-Readable Structured Data, Proceedings of the 13th Conference on Language Resources and Evaluation (LREC), pp. 1317-1325, Marseille, 20-25 June 2022. Linking to the relevant page(s) under https://kaikki.org would also be greatly appreciated.