dataset in All languages combined

[Show JSON for postprocessed kaikki.org data shown on this page ▼] [Hide JSON for postprocessed kaikki.org data shown on this page ▲]

{
  "categories": [
    {
      "kind": "other",
      "name": "Ontbrekend geluid",
      "parents": [],
      "source": "w"
    },
    {
      "kind": "other",
      "name": "Retrograad van het Nederlands",
      "parents": [],
      "source": "w"
    },
    {
      "kind": "other",
      "name": "Samenstelling in het Nederlands",
      "parents": [],
      "source": "w"
    },
    {
      "kind": "other",
      "name": "Telbaar",
      "parents": [],
      "source": "w"
    },
    {
      "kind": "other",
      "name": "WikiWoordenboek:Wikilink",
      "parents": [],
      "source": "w"
    },
    {
      "kind": "other",
      "name": "Woorden in het Nederlands",
      "parents": [],
      "source": "w"
    },
    {
      "kind": "other",
      "name": "Woorden in het Nederlands met audioweergave",
      "parents": [],
      "source": "w"
    },
    {
      "kind": "other",
      "name": "Woorden in het Nederlands van lengte 7",
      "parents": [],
      "source": "w"
    },
    {
      "kind": "other",
      "name": "Zelfstandig naamwoord in het Nederlands",
      "parents": [],
      "source": "w"
    }
  ],
  "etymology_texts": [
    "samenstelling van data zn en set zn"
  ],
  "forms": [
    {
      "form": "datasets",
      "tags": [
        "plural"
      ]
    }
  ],
  "hyphenation": "da·ta·set",
  "lang": "Nederlands",
  "lang_code": "nl",
  "pos": "noun",
  "pos_title": "Zelfstandig naamwoord",
  "senses": [
    {
      "examples": [
        {
          "bold_text_offsets": [
            [
              65,
              72
            ]
          ],
          "text": "Vroegrijk baseert zijn conclusies onder meer op analyses van een dataset van marktonderzoekbureau GfK Nederland, waarop 6000 huishoudens hun uitgavepatroon bijhielden. Hij keek vooral naar uitgaven die in grote supermarkten als Albert Heijn, C1000, Jumbo of Aldi zijn gedaan."
        },
        {
          "bold_text_offsets": [
            [
              33,
              40
            ]
          ],
          "text": "Elhaik onderzocht een genetische dataset van 1287 niet-verwante individuen uit Joodse en niet-Joodse populaties. Hij gebruikte deze gegevens om onder andere geografische oorsprong en verwantschap te bepalen. Elhaik kon zo de biogeografische oorsprong van Europese Joden vaststellen, 560 kilometer ten zuiden van Samandar de oude hoofdstad van de Chazaren. Ergens in de Kaukasus tussen het huidige Geörgie, Armenië en Azerbeidzjan in."
        }
      ],
      "glosses": [
        "een verzameling van gegevens, meestal gepresenteerd in tabelvorm die door een computer bewerkt kunnen worden"
      ],
      "id": "nl-dataset-nl-noun-wPa1kR6j"
    }
  ],
  "sounds": [
    {
      "audio": "nl-dataset.ogg",
      "mp3_url": "https://upload.wikimedia.org/wikipedia/commons/transcoded/b/b2/Nl-dataset.ogg/Nl-dataset.ogg.mp3",
      "ogg_url": "https://commons.wikimedia.org/wiki/Special:FilePath/nl-dataset.ogg"
    }
  ],
  "tags": [
    "masculine"
  ],
  "translations": [
    {
      "lang": "Engels",
      "lang_code": "en",
      "sense_index": 1,
      "word": "dataset"
    }
  ],
  "word": "dataset"
}

[Show JSON for raw wiktextract data ▼] [Hide JSON for raw wiktextract data ▲]

{
  "categories": [
    "Ontbrekend geluid",
    "Retrograad van het Nederlands",
    "Samenstelling in het Nederlands",
    "Telbaar",
    "WikiWoordenboek:Wikilink",
    "Woorden in het Nederlands",
    "Woorden in het Nederlands met audioweergave",
    "Woorden in het Nederlands van lengte 7",
    "Zelfstandig naamwoord in het Nederlands"
  ],
  "etymology_texts": [
    "samenstelling van data zn en set zn"
  ],
  "forms": [
    {
      "form": "datasets",
      "tags": [
        "plural"
      ]
    }
  ],
  "hyphenation": "da·ta·set",
  "lang": "Nederlands",
  "lang_code": "nl",
  "pos": "noun",
  "pos_title": "Zelfstandig naamwoord",
  "senses": [
    {
      "examples": [
        {
          "bold_text_offsets": [
            [
              65,
              72
            ]
          ],
          "text": "Vroegrijk baseert zijn conclusies onder meer op analyses van een dataset van marktonderzoekbureau GfK Nederland, waarop 6000 huishoudens hun uitgavepatroon bijhielden. Hij keek vooral naar uitgaven die in grote supermarkten als Albert Heijn, C1000, Jumbo of Aldi zijn gedaan."
        },
        {
          "bold_text_offsets": [
            [
              33,
              40
            ]
          ],
          "text": "Elhaik onderzocht een genetische dataset van 1287 niet-verwante individuen uit Joodse en niet-Joodse populaties. Hij gebruikte deze gegevens om onder andere geografische oorsprong en verwantschap te bepalen. Elhaik kon zo de biogeografische oorsprong van Europese Joden vaststellen, 560 kilometer ten zuiden van Samandar de oude hoofdstad van de Chazaren. Ergens in de Kaukasus tussen het huidige Geörgie, Armenië en Azerbeidzjan in."
        }
      ],
      "glosses": [
        "een verzameling van gegevens, meestal gepresenteerd in tabelvorm die door een computer bewerkt kunnen worden"
      ]
    }
  ],
  "sounds": [
    {
      "audio": "nl-dataset.ogg",
      "mp3_url": "https://upload.wikimedia.org/wikipedia/commons/transcoded/b/b2/Nl-dataset.ogg/Nl-dataset.ogg.mp3",
      "ogg_url": "https://commons.wikimedia.org/wiki/Special:FilePath/nl-dataset.ogg"
    }
  ],
  "tags": [
    "masculine"
  ],
  "translations": [
    {
      "lang": "Engels",
      "lang_code": "en",
      "sense_index": 1,
      "word": "dataset"
    }
  ],
  "word": "dataset"
}

This page is a part of the kaikki.org machine-readable All languages combined dictionary. This dictionary is based on structured data extracted on 2025-05-12 from the nlwiktionary dump dated 2025-05-01 using wiktextract (9a214a4 and 1b6da77). The data shown on this site has been post-processed and various details (e.g., extra categories) removed, some information disambiguated, and additional data merged from other sources. See the raw data download page for the unprocessed wiktextract data.

If you use this data in academic research, please cite Tatu Ylonen: Wiktextract: Wiktionary as Machine-Readable Structured Data, Proceedings of the 13th Conference on Language Resources and Evaluation (LREC), pp. 1317-1325, Marseille, 20-25 June 2022. Linking to the relevant page(s) under https://kaikki.org would also be greatly appreciated.

"dataset" meaning in All languages combined

Noun [Nederlands]

Inflected forms