Random GPT-NL Document
Random samples uit het GPT-NL Public Corpus GPT-NL/GPT-NL_Public_Corpus.
Tijdens het trainen van GPT-NL zijn sommige documenten vaker aangeboden aan het model dan andere.
Referentie
@misc{vanoort2026gptnlpubliccorpuspermissively,
title={GPT-NL Public Corpus: A Permissively Licensed, Dutch-First Dataset for LLM Pre-training},
author={Jesse van Oort and Frank Brinkkemper and Erik de Graaf and Bram Vanroy and Saskia Lensink},
year={2026},
eprint={2604.00920},
archivePrefix={arXiv},
primaryClass={cs.CL},
url={https://arxiv.org/abs/2604.00920},
}