De AI-markt wordt gedomineerd door gesloten modellen: OpenAIs GPT-serie, Anthropics Claude en Googles Gemini. Je betaalt per token, je data gaat naar hun servers, en als een aanbieder besluit de spelregels te wijzigen -- of een model plotseling uit de lucht haalt -- heb je geen alternatief. Open-source AI-modellen doorbreken die afhankelijkheid. Je kunt ze downloaden, zelf draaien, aanpassen en combineren. Maar welk model is geschikt voor zakelijk gebruik, wat kost het werkelijk, en wanneer weegt de vrijheid op tegen het gemak van een API? In onze gids over AI-automatisering behandelen we het hele traject van experiment tot structurele inzet. Dit artikel zoomt in op de modellen zelf.
Wat zijn open-source AI-modellen?
Bij gesloten modellen zoals ChatGPT en Claude betaal je per API-aanroep. Het model draait op de servers van de aanbieder, je hebt geen inzage in de architectuur en je bent gebonden aan hun gebruiksvoorwaarden. Zodra de aanbieder de prijs verhoogt, een model terugtrekt of de voorwaarden wijzigt, zit je vast.
Open-source AI-modellen zijn fundamenteel anders. De modelgewichten -- het "brein" van het systeem -- zijn publiek beschikbaar. Je kunt ze downloaden, op eigen hardware draaien, finetunen op je eigen data en aanpassen aan je specifieke usecase. Geen vendor lock-in, volledige controle over je data.
Open-source versus open-weight: een belangrijk verschil
Niet elk model dat zich "open source" noemt, is dat in de strikte zin. Veel modellen -- waaronder Meta's Llama en DeepSeek -- zijn open-weight: je krijgt de modelgewichten, maar niet de volledige trainingsdata, trainingscode of de mogelijkheid om het model vanuit het niets te reproduceren. Mistral gaat een stap verder met een Apache 2.0-licentie die nauwelijks beperkingen kent. Voor zakelijk gebruik is dat onderscheid relevant: open-weight geeft je al enorm veel vrijheid, maar bij een echte Apache 2.0-licentie heb je ook juridisch de meeste ruimte voor commercieel gebruik en aanpassingen.
De vier grote open-source modellen
Vier modelreeksen domineren het open-source AI-landschap in 2026: Meta's Llama 4, het Franse Mistral, het Chinese DeepSeek en het eveneens Chinese Qwen van Alibaba. Elk heeft een ander profiel, andere sterktes en andere risico's.
Llama 4 (Meta)
Meta's Llama 4-reeks introduceert een Mixture-of-Experts (MoE) architectuur. Llama 4 Scout heeft 109 miljard parameters waarvan er slechts 17 miljard actief zijn per inferentie, met een contextvenster van 10 miljoen tokens -- het langste van alle grote taalmodellen. Llama 4 Maverick schaalt op naar 400 miljard parameters (eveneens 17 miljard actief) met een contextvenster van 1 miljoen tokens.
De kracht van MoE zit in de efficiëntie: je hebt de kennis van een groot model maar de rekenkosten van een klein model. Voor bedrijven die lange documenten verwerken -- contracten, technische dossiers, kwaliteitshandboeken -- maakt dat enorme contextvenster een tastbaar verschil.
De licentie is open-weight met Meta's eigen voorwaarden. Voor commercieel gebruik boven 700 miljoen maandelijkse gebruikers heb je een aparte licentie nodig -- een drempel die voor MKB-bedrijven niet relevant is.
Mistral (Frankrijk/EU)
Mistral is het Europese antwoord op de Amerikaanse en Chinese AI-giganten. Het bedrijf, opgericht door voormalig Meta- en DeepMind-onderzoekers, positioneert zich expliciet als Europees alternatief met dataverwerking binnen de EU. Mistral Large 3 is het vlaggenschipmodel, beschikbaar onder een Apache 2.0-licentie -- de meest permissieve licentie in dit rijtje.
Wat Mistral uniek maakt voor Europese bedrijven: ASML, de Nederlandse chipfabrikant, investeerde 1,3 miljard euro in het bedrijf en is daarmee de grootste aandeelhouder. Mistral bouwt een datacenter van 1,2 miljard euro in Zweden. Je data blijft in Europa, verwerkt door een Europees bedrijf, onder Europese wetgeving. Voor organisaties die vallen onder AVG, NIS2 of sectorspecifieke regelgeving is dat een concreet voordeel ten opzichte van Amerikaanse of Chinese alternatieven.
DeepSeek (China)
DeepSeek verraste de markt met modellen die qua prestaties wedijveren met de beste gesloten modellen, tegen een fractie van de kosten. DeepSeek V4-Pro is het nieuwste model in de reeks. De API-prijzen zijn agressief laag.
Maar er is een serieus voorbehoud. Onderzoek toont dat 48% van de Nederlanders DeepSeek wantrouwt vanwege privacy-zorgen rondom de Chinese herkomst. Die zorgen zijn niet ongegrond: de Autoriteit Persoonsgegevens (AP) waarschuwde in februari 2025 expliciet voor de privacy-risico's en startte een onderzoek naar de dataverwerking van DeepSeek. AP-voorzitter Aleid Wolfsen stelde dat "het delen van persoonsgegevens met bedrijven buiten de EU aan strenge privacy-eisen moet voldoen". Meerdere Europese landen -- waaronder Ierland, België, Frankrijk en Duitsland -- namen vergelijkbare stappen. Wie DeepSeek via hun eigen API gebruikt, stuurt data naar Chinese servers. Self-hosting op eigen Europese hardware lost dat op -- maar dan moet je wél de capaciteit en expertise hebben om dat te doen.
Qwen 3 (Alibaba, China)
Alibaba's Qwen3-235B is met 235 miljard parameters en een contextvenster van 262.000 tokens een krachtig model tegen opvallend lage API-prijzen. Qwen scoort competitief op de meeste benchmarks en ondersteunt meer dan 119 talen, waaronder Nederlands.
Dezelfde Chinese-herkomst overwegingen als bij DeepSeek gelden: via de eigen API gaat data naar Chinese servers. Maar als open-weight model kun je het ook lokaal of op Europese cloud-infrastructuur draaien. Voor organisaties die maximale prestaties per euro willen en zelf kunnen hosten, is Qwen een serieuze kandidaat.
Vergelijkingstabel: specificaties en prijzen
Wat kosten deze modellen concreet via hun cloud-API, en hoe verhouden de specificaties zich? Ter vergelijking: Anthropics Claude Fable 5 kost $10/$50 per miljoen tokens (input/output).
| Model | Parameters | Actief (MoE) | Context | Licentie | API-prijs (input) | API-prijs (output) |
|---|---|---|---|---|---|---|
| Llama 4 Scout | 109B | 17B | 10M tokens | Open-weight (Meta) | $0,27/MTok | $0,85/MTok |
| Llama 4 Maverick | 400B | 17B | 1M tokens | Open-weight (Meta) | $0,27/MTok | $0,85/MTok |
| DeepSeek V4-Pro | n.v.t. | n.v.t. | n.v.t. | Open-weight | $1,74/MTok | $3,48/MTok |
| Mistral Large 3 | n.v.t. | n.v.t. | n.v.t. | Apache 2.0 | €4/MTok | €12/MTok |
| Qwen3-235B | 235B | n.v.t. | 262K tokens | Open-weight | $0,071/MTok | $0,10/MTok |
Opvallend: de prijsverschillen zijn enorm. Qwen3 is per token bijna 150 keer goedkoper dan Mistral Large 3 via de API. Maar prijs per token zegt weinig zonder context: een goedkoper model dat twee keer zoveel tokens nodig heeft voor hetzelfde resultaat, is uiteindelijk niet goedkoper. En bij Qwen en DeepSeek betaal je de lage prijs met data die naar China gaat -- tenzij je zelf host.
Self-hosting vs cloud-API: wanneer loont het?
De belofte van open-source is "draai het zelf". De realiteit is genuanceerder. Self-hosting vereist GPU-hardware, DevOps-expertise en voortdurend onderhoud. De vraag is niet óf het kan, maar wanneer het financieel zinvol is.
De breakeven-berekening
De vuistregel: bij minder dan 100 miljoen tokens per dag is een cloud-API vrijwel altijd goedkoper. De vaste kosten van GPU-hardware (denk aan een NVIDIA A100 of H100 voor grotere modellen), koeling, bandbreedte en beheer wegen niet op tegen het variabele API-gebruik. Boven de 100 miljoen tokens per dag verschuift de balans: de marginale kosten van self-hosting zijn dan lager dan de API-prijs.
Wat kost self-hosting concreet?
Een praktijkvoorbeeld. Een enkel NVIDIA H100-systeem -- het minimum voor het draaien van grote modellen -- kost €30.000-€40.000 in aanschaf. Huur je GPU-capaciteit in de cloud (AWS, Azure, of een Europese aanbieder), dan betaal je €2-€4 per GPU-uur. Voor een 70B-parametermodel heb je minimaal 2 GPU's nodig; voor een 235B-model als Qwen3 vier tot acht.
Daar komt bij: iemand moet het beheren. Updates installeren, uptime bewaken, modelversies bijhouden. Voor een MKB-bedrijf zonder DevOps-team is dat een realistisch obstakel.
Het tussensegment: Ollama en lokale inferentie
Tools als Ollama maken het mogelijk om kleinere modellen (7B-13B parameters) op een gangbare laptop of workstation te draaien. Het platform ondersteunt inmiddels meer dan 100 modellen -- waaronder Llama 3.3, Mistral, Gemma en DeepSeek. Bedrijven rapporteren 60-80% kostenbesparingen ten opzichte van cloud-API's voor vergelijkbare taken. Dat is geen vervanging voor een cloud-API op productieniveau, maar het is wél bruikbaar voor:
- Prototyping en testen -- experimenteer met modellen zonder API-kosten
- Privacy-gevoelige taken -- verwerk vertrouwelijke documenten volledig lokaal
- Interne tools -- een chatbot voor je eigen kennisbank die nooit de deur uit gaat
Voor serieuze productietoepassingen met hoge doorvoer en beschikbaarheidseisen is een managed oplossing of dedicated GPU-cluster realistischer. Wil je weten welke AI-tools nu al rendement opleveren in jouw organisatie? Doe de gratis AI-scan -- die kijkt naar je processen, niet naar de technologie.
Data-soevereiniteit: de Europese hoek
Voor Europese bedrijven is data-soevereiniteit geen filosofische kwestie maar een compliance-eis. AVG, NIS2, sectorspecifieke regelgeving -- ze stellen allemaal eisen aan waar data verwerkt wordt en door wie.
Mistral: de Europese troefkaart
Mistral is het enige grote open-source modellab dat volledig Europees is. Het bedrijf verwerkt data binnen de EU, valt onder Europese wetgeving, en heeft met ASML een Nederlandse industriegigant als grootste aandeelhouder. Voor organisaties in de zorg, financiële sector of overheid -- sectoren waar data-soevereiniteit niet optioneel is -- maakt dat Mistral tot de veiligste keuze als je via hun API werkt.
De Apache 2.0-licentie geeft bovendien de juridische vrijheid om het model aan te passen, te distribueren en commercieel in te zetten zonder restricties. Dat is een sterkere positie dan de open-weight licenties van Meta, DeepSeek of Alibaba.
DeepSeek en Qwen: de Chinese factor
De privacy-zorgen rondom Chinese modellen zijn concreet. De Chinese Nationale Inlichtingenwet (2017) verplicht organisaties om mee te werken met inlichtingendiensten. Gebruik je DeepSeek of Qwen via hun eigen API, dan gaat je data naar Chinese servers -- met alle juridische implicaties.
De oplossing is self-hosting: download de modelgewichten en draai ze op Europese infrastructuur. Dan heb je de prestaties en de lage kosten, zonder de privacy-risico's. Maar dan draag je wél de verantwoordelijkheid voor hosting, updates en compliance.
Llama 4: Amerikaans, maar self-hostbaar
Meta's Llama 4 valt onder Amerikaanse jurisdictie. Via Meta's eigen API gaat data naar de VS. Maar als open-weight model kun je het -- net als DeepSeek en Qwen -- op Europese hardware draaien. De licentie kent beperkingen die DeepSeek en Qwen niet hebben (de 700M-gebruikersdrempel), maar die zijn voor MKB niet relevant.
GPT-NL en andere Nederlandse initiatieven
Nederland werkt aan een eigen soeverein taalmodel: GPT-NL. Het project ontvangt 13,5 miljoen euro subsidie van het ministerie van Economische Zaken en wordt gebouwd door TNO, SURF en het Nederlands Forensisch Instituut (NFI) met een team van circa 25 mensen. De pre-training is begin 2026 afgerond, en sinds februari 2026 draaien vijf organisaties pilotprojecten -- met uitbreiding naar tien in het voorjaar. Een bredere uitrol staat gepland voor de tweede helft van 2026.
Opmerkelijk: GPT-NL is het eerste AI-initiatief wereldwijd dat een betaalde licentieovereenkomst sloot met de NDP Nieuwsmedia (de Nederlandse uitgeversvereniging). Dat toont aan dat AI-innovatie ethisch kan plaatsvinden, zonder grootschalig onrechtmatig gebruik van journalistieke content. De modelgewichten worden op aanvraag beschikbaar gesteld, en de volledige trainingsdataset komt op HuggingFace.
De AI Act stelt eisen aan hoge-risico AI-systemen, en data-soevereiniteit speelt daarin een cruciale rol. Belangrijk detail: de vrijstellingen voor open-source aanbieders in de AI Act gelden alleen voor de modelleverancier (Meta, Mistral), niet voor bedrijven die het model inzetten. Wie een open-weight model finetunet voor een hoog-risico toepassing, wordt juridisch gezien zelf leverancier -- met alle conformiteitseisen die daarbij horen.
Voor bedrijven die nu al willen starten met AI hoeft GPT-NL niet afgewacht te worden. Mistral biedt nu al Europese verwerking, en elk open-weight model is zelf te hosten op Nederlandse of Europese servers. In onze gids over AI-automatisering beschrijven we hoe je stapsgewijs AI implementeert -- ongeacht welk model je kiest.
Wanneer kies je open-source?
Niet elk bedrijf heeft een open-source model nodig. En niet elk bedrijf dat er baat bij heeft, moet het zelf hosten. Een beslisframework:
Kies een gesloten model (ChatGPT, Claude) als:
- Je minder dan 100 miljoen tokens per dag verwerkt -- de API is dan goedkoper
- Je geen DevOps-team hebt om modellen te beheren
- Je snelle iteratie belangrijker vindt dan volledige controle
- Je gebruik maakt van de ecosystemen rondom gesloten modellen (plugins, integraties)
Kies een open-source model via API als:
- Je kosten wilt drukken -- Llama 4 en Qwen zijn per token 10-100x goedkoper
- Je wilt experimenteren met finetuning op eigen data
- Je niet gebonden wilt zijn aan één aanbieder
- Je Europese dataverwerking nodig hebt (Mistral API)
Kies self-hosting als:
- Je meer dan 100 miljoen tokens per dag verbruikt
- Je volledige controle over data nodig hebt (compliance, IP-bescherming)
- Je een DevOps-team hebt dat GPU-infrastructuur kan beheren
- Je het model wilt aanpassen (finetuning, domeinspecifieke kennis)
Bij CleverTech helpen we bedrijven met het bouwen van maatwerk software die AI-modellen integreert -- of dat nu een gesloten API is, een open-source model via een cloud-aanbieder, of een volledig zelfgehoste oplossing. We bouwen ook autonome AI-agents die zelfstandig taken uitvoeren, ongeacht het onderliggende model.
De hybride aanpak
In de praktijk kiezen steeds meer organisaties een hybride strategie: een krachtig gesloten model voor complexe taken (redeneren, coderen, strategische analyses) en een goedkoper open-source model voor bulk-taken (classificatie, samenvatting, dataverwerking). Die combinatie geeft je het beste van beide werelden: topkwaliteit waar het telt, lage kosten waar het kan.
Veelgestelde vragen over open-source AI-modellen
Antwoorden op de vragen die ondernemers het vaakst stellen over open-source AI voor zakelijk gebruik.
Opgesteld met AI-tools en gecontroleerd door het redactieteam van CleverTech -- tech-leads met ervaring in AI, procesautomatisering en IT-consulting.


