Menu

Filter op
content
PONT Data&Privacy

0

Consortium werkt aan Nederlands alternatief voor ChatGPT: dit weten we

Een non-profit consortium gaat werken aan een open GPT taalmodel voor Nederland. Het doel is digitale soevereiniteit van het land te bevorderen, transparante AI te bieden en privacy te waarborgen. GPT-NL zal gratis zijn voor academische en publieke instanties en wordt ontwikkeld met ethische waarden in gedachten. De eerste versie wordt verwacht tegen eind 2024.

3 november 2023

Nieuws-persbericht

Nieuws-persbericht

Een consortium bestaand uit non-profit organisaties TNO, SURF en het Nederlands Forensisch Instituut (NFI) heeft donderdag plannen voor de ontwikkeling van een open taalmodel aangekondigd. 'GPT-NL', zoals de drie organisaties het noemen, zal dienen als Nederlands eigen taalmodel. Zo kunnen zowel academische instellingen het taalmodel inzetten bij onderzoeksactiviteiten, als overheidsinstanties op het gebied van onder meer gezondheid, defensie en veiligheid.

GPT-NL heeft het doel om de digitale soevereiniteit van Nederland te versterken door de inzet van transparante, eerlijke en toetsbare AI. " Dat gaat niet alleen inhoudelijk bijdragen aan de activiteiten van Nederlandse organisaties, maar zelfs het beslissingsproces rondom deze activiteiten conform Nederlandse en Europese waarden ondersteunen met technologie en data. ", verklaart Selmar Smit, hoofdwetenschapper bij TNO, tegenover PONT | Data & Privacy.

Tegenhanger voor Big Tech

Naar Zweedse voorbeeld (1) begon het plan vorm te krijgen aan het eind van vorig jaar, toen de drie partnerorganisaties een onderzoek deden naar de behoefte en haalbaarheid van een open taalmodel in de Nederlandse samenleving toepasbaar op grote schaal. "TNO heeft jarenlang ervaring bij de ontwikkeling van taalmodellen, terwijl SURF de nodige hardware expertise brengt. NFI werkt ook in-house aan zijn eigen modellen en wil graag GPT-NL gaan toepassen aan real case scenario's. Dus daar zit een perfecte combinatie." Het NFI gaf aan dat medewerkers het model vooral gaan toepassen bij forensische activiteiten, zoals bij spraakonderzoek voor de identificatie van een stem en auteursherkenning bij online berichten.

De 13,5 miljoen euro financiering voor GPT-NL heeft het Ministerie voor Economische Zaken en Klimaat beschikbaar gemaakt. Smit geeft toe dat er geen sprake is van echte concurrentie met de Amerikaanse techreuzen, gezien de aanzienlijke begrotingsverschillen. "Toch kunnen wij nog een vergelijkbare oplossing aanbieden op een betrouwbare manier. GPT-NL gaat inderdaad zowel in het Nederlands als in het Engels goed werken."

Bijzonderheden

GPT-NL wordt zo gelanceerd dat de broncode door mensen in te zien is en onder licentievoorwaarden te gebruiken voor eigen doelen. Zodoende kunnen meer collaboratieve vormen van softwareontwikkeling ontstaan ten voordele van concurrentie en innovatie. ChatGPT is daarentegen propriëtaire software, waarover OpenAI eigendomsrechten heeft en geen vrije toegang verleent tot diens broncode. Daarnaast biedt het Amerikaanse bedrijf ChatGPT op een 'freemium' basis aan, waarbij kosten zijn verbonden aan het gebruik van de geavanceerde softwareversie, naast de gratis basisversie. Het consortium wil GPT-NL volledig gratis aanbieden aan academici en publieke organisaties. Wat betreft de private sector, is Smit nog onzeker over het soort commercieel licentiemodel. "Ik sluit niet uit dat bedrijven zullen moeten betalen, maar dat moeten wij nog intern afstemmen, vooral met de juridische experts."

Privacy en ethiek

De training van GPT-NL zal plaatsvinden op basis van gegevens die openbaar zijn gepubliceerd. Smit erkent dat er persoonsgegevens onder deze kunnen zitten. Ter bescherming van de privacy van de burgers zijn er afspraken gemaakt binnen het consortium om niet-geanonimiseerde gegevens uit te sluiten vanuit het trainingsproces. "Dat gaat niet 100% werken, daarom zijn wij ook oplossingen aan het bedenken om een 'opt-out' mogelijkheid aan burgers te bieden, zodat hun gegevens zeker niet in onze datasets terechtkomen."

NFI hecht er groot belang aan dat wanneer modellen worden gebruikt voor forensisch onderzoek, de overige partijen in het strafproces een uitleg kunnen krijgen over de werking en training van het model. "Het is belangrijk om de kans op bias – onbewuste vooroordelen - in de conclusie van NFI-onderzoeken zo klein mogelijk te maken."

De eerste versie van GPT-NL verwacht Smit eind 2024 klaar te hebben.

Bronnen

(1) https://www.ai.se/en/node/81535/language-models-swedish-authorities.

Artikel delen

Reacties

Laat een reactie achter

U moet ingelogd zijn om een reactie te plaatsen.

KENNISPARTNER

Martin Hemmer