Warning: this is a beta environment for demonstration purposes

dataset

Diversiteitsstatement in organisatiebeschrijving bij vacatureteksten op Werken voor Nederland

De dataset bevat de omschrijving van overheidsorganisaties (onder andere ministeries) of ze een diversiteitsstatement bevatten of niet. Op deze manier kunnen we in een model automatisch onderzoeken of er wordt gerefereerd naar diversiteit en inclusie in een organisatieomschrijving van een vacaturetekst. Een bredere groep kan zich aangesproken voelen bij het opnemen van een onderbouwd statement op diversiteit in de vacaturetekst.

Een diversiteitsstatement kan bijvoorbeeld zijn: "Wij zien diversiteit als een verrijking voor de organisatie waarbij het gaat om gender, leeftijd, cultuur/migratie-achtergrond, opleiding, werkervaring en medewerkers met een beperking."

Distributions (1)

Gelabelde organisatie teksten

Dataset bevat twee kolommen: text en label. Teksten zijn organisatiebeschrijvingen van WerkenVoorNederland.nl en in sommige gevallen bevatten deze teksten een diversiteitsstatement of niet. De label geeft aan wanneer dit wel het geval is en wanneer niet.

## Informatie:
- Kolommen: |text|label|
- Aantal rijen: 581
- Aantal labels: 2, binaire classificatie
- Verdeling: ja 186 (32%) | nee 395 (68%)
### Label uitleg:
- ja = diversiteitsstatement is gevonden in de tekst
- nee = geen diversiteitsstatement gevonden in de tekst

## Voorbeeld:
### text:
Het ministerie van Economische Zaken en Klimaat streeft ernaar een werkgever te zijn waar iedere medewerker, ongeacht leeftijd, sekse, geaardheid, etnische afkomst en arbeidsbeperking, voor wil werken. Werken aan maatschappelijke vraagstukken in divers samengestelde teams maakt ons effectiever, innovatiever en het werk leuker. Het Centraal Planbureau heeft als taak op wetenschappelijke basis economische analyses en prognoses te maken die relevant zijn voor het beleid van de regering, het parlement en andere maatschappelijke organisaties.
### label:
ja

## Gestelde vragen over de databron:
- Wat is de herkomst van de teksten?
- Elke vacature heeft een organisatiebeschrijving op Werken voor Nederland. Organisatiebeschrijvingen worden in de loop van de tijd veranderd, maar de organisatiebeschrijving die toen online stond, wordt bewaard bij de vacature. Organisatiebeschrijvingen kunnen dus verouderd zijn en niet meer up-to-date. Het doel van deze classificatie is alleen om te bepalen of er een diversiteitsstatement in voor komt of niet.
- Waren dit alle organisatieomschrijvingen van vacatures op Werken voor Nederland op een bepaald tijdstip?
- Dataset maakte gebruik van de vacatures die tussen 2014 en november 2020 zijn gepubliceerd.
- Hoe heb je de selectie gemaakt?
- Organisatiebeschrijvingen zijn grotendeels willekeurig geselecteerd (486 rijen). Data is wel bijgevuld met verschillende dubbele rijen (96 rijen). Deze dubbele rijen zijn er om de dataset te balanceren/
- Hoe heeft de labeling plaatsgevonden?
- Een persoon classificeerde de dataset. Een kleine uitsnede uit de dataset is geverifieerd door een tweede persoon.

XLSX http://creativecommons.org/publicdomain/zero/1.0/deed.nl CC-0 (1.0)