Kunstmatige intelligentie voor zoeken en screenen literatuur


Samenvatting

Dit artikel bespreekt hulpmiddelen en bronnen gebaseerd op kunstmatige intelligentie (AI) voor het zoeken en selecteren van literatuur en voor tekst en data mining.

null

Inleiding

Kunstmatige intelligentie (hierna AI) heeft een steeds grotere invloed op de academische wereld en verandert de manier waarop we wetenschappelijke informatie zoeken, evalueren en publiceren. In dit kennisartikel geeft WUR Library advies over het gebruik van AI voor bibliotheek gerelateerde taken in je studie, onderwijs en onderzoek.

Op deze pagina vind je links naar hulpbronnen en AI-toepassingen. Voordat je een AI-tool voor een specifieke taak gebruikt, moet je altijd controleren of deze voldoet aan het beleid en voorwaarden van WUR.

Algemene overwegingen

Het is belangrijk om AI-tools op een verantwoorde manier te gebruiken en bewust te zijn van hun beperkingen.

  • AI is breder dan genAI. Sommige van de tools die op deze pagina worden besproken, zijn gebaseerd op genAI, maar andere niet.
  • AI-tools kunnen worden gebruikt voor bibliotheek gerelateerde taken, zoals het zoeken en vinden van wetenschappelijke informatie, tekst- en data mining, en het screenen van publicaties. Voor de meeste van deze toepassingen kan AI conventionele tools en methoden nog niet vervangen en moet het worden gebruikt als aanvullend hulpmiddel. Hieronder lees je meer over de verschillende toepassingen.
  • Hoewel AI het werk van experts kan ondersteunen, die door AI gegenereerde content nauwkeurig kunnen beoordelen, brengt het gebruik van AI zonder vakkennis risico's met zich mee, zoals het niet herkennen van onjuiste informatie of het vertrouwen op door AI gestuurde beslissingen zonder deze volledig te begrijpen.
  • Gebruik (gen)AI op een verantwoorde manier. Meer informatie hierover vindt je op de WUR-ondersteuningspagina voor studenten over AI of de WUR-ondersteuningspagina voor docenten en medewerkers over AI.
  • Auteursrecht is een belangrijk aspect om rekening mee te houden bij het gebruik van AI. Upload nooit materiaal dat auteursrechtelijk beschermd is in een genAI-tool. Het Copyright Information Point van WUR kan je helpen met vragen over door AI gegenereerde teksten en afbeeldingen, bijvoorbeeld of je auteursrecht hebt, het risico op inbreuk bij hergebruik van door AI gegenereerde content en het gebruik van gegevens voor het trainen van AI.

Documenteer je AI gebruik

Je moet je gebruik van AI documenteren, of het nu voor je academische werk als student is of voor een publicatie in een wetenschappelijk tijdschrift. Je moet alle informatie vastleggen in het kader van academisch integriteit. Je moet ook alle output die je genereert documenteren.

Bent je student? Lees dan ‘How to document your GenAI use?’ van WUR.

Ben je onderzoeker, promovendus of postdoc aan WUR? Controleer dan de richtlijnen van het tijdschrift waarin je wilt publiceren.

Ter aanvulling, vermeld AI niet als bron of auteur. Door AI gegenereerde tekst, afbeeldingen of documenten zijn geen (primaire) informatiebronnen. Je moet altijd de primaire informatiebron lezen en vermelden.

Zoeken naar wetenschappelijke informatie

Het kan verleidelijk zijn om snel wetenschappelijke informatie te zoeken in genAI-tools zoals ChatGPT, Copilot of Gemini. De onderliggende trainingsgegevens en parameters van deze large language models zijn echter onbekend en het antwoord dat je krijgt, kan gekleurd of onjuist zijn (hallucinatie). Deze tools zijn niet ontwikkeld om wetenschappelijke informatie te zoeken.

Sommige AI-tools kunnen je helpen bij het zoeken naar wetenschappelijke informatie. Deze kun je onderverdelen in twee categorieën: tools die een lijst met referenties geven op basis van je zoekopdracht, zoals Elicit of Consensus, en tools die een overzicht geven van onderling verbonden en gelinkte artikelen, zoals Connected Papers of Litmaps. Een uitgebreide lijst van deze tools met informatie over de onderliggende database, het privacybeleid, de beperkingen en de kosten wordt aangeboden door de universiteitsbibliotheek van Tübingen onder ‘Literature Research with AI – Tools and Introduction’.

WUR-Library raadt aan om bovengenoemde AI-tools alleen te gebruiken als aanvulling op Booleaanse en systematische zoekopdrachten in bibliografische databases, zoals Scopus, CAB Abstracts of PubMed. Het bereik van de op AI gebaseerde tools is beperkt en kan beperkt zijn tot een specifiek studiegebied of alleen tot open access-publicaties. Het is ook mogelijk dat je relevante literatuur mist, omdat deze tools slechts een beperkt aantal artikelen laten zien bij de zoekresultaten.

Je kunt tools zoals ChatGPT gebruiken om je te helpen bij het formuleren van een Booleaanse zoekopdracht voor bibliografische databases. Houd er rekening mee dat je moet weten hoe de door jou gekozen database werkt en hoe je zorgvuldig prompts moet kiezen om een goed resultaat te krijgen. Realiseer je dat je nog steeds belangrijke zoektermen kunt missen, dat de syntaxis van de door genAI gegenereerde zoekopdracht mogelijk niet correct is en dat je niet alle functionaliteiten van een bibliografische database kunt gebruiken op deze manier. Voorbeelden van prompts die je kunt gebruiken om zoekopdrachten voor bibliografische databases te maken, vindt je in de Libguide van Birmingham City University.

Studies screenen en selecteren

AI-tools kunnen je helpen om publicaties  te screenen en te selecteren. Voorbeelden hiervan zijn ASReview LAB, Rayyan, EPPI-Reviewer of Covidence.

ASReview LAB is een gratis open source machine learning tool die een grote verzameling tekstuele gegevens screent en systematisch labelt. De tool is ontwikkeld door de Universiteit Utrecht. Je kunt de software lokaal op je apparaat installeren en je behoudt volledige controle over je gegevens.

ASReview LAB maakt gebruik van actief leren. Het leert van de selecties die je maakt op basis van je inclusie-/exclusiecriteria. Aan het begin van het proces moet je de tool voorzien van een training set van ten minste één relevant en één irrelevant record/publicatie. Na elke beslissing rangschikt de tool de publicaties die je nog niet hebt gezien opnieuw en verplaatst de publicaties die waarschijnlijk relevanter zijn naar de top. Naarmate je doorgaat met screenen, zult je steeds meer irrelevante publicaties vinden. Op een gegeven moment kunt je besluiten om te stoppen met screenen en zo tijd te besparen.

Rayyan maakt ook gebruik van kunstmatige intelligentie om je te helpen bij het beoordelen. Je kunt individuele referenties labelen met de reden voor opname of uitsluiting of andere nuttige termen die verband houden met het onderwerp, de populatie of de geografie. De basisversie van de tool is gratis.

Extractie van gegevens

AI-tools kunnen je helpen om automatisch gegevens uit publicaties te halen en de gevonden informatie te structureren, bijvoorbeeld in een spreadsheet, database of data lake(house) met informatie zoals de onderzochte populatie, setting, geografie, het aantal proefpersonen, de methodologie, statistische resultaten, enz.

Elicit is een AI-tool die gegevens uit wetenschappelijke artikelen kan zoeken, samenvatten en extraheren. Je kunt ook zelf artikelen uploaden als het auteursrecht dit toestaat. Lees meer over gegevensextractie met Elicit in deze libguide van Birmingham City University.

DistillerSR is een AI-tool die kan worden gebruikt in alle stappen van een systematische review, inclusief gegevensextractie. Let op: dit is geen gratis tool.

Als alternatief kunt je modellen (kant-en-klaar of op maat gemaakt) gebruiken die zijn gebaseerd op (gen)AI. Als je hier meer over wilt weten, kunt je een e-mail sturen naar mdt.library@wur.nl .

Copyright waarschuwing: Wees voorzichtig met het uploaden van auteursrechtelijk beschermd materiaal in AI-tools. Het is toegestaan om tekst- en datamining uit te voeren op auteursrechtelijk beschermd materiaal voor niet-commerciële onderzoeksdoeleinden. Voor onderwijs of andere doeleinden moet je voorzichtig zijn, aangezien sommige uitgevers niet toestaan dat je hun gelicentieerde materiaal uploadt naar AI-tools. Uitgevers kunnen een ‘opt-out’ aanvragen, wat betekent dat je hun materiaal niet mag gebruiken voor tekst- of datamining. De meeste uitgevers hebben (nog) geen dergelijke ‘opt-out’ voor AI-training, wat betekent dat je hun materiaal wel mag gebruiken voor tekst- en datamining met AI-tools. Vraag het Copyright Information Point om hulp bij de vraag of je auteursrechtelijk beschermd materiaal mag gebruiken in AI-tools.

Publiceren en peer-review

Een artikel indienen:

Het gebruik van AI-tools voor het schrijven en publiceren van artikelen roept vragen op over de kwaliteit en betrouwbaarheid van de publicatie, academische integriteit, auteurschap en bronvermelding. Vooringenomenheid en onnauwkeurigheden die door de AI-tool worden gegenereerd, ondermijnen de academische integriteit. Wie kan aanspraak maken op het eigendom van door AI gegenereerde inhoud? De huidige wetgeving inzake intellectueel eigendom biedt hierop nog geen duidelijk antwoord. AI-tools kunnen leiden tot plagiaat.

WUR-Library dringt er bij je op aan om transparant te zijn over je gebruik van AI-tools en altijd het beleid van een uitgever te controleren voordat je door AI gegenereerde inhoud in je publicatie opneemt. De meeste uitgevers eisen dat je expliciet vermeldt dat je AI gebruikt, terwijl andere het gebruik ervan voor bepaalde doeleinden, zoals het maken van figuren, verbieden. Daarnaast heeft WUR richtlijnen voor het gebruik van genAI-tools in PhD-onderzoek.

Hieronder volgt een niet-uitputtende lijst met links naar het AI-beleid van uitgevers:

Peer-review:

Om redenen van vertrouwelijkheid en eigendomsrechten adviseren we peer-reviewers om nooit een niet-gepubliceerd manuscript te uploaden naar een extern gehoste tool, zelfs niet als je alleen de spelling of grammatica wilt verbeteren. Door dit te doen, schend je de vertrouwelijkheid die van jou als peerreviewer wordt verwacht en loop je het risico om gevoelige gegevens te uploaden. Bovendien vereist het peer-reviewproces vaak een hoog niveau van begrip van het onderwerp, wat volgens sommigen alleen door een mens kan worden uitgevoerd. Sommige uitgevers hebben al een beleid voor reviewers.

AI tool selecteren

Bij het selecteren van een AI-tool moet je met veel aspecten rekening houden. Stel jezelf kritische vragen bij het selecteren of afwijzen van een tool:

  • Doel. Hoe ben je van plan de tool te gebruiken? Wat is je (informatie)behoefte?
  • Ontwikkelaars. Waar bevinden zich het hoofdkantoor of de servers fysiek? Wie zijn de financiers? Zijn er mogelijke belangenconflicten?
  • Nauwkeurigheid en betrouwbaarheid. Is de tool die je hebt geselecteerd gevoelig voor hallucinaties (onjuiste resultaten)?
  • Vooringenomenheid. Ben je zich bewust van de mogelijke vooringenomenheid van de tool?
  • Transparantie. Hoe is de tool getraind? Wat is de onderliggende database? Welke gegevens gebruikt de tool? Hoe neemt de tool beslissingen en produceert hij specifieke resultaten?
  • Gegevensprivacy en -beveiliging. Wat voor soort gegevens worden door de tool verzameld? Waarvoor worden ze gebruikt (bijvoorbeeld: training)? Met wie worden ze gedeeld? Voldoet het aan de voorschriften voor gegevensbescherming (AVG)?
  • Toegang. Is het een betaalde tool? Houd er rekening mee dat de WUR-bibliotheek momenteel geen toegang biedt tot betaalde AI-tools.
  • Je kennis van AI. Beschikt je over voldoende kennis om de tool effectief en veilig te gebruiken?
  • Je vakkennis. Beschikt je over voldoende kennis om de door de tool gegenereerde resultaten te beoordelen?
  • Herhaalbaarheid. Moet je of iemand anders je werk kunnen herhalen, bijvoorbeeld voor een systematische review?

WUR heeft ook verschillende tools beoordeeld op basis van nauwkeurigheid en kwaliteit, flexibiliteit en functies, en gegevensbeveiliging en privacy (studentenmedewerkers).

AI output evalueren

AI-output kan onjuist (hallucinatie), onvolledig, verouderd of bevooroordeeld zijn. Gebruikers moeten het antwoord dat de tool geeft altijd evalueren. Dit geldt voor alle AI-output, inclusief gegenereerde teksten, gegevens die uit een publicatie zijn gehaald, verstrekte referenties, gegenereerde afbeeldingen, enz.

Vraag de tool om bronnen te verstrekken ter ondersteuning van zijn bewering

Lees de bronnen! Zijn ze echt? Zijn ze betrouwbaar? Zijn ze van goede kwaliteit? Zijn ze onbevooroordeeld? Ondersteunen de bronnen wat de AI-output beweert? Waarom zijn deze bronnen gekozen? Zijn er betere bronnen, of ontbreken er bronnen die van invloed zijn op de informatie die de AI-tool je geeft?

Lateraal lezen

Je kunt de informatie die door een genAI-tool wordt verstrekt, controleren met behulp van een methode die lateraal lezen wordt genoemd. Deze methode is bedoeld om de geloofwaardigheid van een informatiebron te beoordelen door deze te vergelijken met andere bronnen. Het gaat hier niet om het beoordelen van de bronnen die door de genAI-tool worden verstrekt. Het gaat om het zoeken naar informatie over hetzelfde onderwerp via verschillende zoeksystemen, bijvoorbeeld via een bibliografische database, een Google-zoekopdracht of in de media. Vervolgens kun je beslissen of de informatie die door de genAI-tool wordt verstrekt waar, onwaar, misleidend, bevooroordeeld enz. is.

Volledigheid

Biedt de tool je het gewenste detailniveau of krijgt je slechts een kleine selectie publicaties te zien? Zijn deze publicaties voor je het meest relevant en sluiten ze aan bij je doel? Of mis je publicaties die belangrijk zijn om te vinden?

Een opmerking over paper mills

Paper mills zijn bedrijven die artikelen van slechte kwaliteit of nep-artikelen publiceren. Sommige paper mills gebruiken genAI om nep-artikelen te genereren en deze in hun tijdschriften te publiceren. Je kunt meer lezen over hoe je artikelen van paper mills kunt herkennen op retraction watch.

Beleid en hulpbronnen met betrekking tot het gebruik van (gen)AI bij WUR

WUR heeft beleid, richtlijnen en hulpbronnen met betrekking tot het gebruik van (gen)AI.

Meer lezen

Als het onderwerp van kunstmatige intelligentie voor jou relevant is, zijn de volgende bronnen wellicht ook interessant voor je:

  • AI in society – MOOC cursus over hoe AI-technologies functioneert binnen het maatschappelijke context: hoe AI de samenleving en de sociale praktijken verandert, hoe het wordt gebuikt in institutionele settings, en wat voor maatschappelijke beloften en uitdagingen dit technologie met zich meebrengt.
  • Prompting – een e-learning module van Universiteit Maastricht over prompt engineering.

Vragen en ondersteuning

Heb je vragen over deze dienst of wil je persoonlijke ondersteuning? Neem gerust contact op met ons. Je kunt een mailtje sturen naar Servicedesk Facilities.

Benieuwd wat WUR Library nog meer voor je kan betekenen?

Kijk op de Library website voor directe toegang tot alle literatuur databases en voor een overzicht van alle Library diensten, tools en ondersteuning. Via de chatfunctie op de website kom je direct in contact met een bibliotheekmedewerker of klik hier Chat online. We helpen je graag!