Kunstmatige Intelligentie inzetten om fake reviews te herkennen

Reviews, je vindt ze tegenwoordig overal. Denk aan Coolblue, TripAdvisor, Google Maps, Trustpilot, en nog op veel meer plekken. Maar hoe onderscheid je nu echte en neppe klantrecensies van elkaar? In deze blog vertellen wij hoe Artificial Intelligence (kunstmatige intelligentie) hierbij kan helpen.

Waarom moet ik neppe klantenrecensies verwijderen?

Op 14 oktober 2021 publiceerde de overheid het wetsvoorstel dat er in 2022 een verbod komt op het plaatsen van valse consumentenbeoordelingen. Zo wil de politiek verantwoordelijkheid voor de echtheid van online reviews bij bedrijven neerleggen. Houd je je als organisatie niet aan deze wet? Dan kan de boete volgens het NOS oplopen tot 4% van de omzet. Het is dus aan het bedrijf om actief op zoek te gaan naar mogelijke misleidende recensies.

Hoe gebruik je data science om fake reviews te herkennen?

Om te herkennen welke reviews echt of nep zijn, kan men gebruik maken van een machine learning (ML) model. Het model wordt gevoed met data over echte en neppe reviews. Door het model te ‘trainen’ kan het onderscheid leren te maken tussen echte en neppe reviews. Hieronder gaan we dieper in op wat dit ‘trainen’ precies inhoudt.

Het trainen van je eigen model

In de onderstaande tabel zie je een voorbeeld van een gelabelde dataset. Om onderscheid te kunnen maken tussen de reviews, is het van belang dat de verschillen in kaart worden gebracht. Dit kan worden gedaan door karakteristieken van de reviews toe te voegen aan elk datapunt (een review). De karakteristieken, zie de middelste kolommen hieronder, kunnen gaan over van alles in de reviews. Van informatie over de gebruiker tot karakteristieken van de review (bijv. aantal lidwoorden, stopwoorden, etc.). Tijdens het leren gebruikt het model de dataset en probeert die onderscheid te maken tussen de datapunten.

Tabel 1: Training dataset

Web 1920 – 1.jpg


Indien het leren is succesvol is afgerond, kunnen er voorspellingen worden gemaakt. Dit betekent dat een gebruiker van het model informatie over een bestaande review zou kunnen meegeven om vervolgens een voorspelling te ontvangen. Elk datapunt ontvang in dit scenario een voorspelling voor het label “ECHT” en “NEP” (bijv. 13% “ECHT” en 87% “NEP”). In het onderstaande figuur zie je hier een voorbeeld van. Deze voorspellingen helpt je als organisatie om snel te reageren op mogelijk neppe reviews.

Figuur 1: Voorspellingen maken met behulp van Machine Learning

Web 1920 – 1.jpg


Maak gebruik van bestaande modellen

Het categorisatie probleem van “ECHTE” vs. “NEPPE” reviews is een bekend probleem in het wetenschappelijke domein. Elk jaar worden nieuwe onderzoeken gepubliceerd en zo ontstaan er telkens betere modellen en detectietechnieken. Soms worden de uiteindelijke modellen ook openbaar gesteld zodat jij en ik hier gebruik van kunnen maken. Voorbeelden hiervan zijn:

  • Cornell University heeft een online tool waar je kunt testen of een Engelse review nep of echt is.
  • Fake Spot filtert automatisch op websites als Amazon, Ebay en Shopify de Engelse reviews waar zij denken dat deze nep zijn. Je kan deze tool gratis downloaden en toevoegen aan bijvoorbeeld je Chrome browser.

De oplossingen hierboven richten zich op Engelse reviews. Om hetzelfde te doen voor Nederlandse reviews is de kans groot dat je zelf een machine learning model zult moeten trainen.

Geïnspireerd? Neem contact op!

Ben je nieuwsgierig hoe machine learning binnen jouw bedrijf processen kan verbeteren? Neem dan contact op via de website of stuur ons een mailtje op info@quantile.nl voor een vrijblijvende sparringsessie.