Wat is spreker-diarization?
Spreker-diarization (afkorting: "diarisation") is het proces waarbij een AI-model audio analyseert en bepaalt wie wat zegt โ niet alleen wat er gezegd wordt. In een transcript zie je dan:
Spreker A: Goedemorgen, hoe gaat het met u? Spreker B: Goed, dank u. En met u?
Dit klinkt eenvoudig, maar het is een van de moeilijkste taken in spraaktechnologie.
Hoe werkt het?
Het model luistert naar kenmerken van de stem zoals:
- Toonhoogte (pitch)
- Spreektempo
- Klankkleur (timbre)
- Adempatronen
Vervolgens clustert het de audio in stukken die bij dezelfde stem lijken te horen. Het is niet zo dat het model namen of identiteiten herkent โ het ziet alleen "deze stem is anders dan die andere".
Wanneer werkt het goed?
In ideale omstandigheden bereikt onze diarisation een nauwkeurigheid van >95%. Voorwaarden:
- 2โ4 sprekers
- Duidelijk verschillende stemmen (bijvoorbeeld man + vrouw)
- Goede opnamekwaliteit zonder achtergrondruis
- Sprekers wisselen niet te snel af (geen interrupties)
Wanneer faalt het?
Lastige situaties zijn bijvoorbeeld:
- Twee mensen die door elkaar praten
- Slechte opnamekwaliteit (verre microfoon, lawaai)
- Sprekers met zeer vergelijkbare stemmen
- Veel sprekers (>5 wordt al lastig)
In die gevallen kan de AI sprekers verwisselen of verkeerd splitsen. Wij voorzien daarom altijd een edit-modus waarin je sprekerlabels kunt corrigeren.
Tips voor betere resultaten
- Gebruik een goede microfoon โ bij voorkeur een lavalier of headset per spreker
- Vermijd cross-talk โ vraag mensen om elkaar te laten uitspreken
- Bij online meetings โ gebruik de "per-speaker recording" optie van Zoom/Teams als beschikbaar; wij combineren ze automatisch
- Test eerst โ voor belangrijk werk: doe een korte test-opname om de kwaliteit te checken
Nieuw in ForgetLess: speaker color-coding
Vanaf deze week zie je in onze transcript-weergave gekleurde sprekerlabels. Elke spreker krijgt zijn eigen kleur, waardoor je in รฉรฉn oogopslag de structuur van het gesprek ziet. Vooral handig bij focusgroepen of paneldiscussies.
Probeer het uit op je volgende transcript!
