Utrechtse digibeteraars: Quinten van Furhat Robotics

11.06.21 8:44 Reactie(s) Door Bas Evers

Quinten Stekelenburg uit Utrecht doet een masteropleiding Kunstmatige Intelligentie en werkt op afstand als ontwikkelaar (‘skill developer’) aan Furhat, een Zweedse sociale robot die de interactie tussen mens en technologie even goed wil laten voelen als interactie van mens tot mens. Hun missie met het ontwikkelplatform: vanuit begrip van de mens op weg naar meer menselijke technologie.


Quinten studeerde technische informatica in Rotterdam. Hij vond het niet genoeg om alleen een opleiding te volgen; hij wilde de combinatie met de praktijk en de verbreding zoeken. Daarom is hij stage gaan lopen bij Furhat Robotics in Zweden. 


Voor zijn afstudeerproject, bij Rabobank, heeft Quinten uitgezocht in hoeverre Furhat goede vragen kan stellen en kan doorvragen. De robot voerde een evaluatiegesprek met een medewerker, waarbij sentiment-analyse werd toegepast. Simpel gezegd, naast de betekenis van de zin, ook de lading van synoniemen voor hetzelfde meenemen. Als een medewerker zich bijvoorbeeld in negatieve termen uitliet over zijn manager, ging de robot doorvragen. Uit deze gesprekken tussen robot en mens kwam meer naar boven over de relatie tussen werknemer en leidinggevende, dan in een rechtstreeks gesprek tussen beide personen.


Op dit moment zit Quinten in een internationaal ontwikkelteam dat gezamenlijk bouwt aan alle (zichtbare en onzichtbare) functionaliteit. Quinten ontwikkelt voor de back-end, maar er is bijvoorbeeld ook een techneut die ervoor moet zorgen dat de fysieke robot niet oververhit raakt. 


Quinten beheerst een veelvoud aan programmeertalen en geniet van de afwisseling. Hij vindt dat je als developer steeds de juiste taal moet kiezen bij de applicatie. Sommige ontwikkelaars raken getrouwd met één programmeertaal en geven daar zo’n eigen draai aan dat de code niet meer begrijpelijk is voor een ander. In het kleine team met zes “manusjes-van-alles” kunnen de ontwikkelaars van Furhat zich zulke silo’s niet veroorloven.

[tekst gaat verder onder de afbeelding]
Quinten Stekelenburg demo Furhat Robotics
Beeld: Quinten Stekelenburg demonstreert de virtuele versie van Furhat
              

Op zoek naar de zin van sociale robots

Furhat Robotics is ontstaan op de campus van de technische universiteit van Stockholm en sinds zeven jaar een zelfstandige onderneming. Het is een start-up waar investeerders bij betrokken zijn. Dat ze een academische achtergrond hebben blijkt uit hun klantenbestand, want het Furhat platform wordt veel ingezet in wetenschappelijk onderzoek om uit te vinden in welke situaties een sociale robot een zinnige toevoeging of alternatief is. Er zijn ruim 150 papers waarbij Furhat-technologie is ingezet.


Een voorbeeld van zo’n zinnige toepassing, waar Quinten erg enthousiast van wordt, is eerlijke baankansen voor iedereen. Furhat werkt samen met recruitmentbureaus die bewust een eerste gesprek met een kandidaat door een robot laten doen, zonder dat een mens het gesprek kan horen of zien. Want alleen een robot kan in zijn visie neutraal en onbevooroordeeld zijn. In Zweden partnert Furhat met Tengai Unbiased, in Nederland met HR-adviesbureau LTP dat hun recruitmentrobot Sigmund heeft genoemd. Beide zijn trouwens voorbeelden van commerciële toepassing van Furhat buiten de academische wereld.


Onder de motorkap van Furhat Robotics

Feitelijk is Furhat een platform met hardware, algoritmes en een SDK waar iedereen zijn eigen - fysieke of virtuele - robot mee kan bouwen. Quinten heeft eerder voor NS International een ‘proof of concept’ gemaakt met Amazon Alexa waarbij klanten met hun stem een treinkaartje konden bestellen. Met Furhat kan zoiets ook, maar dan komt er hardware bij, gezichtsmaskers en taalmodellen. Op de robot zit bijvoorbeeld een camera die de gebruiker detecteert. 


De conversaties van Furhat zijn niet zelflerend; ze vragen denk- en programmeerwerk vooraf. Je moet een eigen model met ‘intents’ en gespreksbomen bouwen. De robot kan offline functioneren, maar voor de taaltechnologie is een cloudkoppeling gewenst. Onder de motorkap ondersteunt Furhat verschillende spraak-naar-tekst- en tekst-naar-spraak clouddiensten. Google is de standaard voor speech-to-text en Amazon Polly is de eerste keuze voor spraaksynthese. Eigen text-to-speech inbouwen met behulp van audiobestanden is ook mogelijk, maar levert minder vloeiende gesprekken op.


Om privacy-redenen bewaart Furhat zelf geen enkel gesprek, waardoor je afhankelijk bent van hoe snel Google en Amazon beter worden in ‘natural language understanding’. Klanten van Furhat kunnen er wel voor kiezen om gesprekken op te slaan. Furhat leert dus weliswaar niet van de taal, maar wel van andere aspecten tijdens de dialoog. Als de uitdrukking van de robot bijvoorbeeld niet passend lijkt, wordt die aangepast.

Een goed gesprek met duidelijk nep

Quinten gelooft dat een sociale robot als Furhat een betere interface is voor interactie met technologie dan bijvoorbeeld een mobiele telefoon. Hij vertelt enthousiast over de snel veranderende houding van mensen die met een Furhat-robot in contact treden. Ze starten vaak met een Terminator-vooroordeel, maar al snel beginnen ze de robot te zien als een gesprekspartner en zijn ze op hun gemak. 


Een van de principes waar ik zelf in geloof is dat je als mens moet weten wanneer je met een machine praat en wanneer met een mens. Met andere woorden, dat een machine zich niet 100% als mens moet proberen voor te doen. Quinten en Furhat zitten hier ook zo in: hun robot heeft een 3d-geprint masker met een projector, en houdt daarmee het midden tussen Sophia (die Quinten te rubberachtig eng vindt) en een slimme speaker (waarbij het menselijk gezicht ontbreekt). Quinten is ervan overtuigd dat Furhat hiermee uniek is in de wereld van sociale robots. 


Hoewel Furhat er dus bewust niet uitziet als een mens, moet de interactie wel zo voelen. Gevraagd naar de grootste technische uitdaging op weg naar dit doel, komt Quinten met een voorbeeld uit de conversatie: interrupties en beurtwissels. In een menselijke dialoog pikken de gesprekspartners het vanzelf op als de ander iets wil zeggen; een robot ratelt maar door. De twee gesprekslijnen (de kunstmatige spraak van de robot en de menselijke input van de gebruiker) real-time analyseren en combineren met niet-talige cues is een huzarenstukje, waar Quinten graag zijn tanden in zet.
Wat vind jij van sociale robots?
Deel -