AI-stemassistent helpt slechtzienden digitale skills leren
Onze schermen zijn ons dierbaar. Televisie, computer, tablet, smartphone. Ze bieden veel mogelijkheden en ze zijn - vaak - handig in gebruik. Maar wat met mensen die slechtziend of blind zijn? Wordt ook aan hun behoeften gedacht bij het ontwerp van deze apparaten? Nee, zegt IO-alumnus Konrad Krawczyk. Daarom creëerde hij een AI-gestuurde spraakassistent die mensen met een slecht gezichtsvermogen digitale skills helpt leren.
“Mijn vader werd blind als gevolg van een ongeluk”, legt Konrad uit. “en dus pasten we als gezin onze levensstijl aan. Voor onze vakanties bijvoorbeeld, welke plaatsen zijn toegankelijk? Maar voor technologie zoals computers of smartphones is het een ander verhaal. Ik zag mijn vader worstelen met digitale spraakassistents en ik wist dat het beter kon.”
Digitale spraakassistenten zijn niet goed ontworpen. Dat is vreemd als je kijkt naar de enorme bedrijven achter deze technologieën.
― Konrad Krawczyk
Voor zijn afstudeerproject werkte Konrad samen met de onderzoekers van het Inclusive Design Lab bij de IO-faculteit, zoals Stella Boess. En hij ging praten met Timon van Hasselt, die bij Visio gespecialiseerd is in ICT voor mensen met een visuele beperking. Visio is een expertisecentrum voor slechtziende en blinde mensen. “We hadden dezelfde visie op inclusief ontwerp voor deze groep, spraakassistenten zijn gewoon niet goed ontworpen. Wat ik nog steeds vreemd vind wanneer je kijkt naar de enorme bedrijven achter deze technologieën.”
Niet end-to-end
Konrad analyseerde de belangrijkste problemen bij bestaande spraakassistenten. “Bij de meeste tools is de begeleiding nooit volledig end-to-end. Er is altijd wel een kleine visuele component aanwezig, dus je hebt iemand naast je nodig die je te begeleidt.”
Enkele voorbeelden van slecht ontwerp: je vraagt Alexa om een liedje af te spelen. Alexa kan dat niet, want de benodigde app is nog niet geïnstalleerd. Dus laat de tool je een downloadlink zien en zegt 'klik hier om te installeren', maar hoe weet je waar te klikken? Een ander voorbeeld: je zoekt iets op het web. Wanneer de zoekresultaten verschijnen, zegt de stemassistent: 'dit is wat ik heb gevonden', maar hij leest de opties niet voor. “Een alternatief is dat een robotstem alles voorleest. Maar dit kan verwarrend zijn, en er is geen optie om je voorkeuren te personaliseren.”
LLM's zijn niet altijd betrouwbaar. Het goede nieuws is dat deze tool Visio-gegevens gebruikt, waardoor de gebruiker met relevante informatie kan werken.
― Konrad Krawczyk
Daarom wilde Konrad een spraakassistent maken die mensen zelfstandig kunnen gebruiken. Deze assistent moest zich kunnen aanpassen aan verschillende behoeften en contexten. Want er is bijvoorbeeld een verschil in leeftijd, of mensen die blind geboren zijn of blind zijn geworden in de loop van hun leven.
AI-gestuurde follow-ups
Wat is een betere technologie dan kunstmatige intelligentie (AI) om deze tool tot leven te doen komen? Daarom bedacht de IO-alumnus een AI-hotline die follow-upgesprekken voert met Visio-klanten die een training rond het gebruik van technologie volgen. Deze hotline geeft de klanten trainingen door middel van spraakopdrachten via de telefoon. “De tool maakt gebruik van Large Language Models (LLM’s), zoals ChatGPT. Maar deze LLM's zijn niet altijd even betrouwbaar. Het goede nieuws is dat de tool Visio-data gebruikt, waardoor de gebruiker met relevante informatie kan werken.”
Voordat Konrad koos voor spraaktechnologie, overwoog hij om een technologiegids in braille te maken. “Omdat het tastbaar is en je hebt er geen zicht voor nodig. Maar uit mijn onderzoek bleek dat niet veel mensen braille kunnen lezen of zich er niet prettig bij voelen. En omdat ik een hulpmiddel wilde maken waarvoor geen nieuwe vaardigheden nodig zijn en het voor iedereen comfortabel moet aanvoelen, bleek audio de beste optie.”
Omdat ik een tool wilde maken waar geen nieuwe skills nodig voor zijn en voor iedereen prettig aanvoelt, bleek audio de beste optie.
― Konrad Krawczyk
De tool die Konrad ontwierp is open source en kan worden gebruikt door iedereen die er een bijdrage aan wil leveren of zelf wil gebruiken.
“Na dit project wil ik graag de mobiliteitssector verkennen. Ik denk dat meer inclusief ontwerp bij zelfrijdende wagens en openbaar vervoer het gebruik ervan intuïtiever of zelfs voor miljoenen mensen toegankelijker en veiliger zou kunnen maken.”
Contact
Stella Boess
- +31 (0)15 27 83196
- S.U.Boess@tudelft.nl
-
Room B-2-140 StudioMingle
Gijs Huisman
- g.huisman@tudelft.nl
- Personal website
-
32.C-2-210