Internes Crowdsourcing zum Trainieren automatischer Spracherkennung in Schweizerdeutsch

Beck, Rafael and Kistler, Roger and Lanz, Karin (2018) Internes Crowdsourcing zum Trainieren automatischer Spracherkennung in Schweizerdeutsch. Masters thesis, HSR Hochschule für Technik Rapperswil.

[thumbnail of HCID-MT17-Pub20-G02-LanzKistlerBeck.pdf]
Preview
Text
HCID-MT17-Pub20-G02-LanzKistlerBeck.pdf - Supplemental Material

Download (9MB) | Preview

Abstract

Damit die Swisscom eine automatische Spracherkennung (ASR) in Schweizerdeutsch entwickeln kann, ist ein Trainieren des Systems mittels Machine Learning durch eine grosse Anzahl
an Personen notwendig, die Dialekte transkribieren. Dazu eignet sich ein internes Crowdsourcing.
Im Rahmen der Masterarbeit des Masterstudiums in Human Computer Interaction Design (MAS HCID) der Hochschule für Technik in Rapperswil (HSR) und der Universität Basel wird
untersucht, wie sich das Transkribieren in Schweizerdeutsch motivierend gestalten lässt und wie sich die Mitarbeitenden der Swisscom dazu bewegen lassen, am Vorhaben teilzunehmen.
Die Untersuchungen erfolgen für die Swisscom, vertreten durch Marc Steffen, Head of Product Design der Artificial Intelligence & Machine Learning Group.
Als Vorgehensmodell für die vorliegende Arbeit wurde das Double-Diamond Model aus dem Design Thinking angewandt.
Zu Beginn des Projekts erfolgte eine Einarbeitung in die Domäne, um das Wissen zu den Themen Künstliche Intelligenz, Spracherkennung, Motivation und Gamification anzueignen.
In der Analyse des Nutzungskontextes wurde mit Swisscom Mitarbeitenden eine Fotostudie mit WhatsApp realisiert. Dabei wurden ein Tagesablauf und die Räumlichkeiten der
Swisscom dokumentiert. In Interviews wurde der Nutzungskontext für die angestrebte Lösung für das Transkribieren von Dialekten untersucht. Zugleich fand eine erste Validierung der Proto-Personas statt, welche im Vorfeld modelliert worden sind. Aus den gewonnen Erkenntnissen der Analyse des Nutzungskontextes wurden Opportunitäten identifiziert, um Dialekte zu transkribieren. Mit den erhobenen Daten aus den Interviews wurden die Proto-Personas justiert und mit weiteren Merkmalen ergänzt.
Im ersten Schritt der Ideenfindung wurden in mehreren Sessionen Ideen zu den Fragestellungen entwickelt, wie zum Beispiel «Wie könnten die Mitarbeitenden dazu bewegt werden, Dialekte zu transkribieren». Dabei wurden über 169 Ideen generiert. Im zweiten Schritt fand eine Fokussierung und Beschränkungen auf potentielle Lösungen statt, welche mit einem Bewertungsprozess eruiert wurden. Dabei wurde die Idee «Spenden intern / extern» gewählt, um die Annahme, ob sich Mitarbeitende über Spenden für die Teilnahme motivieren lassen, zu prüfen. Diese wurde anschliessend in zwei Iterationen in einem Usability Walkthrough überprüft. Einerseits wurde mit dem Wireframe-Prototypen die Motivation untersucht und andererseits wurde mit einem funktionalen Prototypen die Interaktion Dialekt transkribieren
getestet.
Es wurde festgestellt, dass nicht das Thema Spenden für einen guten Zweck die Mitarbeitenden bewegt, am Vorhaben mitzumachen, sondern das innovative Projekt - eine automatische Spracherkennung in Schweizerdeutsch zu lancieren. Zudem zeigte sich, dass zum Beispiel die
Interaktionen des Abspielens von Audiofiles und das Transkribieren im Eingabefeld wesentlich
die Motivation beeinflussen.

Item Type: Thesis (Masters)
Subjects: Topics > HCI Design
Divisions: Master of Advanced Studies in Human Computer Interaction Design
Depositing User: Christian Spielmann
Contributors:
Contribution
Name
Email
Thesis advisor
Steffen, Marc
UNSPECIFIED
Date Deposited: 27 Apr 2018 10:48
Last Modified: 16 Jun 2020 07:29
URI: https://eprints.ost.ch/id/eprint/670

Actions (login required)

View Item
View Item