Machine Learning für Bilderkennung

Dätwyler, Lukas and Marku, Diluxion (2022) Machine Learning für Bilderkennung. Other thesis, OST Ostschweizer Fachhochschule.

[thumbnail of HS 2021 2022-SA-EP-Dätwyler-Marku-Machine Learning für Bilderkennung und Synthese von Post-It.pdf] Text
HS 2021 2022-SA-EP-Dätwyler-Marku-Machine Learning für Bilderkennung und Synthese von Post-It.pdf - Supplemental Material

Download (13MB)

Abstract

Aufgabenstellung:
Die Softwarelösung der Firma Trihow soll mit einem Feature erweitert werden, welches durch die Anwendung von Machine Learning Komponenten, Post-it Zettel auf Bilder erkennt die in die Cloud hochgeladen werden. Zusätzlich soll eine synthetische Version des Post-its generiert werden, welche die Farbe und den Text des Originals hat.

Vorgehen / Technologien:
Da das Backend der Softwarelösung auf die Infrastruktur von Firebase setzt, wurden sogenannte Cloud Functions eingesetzt um das verlangte Feature zu implementieren. Durch die Einbindung der Objekterkennungsmethoden von Google Cloud Vision API, konnten Objektbeschreibungen (Labels), Farben und Texte vom hochgeladenem Bild extrahiert und ausgewertet werden. Zum Schluss wurde aus den gewonnen Daten ein SVG-String generiert, welcher in ein JPEG- Bild konvertiert wurde.

Fazit:
Durch das Trainieren eines eigenen Machine Learning Modells mit Google AutoML wurde festgestellt, dass wenn sich das ganze Backend auf Firebase befindet, die Verwendung von Cloud Vision die bessere und auch die kostengünstigere Wahl ist um Objekterkennungsaufgaben zu bewerkstelligen. Auch wenn in Einzelfällen das eigene Modell, bessere Vorhersagen treffen konnte, ob es sich um ein Post-it Foto handelte, gab es verschiedene Gründe die dagegen sprachen. Da sowohl Cloud Vision als auch Firebase zu Google gehört, konnte die Objekterkennung einwandfrei in die vorhandene Softwarelösung integriert und die daraus gewonnen Daten zu einem digitalen Post-it Bild verarbeitet werden, womit das Ziel dieser Arbeit erreicht wurde.

Item Type: Thesis (Other)
Subjects: Topics > Cloud Computing
Area of Application > Industry
Area of Application > Image/Video Processing
Technologies > Programming Languages > TypeScript
Divisions: Bachelor of Science FHO in Informatik > Student Research Project
Depositing User: OST Deposit User
Contributors:
Contribution
Name
Email
Thesis advisor
Koch, Frank
UNSPECIFIED
Date Deposited: 20 Apr 2022 08:51
Last Modified: 20 Apr 2022 08:51
URI: https://eprints.ost.ch/id/eprint/992

Actions (login required)

View Item
View Item