Benötigte Lesezeit: 2 Minuten
Maschinelles Lernen ist ein Teilgebiet der Künstlichen Intelligenz (KI), das Datenwissenschaft und Informatik kombiniert. Computer lernen anhand von Eingabewerten und verbessern sich kontinuierlich im Lösen von Aufgaben. Ziel ist es, Wissen aus Daten zu extrahieren.
Diese Technologie bietet zahlreiche Anwendungsmöglichkeiten: von automatischen Spam-Filtern für E-Mails, über personalisierte Nutzer-Empfehlungen bei Netflix, Spotify und Amazon bis hin zu selbstfahrenden Autos.
Weitere Definitionen des Begriffs maschinelles Lernen
Der KI-Pionier Arthur Samuel umschrieb 1959 erstmalig den Begriff des maschinellen Lernens als
„Forschungsgebiet, das Computer in die Lage versetzen soll, zu lernen, ohne explizit darauf programmiert zu sein“.
Im Jahre 1997 lieferte Tom M. Mitchell eine modernere und formellere Definition von maschinellem Lernen:
„Ein Computerprogramm soll aus Erfahrung E in Bezug auf eine Klasse von Aufgaben T und Leistungsmaß P lernen, wenn sich seine Leistung bei Aufgaben T, gemessen durch P, mit Erfahrung E verbessert.“
Die Idee dahinter ist, dass ein allgemeines Programm Computer in die Lage versetzt, selbständig Lösungen für ein Problem zu finden. Anstatt akribisch genaue Anleitungen (etwa regelbasiert) zur Lösung dieses Problems vorzugeben. Weiterentwicklung durch Erfahrung spielt beim maschinellen Lernen eine elementare Rolle. Ähnlich wie beim Menschen, lernen auch Computer durch Fehlschläge oder Wiederholung.
Maschinelles Lernen erlaubte es dem Computerprogramm „Watson“, die Quizshow Jeopardy zu gewinnen. Bereits 1996 besiegte „Deep Blue“ den damaligen Weltmeister Garry Kasparow im Schach. Beide Programme wurden vom IT-Unternehmen IBM entwickelt und basierten auf den Erfahrungen aus unzähligen Spielen.
Aufgaben des maschinellen Lernens
Maschinelles Lernen unterscheidet verschiedene Arten von Lernaufgaben. Zwei grundlegende Ansätze sind das überwachte Lernen (Lernen mit Lehrer) und das unüberwachte Lernen (Lernen ohne Lehrer). Bei beiden Methoden kommen Lernalgorithmen zum Einsatz.
Beim überwachten Lernen werden Algorithmen anhand von vorgegebenen Beispielen trainiert, die bereits korrekte Antworten enthalten. Zum Einsatz kommt diese Lernaufgabe bei Regressionsanalysen (Ziel: Zusammenhänge beschreiben und Werte vorhersagen) und im Bereich der Klassifikation (Ziel: Unterscheidung von Daten in Klassen). Die Prognose von Immobilienpreisen anhand der Größe von Häusern ist ein Beispiel für ein Regressionsproblem. Ist das Ziel jedoch vorauszusagen, etwa ob eine E-Mail abhängig von Absender und Inhalt eine Spam-E-Mail ist, liegt ein Klassifizierungsproblem vor.
Der zweite grundlegende Lernansatz ist das unüberwachte Lernen. Dabei suchen Algorithmen nach Trends, Strukturen und Mustern in Daten, ohne dass ihnen ein Ziel vorgegeben wurde. Algorithmen finden auf diese Weise Ähnlichkeiten und können sie in Segmente zusammenfassen (Clustering). In der Praxis eignet sich das Verfahren beispielsweise zur Kunden- und Marktsegmentierung.
Wenn ihr euch von einem der Vordenker der KI, Andrew Ng, begeistern lassen möchtet, dann empfehle ich die Video-Aufzeichnungen seines englischsprachigen Kurses zum Thema Machine Learning an der Standford University von 2008.
Mein Fazit: Im Vergleich zu den unzähligen Definitionen von Künstlicher Intelligenz, sind sich die verschiedenen Definitionen des maschinellen Lernens recht ähnlich. Dadurch ist der Begriff wesentlich greifbarer. Wichtig ist, die Bedeutung von statistischen Wörtern wie Regression oder Klassifizierung zu verstehen. Dabei könnt ihr die statistischen Berechnungen getrost ausblenden.
Quellen:
Bild: DALLE 2
www.sap.com/germany/products/leonardo/machine-learning/what-is-machine-learning.html
www.youtube.com/watch?v=UzxYlbK2c7E
Einführung in Machine Learning mit Python, Andreas C. Müller & Sarah Guido, 2017