Künstliche Intelligenz vs. Machine Learning vs. Deep Learning vs. Data Science

robots

Die Begriffe künstliche Intelligenz, Machine Learning, Deep Learning und Data Science sind in den Medien keine Seltenheit mehr und gehören mittlerweile zum guten Ton. Immer wieder erhalten wir Fragen, worin sich die Begriffe unterscheiden. In diesem Blogpost lösen wir das Mysterium, damit Sie für Ihre nächsten Diskussionen gewappnet sind.

Künstliche Intelligenz

Das wohl am häufigsten gebrauchte Schlagwort. Ich glaube es gibt heute keine Konferenz oder Magazin, dass nicht mindestens einmal dieses Wort benutzt – häufig in Formulierungen wie “Wie KI Branche xy revolutioniert”. Wenn heute von künstlicher Intelligenz gesprochen wird, sind meistens Methoden des Machine Learnings oder Deep Learnings gemeint. Diese Methoden schafften den Durchbruch der Technologie, wie beispielsweise das autonome Fahren oder AlphaGo, das einen Meister im Spiel Go geschlagen hat.

Das Verständnis von künstlicher Intelligenz war früher ein Anderes. In den Anfängen wurde die Intelligenz durch Logiken, wie der Prädikatenlogik abgebildet. Eine Prädikatenlogik wird durch Wahrheitstabellen abgebildet, die mit wahr oder falsch befüllt sind. Es handelt sich hier um sehr einfache Verfahren, die man heute nicht mehr als intelligent bezeichnen würde, da das Verfahren sehr stark an Regeln gebunden ist.

Die künstliche Intelligenz beschäftigt sich mit dem selbstständigen Lösen von Problemen durch einen Computer bzw. Programm. Als Grundlage dienen Daten oder Regeln, auf Basis derer Entscheidungen durch das Programm erfolgen.

Das Problem am Begriff der künstlichen Intelligenz ist, dass es zum einen keine einheitliche Definition hat und zum anderen einen sehr unscharfen Begriff verwenden. Das Wort “Intelligenz” ist nicht einheitlich definiert und wird zum Beispiel von Psychologen und Philosophen verschieden verwendet. Ich finde es sehr ironisch, dass die Informatik einen solchen Begriff verwendet. Eine Wissenschaft, die Daten in Nullen und Einsen darstellt und bei der es um genaue Verfahrensvorschriften geht, verwendet einen Begriff, dessen Definition viel Interpretationsspielraum lässt.

Machine Learning

Neben künstlicher Intelligenz wird der Begriff Machine Learning (oder maschinelles Lernen) gefühlt am zweithäufigsten verwendet. Wenn von künstlicher Intelligenz die Rede ist, sind meistens Methoden des Machine Learnings gemeint. Auch wenn hier ebenfalls keine eindeutige Definition existiert, stellt das Machine Learning ein Teilgebiet der künstlichen Intelligenz dar.

Machine Learning kombiniert verschiedene Algorithmen, mit denen Muster in Daten erkannt werden können. Die Algorithmen benötigen Eingabedaten, sog. Trainingsdaten, in denen Muster erkannt werden. Nach der Trainingsphase können neue, ungesehene Daten in den Algorithmus übergeben werden. Der Algorithmus kann nun (im Idealfall) generalisieren und sein erlerntes Wissen durch die Trainingsdaten auf die neuen Daten anwenden.

Das Machine Learning teilt sich in drei Bereiche auf:

  • Supervised Learning (überwachtes Lernen): Die Trainingsdaten enthalten “Expertenwissen”, dass durch den Algorithmus erlernt werden soll. Ein Beispiel des supervised learnings wäre ein Klassifikator, der bestimmen kann, ob sich auf einem eingegebenen Bild eine Katze befindet oder nicht. Die bekanntesten Algorithmen sind die neuronalen Netze oder die lineare Regression.
  • Unsupervised Learning (unüberwachtes Lernen): Die eingegebenen Trainingsdaten enthalten kein Expertenwissen und der Algorithmus strukturiert bzw. gruppiert die Eingabedaten. Die bekanntesten Algorithmen sind Clusteralgorithmen (bspw. k-means). Angewandt wird das unsupervised Learning beispielsweise zur Segmentierung von Kunden anhand bestimmter Parameter, wie beispielsweise die Kaufkraft in einem Onlineshop.
  • Reinforcement Learning (verstärkendes Lernen): Das reinforcement Learning stellt die Kür des Machine Learnings dar. Ein Algorithmus optimiert sich selbstständig anhand der definierten Zielfunktion über tausende bis millionen Iterationen. Zum Verständnis kann sich dieses Video angeschaut werden. Der Algorithmus optimiert seine Punktzahl in einem Atari Spiel über zahlreiche Iterationen.

Deep Learning

Deep Learning ist eine spezielle Form von neuronalen Netzen, die sich durch ihre spezielle Architektur definieren. Ein neuronales Netz besteht aus mehreren Schichten: einem input layer, diversen hidden layer und einem output layer. Beim Deep Learning bestitzt das neuronale Netz zahlreiche hidden layer und weist dadurch eine umfangreichere Struktur auf. In den hidden layer lernt das neuronale Netz die Muster in den Daten. In diesen Schichten wird bei Bildern beispielsweise die vertikale Kantendetektion, horizontale Kantendetektion und Segmentierung selbstständig erlernt. Je mehr Schichten ein neuronales Netz aufweist, desto komplexere Zusammenhänge kann es erlenen. Dabei gibt es allerdings einen sweet spot, da der Algorithmus bei zu vielen Schichten eventuell unnütze Muster erkennt.

Die größten technologischen Durchbrüche der letzten Jahre im Bereich der künstlichen Intelligenz basieren auf Deep Learning. So stecken beim autonomen Fahren und AlphaGo Deep Learning Algorithmen dahinter.

Data Science

Data Science kombiniert verschiedene Methoden aus der Statistik, um Informationen aus Datenmengen zu extrahieren, die als Entscheidungshilfe für Unternehmen gelten. So kann ein Data Scientist aus den Kundendaten eines Onlineshops herausfinden, welches Alter die umsatzstärksten Kunden haben. Daraus können Entscheidungshilfen abgeleitet werden, auf welche Zielgruppe sich das Marketing des Unternehmens am Stärksten fokussieren sollte.