Autor: Sabrina Jacob

Bias im Maschinellen Lernen

Automatische Entscheidungssysteme, die auf maschinellem Lernen basieren, enthalten oftmals einen sogenannten „Bias“ (deutsch: Vorurteil, Verzerrung). Darunter versteht man Bewertungen, die aufgrund unzureichender Kenntnis und somit einseitiger Einschätzung bestimmter Sachverhalte getroffen werden. Dies kann nicht nur bei ML-Algorithmen vorkommen, denn auch Menschen lassen in ihre Entscheidungen oft Vorurteile einfließen – meist unbewusst. Wesentliche ethische Fragen im Maschinellen Lernen diesbezüglich sind also: Dürfen Machine-Learning-Algorithmen Bias enthalten? Und wenn ja, wann und wie viel „Bias“ ist vertretbar?

Weiterlesen

Ethik im Maschinellen Lernen

Kürzlich machte Google Schlagzeilen, weil es innerhalb weniger Monate bereits seine zweite leitende Forscherin zur Ethik in der KI gefeuert hat. Timnit Gebru und ihre Kollegin Margaret Mitchell forschten an dem Paper „On the Dangers of Stochastic Parrots: Can Language Models Be Too Big?“, in dem es um die Risiken von großen Transformermodellen wie BERT, GTP-3 oder Switch-C geht, die auf extrem umfangreichen aus dem Web extrahierten Textsammlungen trainiert werden. Neben den enormen energetischen Ressourcen, die zum Training benötigt werden, macht das Paper auch darauf aufmerksam, dass bei solch großen Datenmengen oftmals auch Bias (=Vorurteile, statistische Verzerrungen) mitgelernt werden. Zudem ist es schwierig, einen Überblick über die Qualität des Datensatzes zu bewahren und damit solchen ungewollten Begleiterscheinungen entgegenzuwirken.

Weiterlesen

Sehen, wohin es geht: Warum Visualisierungen für das agile Datenmanagement wichtig sind

Können Sie sich noch vorstellen ohne Hilfsmittel durch die Stadt zu navigieren? Was machen Menschen, denen das scheinbar mühelos gelingt anders? Der Schlüssel liegt in einem ungefähren inneren Stadtplan, den erfolgreiche Navigatoren nutzen. In diesem beachten sie vor allem auch Himmelsrichtungen und können so ihren Startpunkt und ihr Ziel auf ihrer inneren Karte in ein Verhältnis setzen.
Menschen, die sich dagegen beim Orientieren schwer tun, versuchen oft nur eine Folge von Abbiegevorgängen und bestimmten Straßennamen auswendig zu lernen. Vergessen sie einen Abbiegevorgang oder ist eine Straße gesperrt, fällt ihre Strategie zusammen wie ein Kartenhaus.
Ähnlich verhält es sich bei effizienter und erfolgreicher agiler Datenanalyse und im Datenmanagement: Echte Information lebt von ihrem Kontext und ihrer Transparenz.

Weiterlesen

Überwachtes Lernen anschaulich erklärt

Im Allgemeinen unterscheidet man im Machine Learning zwischen vier verschiedenen Typen von Modellen: Dem überwachten Lernen (supervised Learning), dem unüberwachten Lernen (unsupervised Learning), dem teilüberwachten Lernen und dem Reinforcement Learning. Dieser Artikel soll Einsteigern oder Nicht-Technikern das überwachte Lernen anschaulich näherbringen.

Weiterlesen

Machine Learning mit kundenspezifischen Daten

KI ist immer nur so gut, wie die Daten, die ihr zur Verfügung stehen. Für unterschiedliche Use-Cases benötigt man eine ausreichende Anzahl an Daten, um eine sehr gute Klassifikationsleistung zu erzielen. Oftmals geht es nicht nur um spezielle Domänen, bei denen man geringe Datenmengen durch Domain Adaptation oder Transfer Learning ausgleichen kann. Sondern darum, dass der Kunde eine ganz eigene Definition von Klassen benötigt. Machine Learning mit kundenspezifischen Daten ist hierbei der Schlüssel zum Erfolg.

Weiterlesen

Über uns

Hier bloggt das MORESOPHY-Team zu Themen rund um Smart Data, Cognitive Computing und Künstlicher Intelligenz mit dem Fokus auf Natural Language Understanding und industrielle Nutzung intelligenter Daten-Analytik in verschiedenen Use-Cases.