{"id":75,"date":"2019-09-12T21:51:20","date_gmt":"2019-09-12T21:51:20","guid":{"rendered":"http:\/\/flexitcs.net\/?p=75"},"modified":"2022-07-24T06:13:02","modified_gmt":"2022-07-24T06:13:02","slug":"data-science-heute-eine-ubersicht","status":"publish","type":"post","link":"https:\/\/flexitcs.net\/index.php\/data-science-heute-eine-ubersicht\/","title":{"rendered":"Digitalisierung kompakt: Data Science heute"},"content":{"rendered":"\n<p>Data Science ist popul\u00e4r:&nbsp;<strong>Was<\/strong>&nbsp;verbirgt sich hinter Data Science?&nbsp;<strong>Warum&nbsp;<\/strong>ist Data Science wichtig und&nbsp;<strong>Wie&nbsp;<\/strong>arbeiten Data Scientists heute?<\/p>\n\n\n\n<p>Eine Einordnung der wichtigsten Begriffe, Fakten und aktuellen Trends. <\/p>\n\n\n\n<figure class=\"wp-block-image\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"128\" src=\"https:\/\/flexitcs.net\/wp-content\/uploads\/2019\/09\/data1-1-1024x128.jpg\" alt=\"Was: Data Science?\" class=\"wp-image-485\" srcset=\"https:\/\/flexitcs.net\/wp-content\/uploads\/2019\/09\/data1-1.jpg 1024w, https:\/\/flexitcs.net\/wp-content\/uploads\/2019\/09\/data1-1-300x38.jpg 300w, https:\/\/flexitcs.net\/wp-content\/uploads\/2019\/09\/data1-1-768x96.jpg 768w, https:\/\/flexitcs.net\/wp-content\/uploads\/2019\/09\/data1-1-720x90.jpg 720w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Was: Data Science?<\/h3>\n\n\n\n<p>Data Science ist eine handwerklich hochwertige Dienstleistung, die die nutzbringende Verwertung von Daten aller Art anstrebt. Ziele von Data Science sind <strong>Erkenntnisgewinn<\/strong>, <strong>Prognoseerstellung<\/strong>, <strong>Entscheidungsoptimierung<\/strong> sowie schlie\u00dflich die <strong>Automatisierung<\/strong> von Systemen, Dienstleistungen und Prozessen.<\/p>\n\n\n\n<p>Data Science Projekte basieren idealerweise immer auf einer konkreten&nbsp;<strong>fachlichen Frage- oder Problemstellung<\/strong>. <\/p>\n\n\n\n<p>Von dieser Fragestellung ausgehend, werden relevante Daten gesammelt resp. ausgew\u00e4hlt, bereinigt, ggf. aggregiert \/ aufbereitet, visualisiert sowie hinsichtlich etwaiger Muster analysiert (<strong>Mustererkennung<\/strong>). Aus den aufbereiteten Daten werden <strong>Modelle<\/strong> unterschiedlicher Komplexit\u00e4t abgeleitet, die die Abbildung unabh\u00e4ngiger Input-Variablen auf ein oder mehrere Ziel-Variablen mathematisch beschreiben. Die abgeleiteten Modelle k\u00f6nnen anschlie\u00dfend auf unbekannte, gleich strukturierte Datens\u00e4tze angewendet werden. Auf diese Art und Weise werden Voraussagen f\u00fcr zuk\u00fcnftige Entwicklungen resp. f\u00fcr bisher nicht erprobte Konstellationen m\u00f6glich sowie &#8211; darauf aufbauend &#8211; die Formulierung von <strong>Handlungsempfehlungen<\/strong>.<\/p>\n\n\n\n<p>Die abgeleiteten Modelle k\u00f6nnen f\u00fcr entsprechende Anwendungsf\u00e4lle in IT-Systemen integriert und regelm\u00e4\u00dfig&nbsp;<strong>automatisiert ausgef\u00fchrt&nbsp;<\/strong>werden. Werden die abgeleiteten Modelle regelm\u00e4\u00dfig automatisiert ausgef\u00fchrt, ist eine kontinuierliche Pr\u00fcfung, Wartung und Weiterentwicklung der Modelle notwendig.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Begriffliche Einordnung<\/h4>\n\n\n\n<p>Die einzelnen Auspr\u00e4gungen werden begrifflich eingeordnet:<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li>die Analyse und Visualisierung von Daten (Mustererkennung) wird als&nbsp;<strong>Exploratory Data Analysis<\/strong>&nbsp;(EDA) bezeichnet. Die EDA ist der Schwerpunkt von Data Science im engeren Sinne.<\/li><li>die auf der EDA aufbauende Modellerstellung mit dem Ziel der Prognose \/ Decision Making wird als&nbsp;<strong>Predictive Analytics<\/strong>&nbsp;resp. als&nbsp;<strong>Machine Learning<\/strong>&nbsp;(ML) bezeichnet.<\/li><li><strong>K\u00fcnstliche Neuronale Netze&nbsp;<\/strong>(Deep Learning) sind besonders leistungsf\u00e4hige Modelle, die die bisher gebr\u00e4uchlichen, explizit formulierten Modelle auf Grund der gr\u00f6\u00dferen Prognose-Leistungsf\u00e4higkeit erg\u00e4nzen resp. abl\u00f6sen. Sie kommen zum Einsatz, wenn gro\u00dfe Mengen unstrukturierter Daten und\/oder komplexe Fragestellungen analysiert werden. Nachteil der neuronalen Netze ist die fehlende Transparenz hinsichtlich Interpretierbarkeit \/ Verst\u00e4ndlichkeit sowie die notwendige Menge an Trainingsdaten.<\/li><li><strong>Convolutional Neural Networks&nbsp;<\/strong>(CNN) sind auf die maschinelle Verarbeitung von Bild- und Videodaten  (<strong>Computer Vision<\/strong>) spezialisierte Modelle, bei denen zun\u00e4chst \u00fcber ein systematisches Abtasten mit Filtern Features und deren Positionen in den Eingangsbildern in Feature Maps erfasst und aus diesen Sekund\u00e4rinformationen dann in einem zweiten Schritt die abh\u00e4ngigen Variablen \u00fcber ein neuronales Netz abgeleitet werden. Herk\u00f6mmliche neuronale Netze, die direkt auf den Inputdaten agieren, sto\u00dfen bei der Verarbeitung von Bild- und Videodaten auf Grund des notwendigen Rechneraufwandes an ihre Grenzen.<\/li><li><em>Natural Language Processing<\/em> (<strong>NLP<\/strong>) bezeichnet die Analyse und Verarbeitung nat\u00fcrlicher Sprache mit Hilfe spezieller Sprachmodelle. Als K\u00f6nigsdisziplin gilt die freie <strong>Erstellung neuer Texte<\/strong> nach inhaltlichen und stilistischen Vorgaben.<\/li><li>Die vollautomatische Entscheidungsfindung wird der&nbsp;<strong><a href=\"#Abgrenzungen\" class=\"ek-link\">K\u00fcnstlichen Intelligenz<\/a><\/strong>&nbsp;(KI) zugeordnet. Eine (zuk\u00fcnftige) &#8222;starke KI&#8220;, die das Leistungsniveau des menschlichen Gehirns erreicht, wird als <strong>transformative KI<\/strong> bezeichnet. Grundlage hierf\u00fcr sind auf den Sprachmodellen aufbauenden <strong style=\"color: initial;\">multimodalen KI-Modelle<\/strong><span style=\"color: initial;\"> (wie <\/span><a href=\"https:\/\/www.heise.de\/news\/Machine-Learning-Aleph-Alpha-feilt-mit-Oracle-und-Nvidia-an-transformativer-KI-6269269.html\" target=\"_blank\" rel=\"noreferrer noopener\" class=\"ek-link\">Aleph Alpha<\/a><span style=\"color: initial;\">)<\/span>, die Computer Vision und NLP miteinander verkn\u00fcpfen. <\/li><\/ul>\n\n\n\n<h4 class=\"wp-block-heading\"><strong>Geschichtliche Entwicklung<\/strong><\/h4>\n\n\n\n<p>Obwohl die heute allgemein anerkannten Grundprinzipien von Data Science u.a. im Rahmen von datengetriebenen Arbeiten aus dem Bereich der Naturwissenschaften bereits lange Zeit methodisch vorweggenommen wurden, hat die Disziplin Data Science erst in den letzten Jahren die heutige enorme Aufmerksamkeit erreicht. Dazu beigetragen haben:<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li>eine signifikante Zunahme umfangreicher digitaler Datenbest\u00e4nde &#8211; u.a. als Ergebnis von&nbsp;<a class=\"ek-link ek-link\" href=\"https:\/\/flexitcs.net\/index.php\/internet-of-things-eine-ubersicht\/\">IoT\/IIoT,<\/a> Social Media, eCommerce<\/li><li>eine kontinuierliche Steigerung verf\u00fcgbarer Rechenleistung &#8211; sowohl im Server\/Desktopbereich als auch bei stromsparenden Einplantinencomputern f\u00fcr Echtzeitanalysen in Embedded Systemen <\/li><li>die zunehmende Verf\u00fcgbarkeit freier <a rel=\"noreferrer noopener\" href=\"https:\/\/flexitcs.net\/index.php\/ubersicht-zu-den-wichtigsten-packages-und-ides-fur-r-und-python\/\" target=\"_blank\">Bibliotheken<\/a>,  Frameworks, vortrainierter Modelle sowie kommerzieller <a href=\"https:\/\/flexitcs.net\/index.php\/mlaas-plattformen\/\">MLaaS-Plattformen<\/a><\/li><\/ul>\n\n\n\n<p>Allgemein wird angenommen, dass Systeme mit datenbasierter K\u00fcnstlichen Intelligenz (KI) die menschliche Intelligenz in absehbarer Zeit &#8222;erreichen&#8220; und &#8222;\u00fcbertreffen&#8220; k\u00f6nnen und damit ein <strong>neues Kapitel in der Zusammenarbeit Mensch \/ Maschine<\/strong> aufgeschlagen werden wird. Der Sieg des Programms&nbsp;<a href=\"https:\/\/deepmind.com\/research\/alphago\/\" target=\"_blank\" rel=\"noreferrer noopener\">AlphaGo<\/a>&nbsp;\u00fcber den st\u00e4rkster Go-Spieler der Welt Lee Sedo (M\u00e4rz 2016), das KI-Sprachmodell GPT-3 von <a href=\"https:\/\/openai.com\/\" class=\"ek-link\">OpenAI LP<\/a> (Mai 2020)  sowie die genaue Proteinstrukturvorhersagen von <a href=\"https:\/\/deepmind.com\/research\/case-studies\/alphafold\" target=\"_blank\" rel=\"noreferrer noopener\">AlphaFold<\/a> (CASP 14, November 2020) gelten als Meilensteine auf diesem Weg. <\/p>\n\n\n\n<p>Andererseits hat es der Geschichte der KI seit den 1950er Jahren bereits mehrfach Phasen gegeben, in denen hochgesteckte Erwartungen geweckt aber dann doch nicht erf\u00fcllt wurden. Heute sind (vermeintlich) fehlende Business Cases als auch kulturell begr\u00fcndete Einschr\u00e4nkungen limitierende Faktoren f\u00fcr den Einsatz von KI in traditionellen Branchen und Gesellschaftsbereichen.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Data Science und <strong>EU-Datenschutz-Grundverordnung<\/strong><\/h4>\n\n\n\n<p>Durch kontinuierliches Aufzeichnen von Benutzeraktivit\u00e4ten und -positionen sowie die systematische Verkn\u00fcpfung gro\u00dfer Datenmengen mithilfe leistungsf\u00e4higer Algorithmen k\u00f6nnen detaillierte personenbezogene Benutzerprofile abgeleitet und missbr\u00e4uchlich verwendet werden. Die&nbsp;<strong>DSGVO<\/strong>&nbsp;schr\u00e4nkt deshalb die Sammlung, Speicherung, Verarbeitung und Weitergabe personenbezogener Daten ein:<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li>jede Erhebung personenbezogener Daten hat zweckbestimmt zu erfolgen. Sie ist generell nur dann erlaubt, wenn ein berechtigtes Interesse f\u00fcr die Erhebung vorliegt, und sie muss sich auf das f\u00fcr den konkreten Zweck notwendige Ma\u00df beschr\u00e4nken.<\/li><li>die Speicherung der Daten ist auf den f\u00fcr den konkreten Zweck notwendigen Zeitraum zu beschr\u00e4nken, anschlie\u00dfend m\u00fcssen die Daten gel\u00f6scht werden. Dar\u00fcber hinaus hat jede betroffene Person jederzeit das Recht, das L\u00f6schen der eigenen Daten explizit zu veranlassen (Recht auf Vergessen)<\/li><li>Datenspeicherung und -verarbeitung m\u00fcssen unter Ber\u00fccksichtigung der Gew\u00e4hrleistung der Privatsph\u00e4re resp. des Datenschutzes nach aktuellen Standards erfolgen. Datenspeicherung und -verarbeitung m\u00fcssen transparent und nachvollziehbar sein.<\/li><\/ul>\n\n\n\n<p>Die DSGVO gilt unabh\u00e4ngig vom Sitz der Institution\/vom Wohnort der Person, die Daten sammelt und\/oder verarbeitet, wenn die Daten europ\u00e4ische Personen betreffen. Sie zielt auch auf Datens\u00e4tze, die selbst keine personenbezogenen Daten enthalten aber die Ableitung solcher Daten \u00fcber die Kombination mehrerer Datens\u00e4tze erlauben.<\/p>\n\n\n\n<p>Data Science und DSGVO stehen in einem offensichtlichen Spannungsfeld zueinander, nicht zuletzt auch durch die fehlende detaillierte Nachvollziehbarkeit der Funktionalit\u00e4t Neuronaler Netze. L\u00f6sungen werden z.B. mit Ans\u00e4tzen einer&nbsp;<strong>Explainable Artificial Intelligence<\/strong>&nbsp;(XAI) diskutiert.<\/p>\n\n\n\n<figure class=\"wp-block-image\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"128\" src=\"https:\/\/flexitcs.net\/wp-content\/uploads\/2019\/09\/data2-1024x128.jpg\" alt=\"Warum: Data Science?\" class=\"wp-image-489\" srcset=\"https:\/\/flexitcs.net\/wp-content\/uploads\/2019\/09\/data2.jpg 1024w, https:\/\/flexitcs.net\/wp-content\/uploads\/2019\/09\/data2-300x38.jpg 300w, https:\/\/flexitcs.net\/wp-content\/uploads\/2019\/09\/data2-768x96.jpg 768w, https:\/\/flexitcs.net\/wp-content\/uploads\/2019\/09\/data2-720x90.jpg 720w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Warum: Data Science?<\/h3>\n\n\n\n<p>Date Science erkl\u00e4rt einerseits beobachtete\/gemessene Ph\u00e4nomene und erm\u00f6glicht andererseits nachvollziehbare, datengetriebene operative und strategische Entscheidungen &#8211; auch automatisiert und in Echtzeit. Wo eine Vollautomatisierung nicht m\u00f6glich oder nicht erw\u00fcnscht ist, k\u00f6nnen Digitale Assistenzen menschliche Experten in Echtzeit unterst\u00fctzen. Datenbasierte Gesch\u00e4ftsmodelle bilden zusammen mit dem&nbsp;<a href=\"https:\/\/flexitcs.net\/index.php\/internet-of-things-eine-ubersicht\/\">IoT<\/a>&nbsp;und Blockchain die Basis f\u00fcr die moderne Sharing Economy.<\/p>\n\n\n\n<p><strong>Handel \/ Kundenkommunikation<\/strong>: Angebote werden datenbasiert optimiert, Kaufempfehlungen benutzerspezifisch formuliert, Preise dynamisch gestaltet, Werbeanzeigen zielgenau eingeblendet und Informationen priorisiert\/selektiv kommuniziert. Die zugrunde liegenden Algorithmen nutzen Erkenntnisse, die aus bei anderen\/fr\u00fcheren Kundenkontakten automatisch&nbsp;aufgezeichneten Daten abgeleitet wurden (gl\u00e4serner Kunde, Warenkorbanalyse, Bewertungssysteme). Die praktische Anwendung von Data Science in diesen Feldern ist weit fortgeschritten, insbesondere bei Onlinediensten aber auch im station\u00e4ren Einzelhandel\/in der Gastronomie (Self-Order-Kiosks). Positiv formuliert, wird dem Verbraucher ein einzigartiges, personalisiertes Konsumerlebnis geboten. Verbrauchersch\u00fctzer fordern dagegen einem &#8222;digitalen Verbraucherschutz&#8220; und ein st\u00e4rkeres Bewusstsein f\u00fcr den Umgang mit den eigenen Daten.<\/p>\n\n\n\n<p>In der&nbsp;<strong>Versicherungsbranche<\/strong> werden Schadensrisiken unter Betrachtung zahlreicher Einflussfaktoren als Grundlage f\u00fcr die Pr\u00e4mienbemessung f\u00fcr die Risiko-Versicherung quantifiziert. Moderne Data Science Methoden erlauben dabei eine gr\u00f6\u00dfere Detaillierung und Differenzierung. Algorithmen erg\u00e4nzen und ersetzen die Arbeit von Sachbearbeitern und Experten.<\/p>\n\n\n\n<p>Im&nbsp;<strong>Online-, Kreditkarten- oder Versicherungsgesch\u00e4ft<\/strong>&nbsp;werden mit Data-Science-Techniken automatisch Betrugsversuche bei Finanztransaktionen detektiert (Fraud Detection, Anomalie-Erkennung). Ein vollkommen neuer Ansatz f\u00fcr die Absicherung der Identit\u00e4tsauthentifizierung ist die automatische Auswertung der Art und Weise,&nbsp;<em>wie<\/em>&nbsp;Benutzer Benutzernamen, Passw\u00f6rter etc. in Formularen eingeben (typing patterns).<\/p>\n\n\n\n<p>Die Analyse von wiederkehrenden Mustern im Bereich der Kriminalit\u00e4t erm\u00f6glicht eine&nbsp;<strong>vorausschauende Polizeiarbeit<\/strong>. Date Science erm\u00f6glicht aber auch eine effiziente und u.U. problematische \u00dcberwachung und Leistungsbewertung von Mitarbeitern, B\u00fcrgern, Sportlern usw. Problematisch sind hier insbesondere (Einzel-)F\u00e4lle, wo die verwendeten Algorithmen &#8218;irren&#8216;, trotzdem aber automatisiert Ma\u00dfnahmen mit negativen Auswirkungen f\u00fcr ggf. unbescholtene Betroffene ausgel\u00f6st werden.<\/p>\n\n\n\n<p>Im&nbsp;<strong>Mobilit\u00e4tssektor<\/strong>&nbsp;hilft Date Science Bed\u00fcrfnisse von Fahrg\u00e4sten und Kunden zu analysieren \/ zu verstehen \/ zu prognostizieren und die Angebotsplanung zu optimieren. Flotten und Infrastrukturen werden bedarfsgerecht ad hoc disponiert sowie Fahrg\u00e4ste und Autolenker situationsgerecht geleitet (Smart Public Transport, Smart Cities). Etwaige St\u00f6rungen k\u00f6nnen fr\u00fchzeitig erkannt, etwaige Fahrzeug- und Infrastrukturausf\u00e4lle mit Predictive Maintenance minimiert werden. <\/p>\n\n\n\n<p>Datenbasierte KI ist die Basis f\u00fcr komplexe&nbsp;<strong>autonome Systeme&nbsp;<\/strong>und f\u00fcr autonomes Fahren.<\/p>\n\n\n\n<p>In der&nbsp;<strong>Medizin&nbsp;<\/strong>k\u00f6nnen Erkrankungswahrscheinlichkeiten und erwartete Krankheitsverl\u00e4ufe durch eine systematische Aufarbeitung historischer Krankenakten und Befunde vorausgesagt werden.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Bilder, Ger\u00e4usche und Texte automatisch erkennen und analysieren<\/h4>\n\n\n\n<p>Vielf\u00e4ltige Anwendungsf\u00e4lle in unterschiedlichen Bereichen ergeben sich aus der M\u00f6glichkeit,&nbsp;<strong>Bilder<\/strong>&nbsp;mit Hilfe von&nbsp;<strong>Computer Vision<\/strong>&nbsp;automatisch analysieren und klassifizieren zu k\u00f6nnen:<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li>automatische Gesichts-\/Emotionserkennung (Erkennung von menschlichen Emotionen eingeschr\u00e4nkt m\u00f6glich)<\/li><li>automatische Bestimmung von Pflanzen, Pilzen, Tieren &#8211; z.B. mit <a aria-label=\"Pl@ntNet (opens in a new tab)\" href=\"https:\/\/identify.plantnet.org\/de\" target=\"_blank\" rel=\"noreferrer noopener\" class=\"ek-link\">Pl@ntNet<\/a>, <a aria-label=\"Naturblick (opens in a new tab)\" href=\"https:\/\/naturblick.museumfuernaturkunde.berlin\/mobileapp\" target=\"_blank\" rel=\"noreferrer noopener\" class=\"ek-link\">Naturblick<\/a>, <a aria-label=\"Pilzator (Android) (opens in a new tab)\" href=\"https:\/\/www.chip.de\/downloads\/Pilzator-Pilze-bestimmen-Android-App_183733400.html\" target=\"_blank\" rel=\"noreferrer noopener\" class=\"ek-link\">Pilzator<\/a> (Android) bzw. <a aria-label=\"Pilz Erkenner (opens in a new tab)\" href=\"https:\/\/apps.apple.com\/de\/app\/pilz-erkenner-auto-erkennung\/id1227854971\" target=\"_blank\" rel=\"noreferrer noopener\" class=\"ek-link\">Pilz Erkenner<\/a> (iOS), <a aria-label=\"Picture Insect (opens in a new tab)\" href=\"https:\/\/www.chip.de\/downloads\/Picture-Insect-Insekten-bestimmen-Android-App_183740382.html\" target=\"_blank\" rel=\"noreferrer noopener\" class=\"ek-link\">Picture Insect<\/a><\/li><li><span style=\"color: initial;\">Objekterkennung f\u00fcr das autonome Fahren<\/span><\/li><li>automatische Analyse und Bewertung von R\u00f6ntgenbildern und anderen Bildern in der Medizin<\/li><li>Handschriftenerkennung&nbsp;und&nbsp;Texterkennung (OCR) als Grundlage f\u00fcr die automatisierte Analyse\/Bearbeitung von handschriftlich verfassten Dokumenten<\/li><\/ul>\n\n\n\n<p><strong>Verbale Sprache und Ger\u00e4usche<\/strong>&nbsp;k\u00f6nnen in gleicher Weise wie Bilder automatisch analysiert und klassifiziert werden. Die Anwendungen sind synonym zum Computer Vision: Erkennen von Personen, Situationen und Emotionen (letzteres auch f\u00fcr medizinische Zwecke), Erkennen von Tieren (Vogelstimmen), Spracherkennung.<\/p>\n\n\n\n<p>Texte, die in maschinenlesbarer Form vorliegen (sei es durch Handschriftenerkennung, Spracherkennung oder durch direkte Bereitstellung), k\u00f6nnen mit&nbsp;<strong>Text Mining&nbsp;<\/strong>inhaltlich analysiert und (vor)verarbeitet werden. Praktische Einsatzm\u00f6glichkeiten sind der Einsatz von Software-Agenten, um <strong>Call Center&nbsp;<\/strong>T\u00e4tigkeiten zu automatisieren. Weit verbreitet ist das <strong>automatische \u00dcbersetzen<\/strong> von Texten, z.B. mit <a aria-label=\"DeepL Translator (opens in a new tab)\" href=\"https:\/\/www.deepl.com\/de\/translator\" target=\"_blank\" rel=\"noreferrer noopener\" class=\"ek-link\">DeepL Translator<\/a> oder <a aria-label=\"Google Translator (opens in a new tab)\" href=\"https:\/\/translate.google.com\/\" target=\"_blank\" rel=\"noreferrer noopener\" class=\"ek-link\">Google Translator<\/a>.  <\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Bilder und Texte automatisch erstellen<\/h4>\n\n\n\n<p>Die automatische, softwarebasierte Erstellung von Bildern, Ger\u00e4uschen und Texten nach (beliebigen) inhaltlichen und stilistischen Vorgaben ist ein intensives Forschungsfeld im Bereich von Data Science (KI). Mit herk\u00f6mmlichen Data Science Projekten haben diese Sprachverarbeitungsmodelle auf Grund ihrer Komplexit\u00e4t und des gigantischen Aufwands in der technischen Umsetzung nur noch wenig gemeinsam.<\/p>\n\n\n\n<p><strong>Textgenerierung<\/strong>:<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li><a aria-label=\"GPT-3 (opens in a new tab)\" href=\"https:\/\/openai.com\/blog\/openai-api\/\" target=\"_blank\" rel=\"noreferrer noopener\" class=\"ek-link\">GPT-3-Modell<\/a> (<em>Generative Pre-trained Transformer<\/em>, OpenAI)<\/li><li><a aria-label=\"Wu Dao 2.0 (opens in a new tab)\" href=\"https:\/\/gpt3demo.com\/apps\/wu-dao-20\" target=\"_blank\" rel=\"noreferrer noopener\" class=\"ek-link\">Wu Dao 2.0<\/a> (BAAI) <\/li><li><a aria-label=\"MT-NLG (opens in a new tab)\" href=\"https:\/\/developer.nvidia.com\/blog\/using-deepspeed-and-megatron-to-train-megatron-turing-nlg-530b-the-worlds-largest-and-most-powerful-generative-language-model\/\" target=\"_blank\" rel=\"noreferrer noopener\" class=\"ek-link\">MT-NLG<\/a> (Megatron Turing-NLG, Microsoft)  <\/li><\/ul>\n\n\n\n<p><strong>Bildgenerierung <\/strong>(<em>text2image generators<\/em>): <\/p>\n\n\n\n<ul class=\"wp-block-list\"><li><a aria-label=\"DALL-E (opens in a new tab)\" href=\"https:\/\/openai.com\/dall-e-2\/\" target=\"_blank\" rel=\"noreferrer noopener\" class=\"ek-link\">DALL-E 2<\/a> (OpenAI, seit 2021) <\/li><li><a aria-label=\"Google (opens in a new tab)\" href=\"https:\/\/imagen.research.google\/\" target=\"_blank\" rel=\"noreferrer noopener\" class=\"ek-link\">Imagen<\/a> (Google, seit 2022)<\/li><\/ul>\n\n\n\n<p><strong>OpenAI<\/strong>, die in diesem Feld besonders aktiv ist, ist eine gemeinn\u00fctzige Organisation, welche 2015 von Elon Musk, Sam Altman sowie weiteren Investoren in San Francisco gegr\u00fcndet wurde.    <\/p>\n\n\n\n<figure class=\"wp-block-image\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"128\" src=\"https:\/\/flexitcs.net\/wp-content\/uploads\/2019\/09\/data3-1024x128.jpg\" alt=\"Wie: Data Science?\" class=\"wp-image-490\" srcset=\"https:\/\/flexitcs.net\/wp-content\/uploads\/2019\/09\/data3.jpg 1024w, https:\/\/flexitcs.net\/wp-content\/uploads\/2019\/09\/data3-300x38.jpg 300w, https:\/\/flexitcs.net\/wp-content\/uploads\/2019\/09\/data3-768x96.jpg 768w, https:\/\/flexitcs.net\/wp-content\/uploads\/2019\/09\/data3-720x90.jpg 720w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Wie: Data Science?<\/h3>\n\n\n\n<h4 class=\"wp-block-heading\">fachlich<\/h4>\n\n\n\n<p>Bei der am Anfang von Data Science Projekten stehenden Exploratory Data Analysis (EDA) werden sowohl Erkenntnisse zu den beobachteten fachlichen Fragestellungen (Prozesse, Ereignisse, Beobachtungen usw.) als auch Beobachtungen zum untersuchten Datensatz (verf\u00fcgbare Daten, Datenvollst\u00e4ndigkeit, Datenqualit\u00e4t) zusammengetragen und begutachtet.<\/p>\n\n\n\n<p>Hierzu werden relevante statische Kennzahlen (Wertebereiche, Mittelwerte, Verteilung: Varianz, Schiefe, W\u00f6lbung, zeitliche und r\u00e4umliche Verteilung, Zusammenh\u00e4nge: Kovarianz und Korrelation, Unregelm\u00e4\u00dfigkeiten: Fehlwerte, Anomalien) m\u00f6glichst vollst\u00e4ndig und systematisch erfasst. Die gewonnenen Erkenntnisse werden optisch mit geeigneten Grafiken (Box-Plot, Histogramm, Streudiagramm, Zeitreihen, Correlation Plot Matrices) visualisiert.<\/p>\n\n\n\n<p>Bei der Modellbildung stehen ja nach Art der zu l\u00f6senden Fragestellung unterschiedliche Modellarten zur Auswahl:<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li><strong>Klassifizierungsprobleme<\/strong>: Probabilistic Modeling \/ Naive Bayes, Logistic Regression \/ bin\u00e4re Vorhersagen, K-Nearest Neighbors (K-NN), Support Vector Machine (SVM) \/ Kernel SVM, Decision Tree Classification \/ Entscheidungsb\u00e4ume, Random Forests Classification, Gradient Boosting Machines,&nbsp;<em>Neuronale Netze<\/em><\/li><li><strong>Regression<\/strong>: Simple Linear Regression, Multiple Linear Regression, Polynomial Regression, Support Vector Regression (SVR), Decision Tree Regression, Random Forest Regression, K-Nearest Neighbors (K-NN),&nbsp;<em>Neuronale Netze<\/em><\/li><li><strong>Clustering<\/strong>: Gruppierung \u00e4hnlicher Objekte, z.B. mit K-means Clustering<\/li><li><strong>Assoziationsanalyse<\/strong>&nbsp;&#8211; Identifizierung von Regeln von Eingabedaten (z.B. Warenkorbanalyse): Apriori, Eclat<\/li><li><strong>Spracherkennung und Textanalyse<\/strong>: HMMs<\/li><li><strong>Computer Vision<\/strong>&nbsp;(maschinelles Sehen) &#8211; Objekterkennung, Gesichtserkennung: CNNs<\/li><li><strong>Zeitreihenmodellierung<\/strong>: Exponential smoothing, ARIMA Modelle und Neuronale Netze (LSTM), auch: Threshold Autoregressive Models (TAR) and Smooth Transition Autoregressive Models (STAR)<\/li><\/ul>\n\n\n\n<p>Die Wahl des einzusetzenden Modells ist von mehreren Faktoren abh\u00e4ngig, u.a. von der Gr\u00f6\u00dfe\/Menge der Datens\u00e4tze, der Qualit\u00e4t der Daten (z.B. Linearit\u00e4t), von der konkreten Fragestellung sowie von der Anzahl der unabh\u00e4ngigen Variablen resp. der sich daraus ergebenen relevanten Kombinationen von Eingangsgr\u00f6\u00dfen. So kann ein einfaches Klassifizierungsproblem mit relativ wenigen unabh\u00e4ngigen Variablen \u00fcber eine (logistische) Regression gel\u00f6st werden, w\u00e4hrend bei einer gro\u00dfen Menge an relevanten Kombinationen von Eingangsgr\u00f6\u00dfen ein Random Forest Ansatz ggf. eher eine zuverl\u00e4ssige Vorhersage sicherstellt. Dar\u00fcber hinaus gibt es eine historische Komponente, da einige Modelle erst seit kurzer Zeit, andere Ans\u00e4tze schon viele Jahrzehnte zur Verf\u00fcgung stehen.&nbsp;<\/p>\n\n\n\n<p>Soll ein&nbsp;<strong>K\u00fcnstliches Neuronales Netz \/ Convolutional Neural Network (CNN)<\/strong>&nbsp;verwendet werden, so muss dessen Struktur entsprechend der konkreten Aufgabenstellung festgelegt werden. Die Netz-Topologie basiert auf einer Folge von Schichten k\u00fcnstlicher Neuronen (Nodes). Zwischen einer &#8218;Eingabeschicht&#8216; und einer &#8218;Ausgabeschicht&#8216; existieren ein oder mehrere Zwischenschichten (&#8218;hidden layer&#8216;) &#8211; je mehr Zwischenschichten eingef\u00fcgt werden desto &#8218;tiefer&#8216; das Neuronale Netz. \u00dcber gewichtete Verkn\u00fcpfungen zwischen den Neuronen werden durch das Netz Informationen (Aktivierungssignale) schrittweise von der Eingabeschicht bis zur Ausgabeschicht transferiert. Die Verkn\u00fcpfung der Neuronen untereinander erfolgt im einfachsten Fall ausschlie\u00dflich vorw\u00e4rts in Verarbeitungsrichtung (Feedforward Neural Networks), w\u00e4hrend rekurrente bzw. r\u00fcckgekoppelte neuronale Netze auch Verbindungen von Neuronen einer Schicht zu Neuronen derselben oder einer vorangegangenen Schicht vorsehen.<\/p>\n\n\n\n<p>Die Ausgestaltung der Zwischenschichten (Anzahl der Schichten, Anzahl der Neuronen pro Schicht, Verkn\u00fcpfungen) beeinflussen Leistungsf\u00e4higkeit und notwendigen Rechenbedarf Neuronaler Netze in signifikanter Art und Weise und sind damit&nbsp;<strong>der Schl\u00fcsselfaktor<\/strong>&nbsp;f\u00fcr die Umsetzung. Weitere festzulegende Parameter sind u.a.:<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li>Auswahl der&nbsp;<strong>Aktivierungsfunktion (activation function)<\/strong>: mit dieser Funktion wird f\u00fcr jeden Node aus der Summe der lokalen Eingangssignale das jeweilige lokale Ausgangssignal berechnet. Hidden Layer und Ausgabelayer werden in der Regel unterschiedliche Aktivierungsfunktionen zugewiesen.<\/li><li>Auswahl der&nbsp;<strong>Kostenfunktion (cost function)<\/strong>: mit dieser Funktion werden f\u00fcr Trainingsdaten die Abweichungen zwischen berechnetem und theoretischen Ausgabewert ermittelt. Auf Basis dieser Information werden anschlie\u00dfend die spezifischen Wichtungsfaktoren automatisch \u00fcber den&nbsp;<strong>Backpropagation<\/strong>&nbsp;Mechanismus justiert (<strong>Gradientenverfahren<\/strong>).<\/li><li>Festlegung der Learning Rate<\/li><\/ul>\n\n\n\n<p>Querschnittsaspekte jeder Modellierung sind&nbsp;<strong>Normalisierung&nbsp;<\/strong>und&nbsp;<strong>Feature Engineering<\/strong>, wobei letzteres bei der Verwendung neuronaler Netze teilweise bereits implizit erfolgt.<\/p>\n\n\n\n<p>Jedes Modell (jedes Neuronale Netz), welches f\u00fcr Prognosen verwendet wird, muss&nbsp;<strong>trainiert, evaluiert und schrittweise optimiert<\/strong>&nbsp;werden. Die dabei erreichte Genauigkeit wird mit geeigneten Metriken beschrieben (RMSE, MAE). Die geeignete Wahl von Trainings- und Testdatens\u00e4tze sowie die Einschr\u00e4nkung der Anzahl von Parametern und Freiheitsgraden helfen \u00dcberanpassung zu vermeiden. Je komplexer ein Modell ist, umso aufwendiger ist die Trainingsphase: bei neuronalen Netzen werden typischerweise tausende von Trainingsdatens\u00e4tze in zehn oder mehr Iteration durchgerechnet. Je nach Gr\u00f6\u00dfe des Eingangsdatensatzes und des gew\u00e4hlten Modells kann das Training mehrere Stunden, Tage oder Wochen dauern.<\/p>\n\n\n\n<p>Formal wird zwischen einem&nbsp;<strong>\u00dcberwachten Lernen<\/strong>, bei dem in den Trainingsdaten neben den Inputdaten auch die dazugeh\u00f6rigen Zielgr\u00f6\u00dfen verf\u00fcgbar sind, und&nbsp;<strong>Un\u00fcberwachten Lernen<\/strong>&nbsp;ohne konkrete Zielgr\u00f6\u00dfen unterschieden. \u00dcberwachtes Lernen wird bei u.a. bei Regressionsproblemen und Klassifizierungsproblemen verwendet. Beim Un\u00fcberwachten Lernen ermittelt das Modell eine geeignete Ordnung der vorhandenen Daten basierend auf Clustering resp. Assoziationsanalyse selbstst\u00e4ndig.<\/p>\n\n\n\n<p><strong>Best\u00e4rkendes Lernen<\/strong>&nbsp;bildet die dritte gro\u00dfe Gruppe von Machine Learning Verfahren und ist eine am nat\u00fcrlichen Lernverhalten des Menschen orientierte, auf &#8222;Trial and Error&#8220; beruhende Lernmethode. Sie erfordert eine sehr gro\u00dfe Anzahl an Iterationen, w\u00e4hrend derer das Modell lernt, den Zusammenhang zwischen seinen Aktionen und dem k\u00fcnftig zu erwartendem Nutzen in jedem Status zu approximieren und situationsbedingte Entscheidungen zu optimieren.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">technisch<\/h4>\n\n\n\n<p>Data Scientists programmieren mit R, Python, SAS, SPSS, STATA, IDL, ANA und Matlab. Erg\u00e4nzend kommen \u00fcbergeordnete Tools, Sprachen und Frameworks f\u00fcr das Datenmanagement zum Einsatz, insbesondere im Kontext der Verarbeitung gro\u00dfer Datenmengen (Big Data\/Big Computing, verteilte Cluster\/Parallel Computing, Data Warehouse Backends): Hadoop, Apache Spark, Scala, DBI, ODBC. Am anderen Ende der Skala sind einfachere Data Science Anwendungen auch mit Tableau oder Excel (Schwerpunkt Visualisierung) resp. JavaScript (Schwerpunkt einfache Integration in vorhandene Systemlandschaft) auf herk\u00f6mmlichen Maschinen m\u00f6glich.<\/p>\n\n\n\n<p>Die beiden zentralen Sprachen&nbsp;<strong>R&nbsp;<\/strong>und&nbsp;<strong>Python&nbsp;<\/strong>sind popul\u00e4re Open Source Sprachen mit einer gro\u00dfen Community und zahlreichen frei verf\u00fcgbaren&nbsp;<a href=\"https:\/\/flexitcs.net\/index.php\/ubersicht-zu-den-wichtigsten-packages-und-ides-fur-r-und-python\" target=\"_blank\" rel=\"noreferrer noopener\">Erweiterungen<\/a>&nbsp;(Packages, Bibliotheken). Die Anwendungsfelder der beiden Sprachen \u00fcberlappen sich, wobei die Schwerpunkte von R eher in der Analyse und Visualisierung (Mustererkennung) sowie im akademischen Bereich liegen, w\u00e4hrend Python in komplexeren Anwendungen zum Einsatz kommt.<\/p>\n\n\n\n<p>R Code ist \u00fcber den Pipe Operator %&gt;% und weiteren Eigenschaften von dplyr ausgesprochen gut nachvollziehbar programmierbar, gleichzeitig aber weniger intuitiv in Funktionen strukturierbar (non-standard evaluation \/ NSE). F\u00fcr R funktioniert das Package Management sehr zuverl\u00e4ssig (CRAN), w\u00e4hrend unter Python zwei konkurrierende Manager existieren (pip und Conda) und insbesondere unter Windows die Installation von Entwicklungs- und Ablaufumgebungen sehr zeitintensiv sein kann. Interaktive, webbasierte R-Applikationen lassen sich in R \u00fcber Shiny direkt erstellen, w\u00e4hrend bei Python eine ma\u00dfgeschneiderte HTML\/Javascript Erg\u00e4nzung ben\u00f6tigt wird.<\/p>\n\n\n\n<p>F\u00fcr die effektive Umsetzung Neuronaler Netze stehen inzwischen sowohl f\u00fcr R als f\u00fcr Python mehrere Open Source&nbsp;<strong><a href=\"https:\/\/flexitcs.net\/index.php\/machine-learning-frameworks\/\" class=\"ek-link\">Deep Learning Frameworks<\/a><\/strong>&nbsp;zur Verf\u00fcgung. Sprachen\u00fcbergreifende Frameworks existieren auch f\u00fcr die effektive Implementierung von&nbsp;<strong>Gradient Boosting L\u00f6sungen<\/strong>:&nbsp;<a rel=\"noreferrer noopener\" href=\"https:\/\/xgboost.readthedocs.io\/\" target=\"_blank\">XGBoost<\/a>&nbsp;(Tianqi Chen, 2014),&nbsp;<a rel=\"noreferrer noopener\" href=\"https:\/\/tech.yandex.com\/catboost\/\" target=\"_blank\">CatBoost<\/a>,&nbsp;<a rel=\"noreferrer noopener\" href=\"https:\/\/lightgbm.readthedocs.io\/en\/latest\/\" target=\"_blank\">LightGBM<\/a>.<\/p>\n\n\n\n<p>F\u00fcr einige Fragestellungen insbesondere im Bereich der Bilderkennung k\u00f6nnen <a href=\"https:\/\/github.com\/tensorflow\/models\/tree\/master\/research\/slim#pre-trained-models\" target=\"_blank\" rel=\"noreferrer noopener\">vortrainierte Modelle<\/a>&nbsp;eingesetzt werden.<\/p>\n\n\n\n<p>Wenn die Rechner-Infrastruktur fehlt, oder wenn die Steigerung der Effizienz des Entwicklungsprozesses f\u00fcr Standard-Aufgaben im Fokus steht, kann die Analyse der eigenen Daten auch mit externen <a href=\"https:\/\/flexitcs.net\/index.php\/mlaas-plattformen\/\">MLaaS-Plattformen<\/a> erfolgen, wobei jedoch entsprechende Lizenzkosten anfallen (<strong>Machine learning as a service<\/strong>).   <\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Der Mensch<\/h4>\n\n\n\n<p>W\u00e4hrend Standard-Anwendungsf\u00e4lle der Datenaufbereitung durch KI immer st\u00e4rker automatisiert werden, liefern individuelle Data Science L\u00f6sungen ma\u00dfgeschneiderte Ergebnisse. Auch strategische und inhaltliche F\u00fchrung k\u00f6nnen Maschinen nicht wirklich gut. Hier wie dort besteht zuk\u00fcnftig weiter Bedarf, die neue Welt individuell gestalten zu helfen.<\/p>\n\n\n\n<p>Data Scientists ben\u00f6tigen Expertise in statistischen Methoden, programmiertechnische F\u00e4higkeiten sowie Businessanalyse\/Dom\u00e4nenwissen. Eine proaktive bereichs\u00fcbergreifende Kommunikation ist der notwendige Schl\u00fcssel zum Erfolg von Data Science-Projekten, insbesondere im kommerziellen (nicht-akademischen) Umfeld.<\/p>\n\n\n\n<p>In umfassenden Projekten wird zwischen Data Scientists, Data Architects, Data Engineers und Data Analysts unterschieden. Ein aktives und kontinuierliches Management (Leadership) des Data Science Teams ist unerl\u00e4sslich. Die besondere Herausforderung der Leitung von Data Science Projekten ist, dass diese Projekte u.U. sehr explorativ und ergebnisoffen angelegt sind.<\/p>\n\n\n\n<p>Data Scientists bilden weltweit eine aktive und offene Community, die sich \u00fcber einschl\u00e4gige Plattformen wie&nbsp;<a rel=\"noreferrer noopener\" href=\"https:\/\/www.kaggle.com\/\" target=\"_blank\">Kaggle<\/a>,&nbsp;<a href=\"https:\/\/ropensci.org\/\" class=\"ek-link\">rOpenSci<\/a>,&nbsp;<a rel=\"noreferrer noopener\" href=\"https:\/\/rladies.org\/\" target=\"_blank\">R-Ladies<\/a>,&nbsp;<a rel=\"noreferrer noopener\" href=\"https:\/\/www.kdnuggets.com\/\" target=\"_blank\">KDnuggets<\/a>,&nbsp;<a rel=\"noreferrer noopener\" href=\"https:\/\/www.datacamp.com\/community\" target=\"_blank\">DataCamp<\/a>,  <a rel=\"noreferrer noopener\" href=\"https:\/\/towardsdatascience.com\/\" target=\"_blank\">Towards Data Science<\/a> organisieren und austauschen.<\/p>\n\n\n\n<figure class=\"wp-block-image\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"128\" src=\"https:\/\/flexitcs.net\/wp-content\/uploads\/2019\/09\/data4-1024x128.jpg\" alt=\"Abgrenzungen\" class=\"wp-image-491\" srcset=\"https:\/\/flexitcs.net\/wp-content\/uploads\/2019\/09\/data4.jpg 1024w, https:\/\/flexitcs.net\/wp-content\/uploads\/2019\/09\/data4-300x38.jpg 300w, https:\/\/flexitcs.net\/wp-content\/uploads\/2019\/09\/data4-768x96.jpg 768w, https:\/\/flexitcs.net\/wp-content\/uploads\/2019\/09\/data4-720x90.jpg 720w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<hr class=\"wp-block-separator has-css-opacity is-style-wide\"\/>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"Abgrenzungen\"> Abgrenzungen <\/h3>\n\n\n\n<p>Verwandte Disziplinen zu Data Science sind&nbsp;<strong>Data Analytics<\/strong>,&nbsp;<strong>Data Mining<\/strong>,&nbsp;<strong>Decision Science<\/strong>,&nbsp;<strong>Business Analytics<\/strong>,&nbsp;<strong>Business Intelligence<\/strong>&nbsp;(BI),&nbsp;<strong>DMAIC<\/strong>&nbsp;und&nbsp;<strong>Big Data<\/strong>&nbsp;(Abgrenzungen flie\u00dfend). <\/p>\n\n\n\n<p>Der Begriff der <strong>K\u00fcnstlichen Intelligenz <\/strong>(KI) stellt einen Sonderfall dar, da er bereits in den 50er Jahren gepr\u00e4gt wurde und prim\u00e4r empirisch (nicht-technisch) definiert ist: Eine Maschine wird als &#8218;intelligent&#8216; bezeichnet, wenn eine Testperson bei der Kommunikation mit dieser Maschine nicht unterscheiden kann, ob der Kommunikationspartner ein Mensch oder ein Programm ist (sogenannter &#8218;Turing-Test&#8216;).<\/p>\n\n\n\n<p>Eine in diesem Sinne intelligente Maschine muss nicht zwingend datenbasiert funktionieren. Vielmehr ist bis zu einem bestimmten Umfang eine regelbasierte Umsetzung m\u00f6glich, in dem Fakten, Ereignisse oder Aktionen mit konkreten und eindeutigen Repr\u00e4sentationen erfasst werden und auf diesen Symbolen mathematische Operationen definiert werden (&#8222;symbolische KI&#8220;). F\u00fcr komplexere Probleme werden jedoch datenbasierte, in der Regel selbst-lernende Ans\u00e4tze ben\u00f6tigt (&#8222;statistische KI&#8220;).   <\/p>\n\n\n\n<p>Die beiden Bereiche Data Science und K\u00fcnstliche Intelligenz \u00fcberschneiden sich somit gegenseitig, ohne dass einer der beiden Bereiche den anderen vollumf\u00e4nglich abdecken w\u00fcrde.<\/p>\n\n\n\n<p>Mit <strong>Data Storytelling<\/strong> wird die professionelle Vermittlung von Erkenntnissen anhand von Daten beschrieben. Data Science Vorhaben liefern als inhaltliche Grundlage aufbereitete Daten, die graphisch und dramaturgisch f\u00fcr ein Plenum aufbereitet werden. Data Storytelling verbindet somit Data Science mit Kommunikation und Design, um Datenzusammenh\u00e4nge nachhaltig und zielgruppengerecht zu transportieren.<\/p>\n\n\n\n<hr class=\"wp-block-separator has-css-opacity is-style-default\"\/>\n\n\n\n<p>siehe auch:  <\/p>\n\n\n\n<ul class=\"wp-block-list\"><li><a href=\"https:\/\/flexitcs.net\/index.php\/ubersicht-zu-den-wichtigsten-packages-und-ides-fur-r-und-python\" class=\"ek-link\">\u00dcbersicht zu den wichtigsten Packages und IDEs f\u00fcr R und Python<\/a><\/li><li><a href=\"https:\/\/flexitcs.net\/index.php\/machine-learning-frameworks\/\" class=\"ek-link\">\u00dcbersicht zu aktuellen Machine-Learning Frameworks<\/a><\/li><li><a href=\"https:\/\/flexitcs.net\/index.php\/mlaas-plattformen\/\" class=\"ek-link\">\u00dcbersicht verf\u00fcgbarer MLaaS Plattformen <\/a> <\/li><li><a href=\"https:\/\/flexitcs.net\/index.php\/online-ressourcen-data-science\" class=\"ek-link\">Empfohlene Online-Ressourcen aus dem Bereich Data Science<\/a><\/li><\/ul>\n\n\n\n<p><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Data Science ist popul\u00e4r:&nbsp;Was&nbsp;verbirgt sich hinter Data Science?&nbsp;Warum&nbsp;ist Data Science wichtig und&nbsp;Wie&nbsp;arbeiten Data [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_editorskit_title_hidden":false,"_editorskit_reading_time":11,"_editorskit_is_block_options_detached":false,"_editorskit_block_options_position":"{}","footnotes":""},"categories":[1],"tags":[7],"class_list":["post-75","post","type-post","status-publish","format-standard","hentry","category-uncategorized","tag-datascience-machinelearning-digitaltransformation-technology"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v25.9 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Digitalisierung kompakt: Data Science heute - Executive Summary<\/title>\n<meta name=\"description\" content=\"Einordnung der wichtigsten Begriffe, Fakten und aktuellen Trends zum Top-Thema Data Science und Machine Learning: What, Why und How?\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/flexitcs.net\/index.php\/data-science-heute-eine-ubersicht\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Digitalisierung kompakt: Data Science heute - Executive Summary\" \/>\n<meta property=\"og:description\" content=\"Einordnung der wichtigsten Begriffe, Fakten und aktuellen Trends zum Top-Thema Data Science und Machine Learning: What, Why und How?\" \/>\n<meta property=\"og:url\" content=\"https:\/\/flexitcs.net\/index.php\/data-science-heute-eine-ubersicht\/\" \/>\n<meta property=\"og:site_name\" content=\"Die Digitale Transformation gestalten\" \/>\n<meta property=\"article:published_time\" content=\"2019-09-12T21:51:20+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2022-07-24T06:13:02+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/flexitcs.net\/wp-content\/uploads\/2019\/09\/data1-1-1024x128.jpg\" \/>\n<meta name=\"author\" content=\"Matthias Bleyl\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Matthias Bleyl\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"18 Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\/\/flexitcs.net\/index.php\/data-science-heute-eine-ubersicht\/#article\",\"isPartOf\":{\"@id\":\"https:\/\/flexitcs.net\/index.php\/data-science-heute-eine-ubersicht\/\"},\"author\":{\"name\":\"Matthias Bleyl\",\"@id\":\"https:\/\/flexitcs.net\/#\/schema\/person\/bdc6fbae07797fec12d64f79bc4649a7\"},\"headline\":\"Digitalisierung kompakt: Data Science heute\",\"datePublished\":\"2019-09-12T21:51:20+00:00\",\"dateModified\":\"2022-07-24T06:13:02+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\/\/flexitcs.net\/index.php\/data-science-heute-eine-ubersicht\/\"},\"wordCount\":3373,\"commentCount\":1,\"publisher\":{\"@id\":\"https:\/\/flexitcs.net\/#\/schema\/person\/bdc6fbae07797fec12d64f79bc4649a7\"},\"image\":{\"@id\":\"https:\/\/flexitcs.net\/index.php\/data-science-heute-eine-ubersicht\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/flexitcs.net\/wp-content\/uploads\/2019\/09\/data1-1-1024x128.jpg\",\"keywords\":[\"#datascience #machinelearning #digitaltransformation #technology\"],\"articleSection\":[\"Uncategorized\"],\"inLanguage\":\"de-AT\",\"potentialAction\":[{\"@type\":\"CommentAction\",\"name\":\"Comment\",\"target\":[\"https:\/\/flexitcs.net\/index.php\/data-science-heute-eine-ubersicht\/#respond\"]}]},{\"@type\":\"WebPage\",\"@id\":\"https:\/\/flexitcs.net\/index.php\/data-science-heute-eine-ubersicht\/\",\"url\":\"https:\/\/flexitcs.net\/index.php\/data-science-heute-eine-ubersicht\/\",\"name\":\"Digitalisierung kompakt: Data Science heute - Executive Summary\",\"isPartOf\":{\"@id\":\"https:\/\/flexitcs.net\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\/\/flexitcs.net\/index.php\/data-science-heute-eine-ubersicht\/#primaryimage\"},\"image\":{\"@id\":\"https:\/\/flexitcs.net\/index.php\/data-science-heute-eine-ubersicht\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/flexitcs.net\/wp-content\/uploads\/2019\/09\/data1-1-1024x128.jpg\",\"datePublished\":\"2019-09-12T21:51:20+00:00\",\"dateModified\":\"2022-07-24T06:13:02+00:00\",\"description\":\"Einordnung der wichtigsten Begriffe, Fakten und aktuellen Trends zum Top-Thema Data Science und Machine Learning: What, Why und How?\",\"breadcrumb\":{\"@id\":\"https:\/\/flexitcs.net\/index.php\/data-science-heute-eine-ubersicht\/#breadcrumb\"},\"inLanguage\":\"de-AT\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/flexitcs.net\/index.php\/data-science-heute-eine-ubersicht\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"de-AT\",\"@id\":\"https:\/\/flexitcs.net\/index.php\/data-science-heute-eine-ubersicht\/#primaryimage\",\"url\":\"https:\/\/flexitcs.net\/wp-content\/uploads\/2019\/09\/data1-1.jpg\",\"contentUrl\":\"https:\/\/flexitcs.net\/wp-content\/uploads\/2019\/09\/data1-1.jpg\",\"width\":1024,\"height\":128},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/flexitcs.net\/index.php\/data-science-heute-eine-ubersicht\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/flexitcs.net\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Digitalisierung kompakt: Data Science heute\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/flexitcs.net\/#website\",\"url\":\"https:\/\/flexitcs.net\/\",\"name\":\"Die Digitale Transformation gestalten\",\"description\":\"Matthias Bleyl\",\"publisher\":{\"@id\":\"https:\/\/flexitcs.net\/#\/schema\/person\/bdc6fbae07797fec12d64f79bc4649a7\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/flexitcs.net\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"de-AT\"},{\"@type\":[\"Person\",\"Organization\"],\"@id\":\"https:\/\/flexitcs.net\/#\/schema\/person\/bdc6fbae07797fec12d64f79bc4649a7\",\"name\":\"Matthias Bleyl\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de-AT\",\"@id\":\"https:\/\/flexitcs.net\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/7a172617327e9b00cf870ce0cdc90766e0fbaa1b9d650feae84dea1de566cb33?s=96&d=mm&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/7a172617327e9b00cf870ce0cdc90766e0fbaa1b9d650feae84dea1de566cb33?s=96&d=mm&r=g\",\"caption\":\"Matthias Bleyl\"},\"logo\":{\"@id\":\"https:\/\/flexitcs.net\/#\/schema\/person\/image\/\"}}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Digitalisierung kompakt: Data Science heute - Executive Summary","description":"Einordnung der wichtigsten Begriffe, Fakten und aktuellen Trends zum Top-Thema Data Science und Machine Learning: What, Why und How?","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/flexitcs.net\/index.php\/data-science-heute-eine-ubersicht\/","og_locale":"de_DE","og_type":"article","og_title":"Digitalisierung kompakt: Data Science heute - Executive Summary","og_description":"Einordnung der wichtigsten Begriffe, Fakten und aktuellen Trends zum Top-Thema Data Science und Machine Learning: What, Why und How?","og_url":"https:\/\/flexitcs.net\/index.php\/data-science-heute-eine-ubersicht\/","og_site_name":"Die Digitale Transformation gestalten","article_published_time":"2019-09-12T21:51:20+00:00","article_modified_time":"2022-07-24T06:13:02+00:00","og_image":[{"url":"https:\/\/flexitcs.net\/wp-content\/uploads\/2019\/09\/data1-1-1024x128.jpg","type":"","width":"","height":""}],"author":"Matthias Bleyl","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"Matthias Bleyl","Gesch\u00e4tzte Lesezeit":"18 Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/flexitcs.net\/index.php\/data-science-heute-eine-ubersicht\/#article","isPartOf":{"@id":"https:\/\/flexitcs.net\/index.php\/data-science-heute-eine-ubersicht\/"},"author":{"name":"Matthias Bleyl","@id":"https:\/\/flexitcs.net\/#\/schema\/person\/bdc6fbae07797fec12d64f79bc4649a7"},"headline":"Digitalisierung kompakt: Data Science heute","datePublished":"2019-09-12T21:51:20+00:00","dateModified":"2022-07-24T06:13:02+00:00","mainEntityOfPage":{"@id":"https:\/\/flexitcs.net\/index.php\/data-science-heute-eine-ubersicht\/"},"wordCount":3373,"commentCount":1,"publisher":{"@id":"https:\/\/flexitcs.net\/#\/schema\/person\/bdc6fbae07797fec12d64f79bc4649a7"},"image":{"@id":"https:\/\/flexitcs.net\/index.php\/data-science-heute-eine-ubersicht\/#primaryimage"},"thumbnailUrl":"https:\/\/flexitcs.net\/wp-content\/uploads\/2019\/09\/data1-1-1024x128.jpg","keywords":["#datascience #machinelearning #digitaltransformation #technology"],"articleSection":["Uncategorized"],"inLanguage":"de-AT","potentialAction":[{"@type":"CommentAction","name":"Comment","target":["https:\/\/flexitcs.net\/index.php\/data-science-heute-eine-ubersicht\/#respond"]}]},{"@type":"WebPage","@id":"https:\/\/flexitcs.net\/index.php\/data-science-heute-eine-ubersicht\/","url":"https:\/\/flexitcs.net\/index.php\/data-science-heute-eine-ubersicht\/","name":"Digitalisierung kompakt: Data Science heute - Executive Summary","isPartOf":{"@id":"https:\/\/flexitcs.net\/#website"},"primaryImageOfPage":{"@id":"https:\/\/flexitcs.net\/index.php\/data-science-heute-eine-ubersicht\/#primaryimage"},"image":{"@id":"https:\/\/flexitcs.net\/index.php\/data-science-heute-eine-ubersicht\/#primaryimage"},"thumbnailUrl":"https:\/\/flexitcs.net\/wp-content\/uploads\/2019\/09\/data1-1-1024x128.jpg","datePublished":"2019-09-12T21:51:20+00:00","dateModified":"2022-07-24T06:13:02+00:00","description":"Einordnung der wichtigsten Begriffe, Fakten und aktuellen Trends zum Top-Thema Data Science und Machine Learning: What, Why und How?","breadcrumb":{"@id":"https:\/\/flexitcs.net\/index.php\/data-science-heute-eine-ubersicht\/#breadcrumb"},"inLanguage":"de-AT","potentialAction":[{"@type":"ReadAction","target":["https:\/\/flexitcs.net\/index.php\/data-science-heute-eine-ubersicht\/"]}]},{"@type":"ImageObject","inLanguage":"de-AT","@id":"https:\/\/flexitcs.net\/index.php\/data-science-heute-eine-ubersicht\/#primaryimage","url":"https:\/\/flexitcs.net\/wp-content\/uploads\/2019\/09\/data1-1.jpg","contentUrl":"https:\/\/flexitcs.net\/wp-content\/uploads\/2019\/09\/data1-1.jpg","width":1024,"height":128},{"@type":"BreadcrumbList","@id":"https:\/\/flexitcs.net\/index.php\/data-science-heute-eine-ubersicht\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/flexitcs.net\/"},{"@type":"ListItem","position":2,"name":"Digitalisierung kompakt: Data Science heute"}]},{"@type":"WebSite","@id":"https:\/\/flexitcs.net\/#website","url":"https:\/\/flexitcs.net\/","name":"Die Digitale Transformation gestalten","description":"Matthias Bleyl","publisher":{"@id":"https:\/\/flexitcs.net\/#\/schema\/person\/bdc6fbae07797fec12d64f79bc4649a7"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/flexitcs.net\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"de-AT"},{"@type":["Person","Organization"],"@id":"https:\/\/flexitcs.net\/#\/schema\/person\/bdc6fbae07797fec12d64f79bc4649a7","name":"Matthias Bleyl","image":{"@type":"ImageObject","inLanguage":"de-AT","@id":"https:\/\/flexitcs.net\/#\/schema\/person\/image\/","url":"https:\/\/secure.gravatar.com\/avatar\/7a172617327e9b00cf870ce0cdc90766e0fbaa1b9d650feae84dea1de566cb33?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/7a172617327e9b00cf870ce0cdc90766e0fbaa1b9d650feae84dea1de566cb33?s=96&d=mm&r=g","caption":"Matthias Bleyl"},"logo":{"@id":"https:\/\/flexitcs.net\/#\/schema\/person\/image\/"}}]}},"_links":{"self":[{"href":"https:\/\/flexitcs.net\/index.php\/wp-json\/wp\/v2\/posts\/75","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/flexitcs.net\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/flexitcs.net\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/flexitcs.net\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/flexitcs.net\/index.php\/wp-json\/wp\/v2\/comments?post=75"}],"version-history":[{"count":0,"href":"https:\/\/flexitcs.net\/index.php\/wp-json\/wp\/v2\/posts\/75\/revisions"}],"wp:attachment":[{"href":"https:\/\/flexitcs.net\/index.php\/wp-json\/wp\/v2\/media?parent=75"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/flexitcs.net\/index.php\/wp-json\/wp\/v2\/categories?post=75"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/flexitcs.net\/index.php\/wp-json\/wp\/v2\/tags?post=75"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}