Sammeln Sie noch, oder nutzen Sie schon?

2 Min. Lesezeit
Freitag, 22. November 2019

Letzte Woche fand im Stellwerk 18 das Rosenheim IT Forum statt. Die Rosenheimer Initiative zur Förderung der Informations- und Kommunikationstechnik, kurz ROSIK e.V., und die IHK München und Oberbayern luden zum diesjährigen Forum rund um das Thema “Data Science im Mittelstand“ ein. 

Ein kurzes Video zur Veranstaltung finden Sie hier.

Daten sind das neue Öl – der Stoff für wirtschaftlichen Erfolg. Im Fokus der Veranstaltung stand die Zielgruppe „KMUs“ und wie diese hier erfolgreich agieren können. Bisher haben vor allem die großen Firmen durch Data Science ihre Geschäfte optimiert oder neue Geschäftsfelder erschlossen. Durch moderne Technologien wie Cloud Computing und SaaS erschließt sich die Welt der Datenanalyse aber auch dem Mittelstand.

Die Technologien alleine sind aber nicht das Allheilmittel. Im Mittelpunkt muss stehen: was will ich wissen, habe ich überhaupt die entsprechenden Daten und welchen konkreten Nutzen kann ich für mein Unternehmen generieren?

Dazu habe ich meinen Vortrag „Sammeln Sie noch oder nutzen Sie schon?“ gehalten. Darin habe ich unter anderem die zwei häufigsten Fehler der Datenmessung angesprochen: Daten werden gesammelt, nur um zu sammeln. Die eigentliche Frage: "Warum sammle ich als Unternehmen überhaupt Daten?" tritt in den Hintergrund. So kann ein – im schlimmsten Fall unbrauchbarer – Datensumpf entstehen. Dies beschreibt auch der zweite, häufige Fehler, nämlich die Daten zu einem falschen Zeitpunkt zu messen. Dies ist an einem Beispiel einfach erklärt: Messe ich die Produktqualität nur am Ende des Produktionsprozesses, so kann ich auch nur am Ende des Prozesses eine Aussage zur Produktqualität treffen. Misst man allerdings auch zwischendurch, so können wesentlich genauere Aussagen über die Produktqualität im Prozessverlauf getroffen werden. So entstehen zwar letztendlich größere Datenmengen, aber dafür weniger Datensumpf.

Mehr rund um richtiges Datensammeln können Sie auch in diesem Blogbeitrag nachlesen.

Zur Frage, wie viele Daten zur Verbesserung eines bestimmten Prozesses benötigt werden, kann keine pauschale Aussage getroffen werden, da dies von unterschiedlichsten Variablen abhängt und immer im Einzelfall bewertet werden muss. Soll zum Beispiel ein einfaches Problem mittels Bilderkennung behoben werden, benötigt man im Regelfall 100 bis 1.000 Bilder. Bei einem komplexeren Fall, wo es Probleme zu erkennen gilt, die nur sehr selten auftauchen, ist es wichtig, dass es auch von diesem seltenen Problem ausreichend viele Bilder zum Trainieren der KI gibt. Tritt dies beispielsweise nur bei einem von 10.000 Bildern auf, so steigt die benötigte Bilderanzahl natürlich entsprechend.

Sollten Sie Interesse an meinem Vortrag haben, können Sie sich hier die Folien herunterladen. Natürlich stehe ich bei Fragen auch gerne persönlich zur Verfügung und freue mich über Ihre Kontaktaufnahme.