10 Jahre Data Mining Cup
Das Team um die Studenten Michael Prim, Fabian Keller und Johannes Munk setzte sich aus Teilnehmern der von dem Elementarteilchenphysiker Prof. Dr. Michael Feindt gehaltenen Vorlesung "Moderne Methoden der Datenanalyse" zusammen. Bereits in den letzten vier Jahren konnten Studenten, die von Prof. Dr. Feindt betreut werden, Spitzenpositionen beim Data Mining Cup belegen, z. B. im Jahr 2006 die Plätze 1 – 4, als die Prognose von erzielten Preisen bei ebay-Auktionen Gegenstand des Data Mining Cups war.
Prof. Dr. Feindt ist Erfinder von NeuroBayes®, einem Prognose-Algorithmus, der bei Phi-T weiterentwickelt und auf wirtschaftliche Nutzung hin optimiert wird. Auch in diesem Jahr wurde den Karlsruher Studenten die Anwendung durch unser Unternehmen zur Verfügung gestellt.
Der Data Mining Cup wird seit nunmehr zehn Jahren veranstaltet und ist der weltweit größte studentische Wettbewerb im Bereich der intelligenten Datenanalyse und Prognose. Wobei die prudsys AG als Organisator des Wettbewerbs bei der diesjährigen Veranstaltung erstmals nicht den besten Nachwuchs-Data-Miner suchte, sondern Universitäten selbst gegeneinander antreten ließ. Mit großem Erfolg. Denn mit über 100 beteiligten Universitäten aus dem In- und Ausland, darunter Universitäten aus Kanada, USA, UK, Russland und China, sowie 52 eingereichten Lösungen endete am 25.05.09 der Wettbewerb.
Wie in jedem Jahr unterstütze ein Anwenderunternehmen den Data Mining Cup und lieferte die Aufgabenstellung sowie die entsprechenden Daten. So kam die diesjährige Aufgabe aus dem Buchgroßhandel, wo die Libri GmbH als Partner gewonnen werden konnte, und bestand darin, den Abverkauf von 8 Artikeln in ca. 2.400 Shops zu prognostizieren.
In einem Lerndatensatz waren von etwa 2.400 Filialen sowohl die Abverkäufe für 1.856 Warengruppen als auch für die 8 Zielartikel bekannt. Aufgrund der Kenntnis der Verkaufszahlen in den Warengruppen sollten die Verkäufe der 8 Zielartikel für weitere ca. 2.400 Filialen prognostiziert werden. Eine Hauptschwierigkeit lag dabei darin, dass sowohl die Größenordnungen der Filialen von Internet-Händlern bis zu Kleinst-Shops als auch die Größenordnungen der Warengruppen sehr heterogen waren.
Weitere Informationen zum Data Mining Cup finden Sie unter www.data-mining-cup.de