Press Release

Dank Machine Learning findet Mapado.com für jeden die perfekten Ausgehtipps

corporate

Es ist nicht immer einfach, eine interessante Veranstaltung zu finden, sei es zuhause, auf einer Dienstreise oder im Urlaub. Die örtlichen Veranstaltungshinweise sind nur in seltensten Fällen wirklich umfassend, nicht immer für Smartphones verfügbar und nur in den seltensten Fällen personalisiert. Ein Start-up aus dem französischen Lyon setzt jetzt Machine Learning ein, um die Versorgung mit Ausgehtipps zu revolutionieren. Ein Gespräch mit Jerry Nieuviarts, Mitbegründer von Mapado.com.

Alle lokalen Veranstaltungen im Überblick „Bloß weil Sie Freizeit haben, heißt das noch lange nicht, dass Sie Zeit zu verschwenden haben“, so das Credo von Mapado.com. Das französische Unternehmen wurde 2012 von Jerry Nieuviarts mitgegründet, zwölf Jahre nachdem er mit vier Partnern Clubic.com ins Leben gerufen hatte, eine News-Webseite zum IT-Bereich, die 2008 von M6 Web aufgekauft wurde. Die Idee scheint so einfach: ortsbezogene Veranstaltungshinweise auf kulturelle oder Sport-Events – vom Ben-Harper-Konzert in London über den Aqua-Biking-Kurs im örtlichen Schwimmbad bis hin zu einem bizarren Wurstfestival in dem französischen Städtchen Tarare.

Aber die Technik dahinter ist außerordentlich komplex. „Die Welt der Veranstaltungsorganisatorin im weitesten Sinne ist total zerstückelt. In den Ländern, die wir bisher berücksichtigen, haben wir Zehntausende von Quellen mit insgesamt fast 15 Millionen Veranstaltungen.“ Um diese riesigen Datenmengen zu extrahieren, hat Mapado zuerst einen Webcrawler entwickelt, ein Computerprogramm, das Webseiten (genauer gesagt den HTML-Code der Seiten) nach relevanten Einträgen durchforstet. Zusätzlich zu diesen Servern gibt es noch andere Maschinen, die das sogenannte Web-Rendering übernehmen. „Wir wollen auch auf Informationen zugreifen, die nicht im Code der besuchten Seiten enthalten sind, sondern in Datenbanken. Dafür imitieren diese Server das Verhalten eines Nutzers in einem Web-Browser, indem sie beispielsweise ein bestimmtes Datum in einem Kalender auswählen.“ Zwei weitere Servergruppen runden diese beeindruckende Infrastruktur noch ab: „Das erste Cluster nutzen wir für Data Mining: Die Einträge werden dedupliziert und die Informationen aus unterschiedlichen Quellen abgeglichen, sodass wir 100 % verlässliche Informationen etwa zum Ort, zur Zeit und zu den Kosten liefern können. Das zweite Cluster wird dagegen für die Sortierung und Optimierung der Ergebnisse verwendet: Die Veranstaltungen werden nach Kategorie und Ort klassifiziert und außerdem mit Meta-Daten versehen, damit unsere Nutzer immer die relevantesten Empfehlungen bekommen.“ Insgesamt sind ganze 20 Dedicated Server von OVH Tag und Nacht im Einsatz, um Internetnutzern möglichst genaue und aktuelle Informationen zu liefern.

Aber auch die Kunden des öffentlichen Nahverkehrs in Paris und Nizza profitieren davon, denn die JCDecaux Gruppe hat sich für Mapado als die einzige Applikation für Ausgehtipps an den neuen interaktiven Terminals an Bus- und Bahnstationen entschieden. Mapado lernt seine Nutzer kennen und versorgt Event-Organisatoren mit dem perfekten Publikum Die Applikation ist für die Nutzer komplett kostenlos; das Business-Modell von Mapado basiert auf einer Reihe teils kostenpflichtiger Services für Geschäftsleute. „Genauso, wie es manchmal schwierig ist eine Veranstaltung in der näheren Umgebung ausfindig zu machen, wissen Veranstalter häufig nicht, auf wen sie eigentlich abzielen sollen. Deshalb versucht Mapado auf Grundlage der durchgeführten Suchen (1) vorherzusehen, was die Nutzer interessieren könnte, um so optimale Veranstaltungsvorschläge anbieten zu können. Inzwischen verkaufen wir über eine Smartphone App (Mapado Scan) auch Tickets. Wir geben Veranstaltern die Möglichkeit, ihr Event ganz gezielt bei Personen mit potenziellem Interesse zu präsentieren, und bekommen dafür eine Kommission auf die Ticketverkäufe.“ Aktuell nutzen schon mehr als 5000 Organisatoren die Plattform.

Sie bereichern das Programm von Mapado (falls das automatisierte System die Veranstaltung nicht längst entdeckt hat) und liefern Updates. Gleichzeitig profitieren sie davon, dass die Informationen zu Ihrer Veranstaltung auf verschiedenen Plattformen und in bis zu 50 Online-Veranstaltungskalendern gepostet werden – und das vollkommen kostenlos. Wer ein möglichst großes Publikum erreichen möchte, kann aber auch den kostenpflichtigen Premiumservice nutzen. Oder sich für das von Mapado entwickelte Ticketing-System entscheiden, das schon heute von einigen namhaften Veranstaltern genutzt wird, beispielsweise von Mini World Park in Lyon und vom französischen Orchesterverband mit rund 40 Ensembles, darunter auch die Philharmonie von Radio France. Mit der API noch mehr Nutzer für das Data Repository erreichen Mithilfe einer API wird die Fundgrube von Mapado auch für Dritte nutzbar, mit anderen Worten die immense Event-Datenbank, die das Start-up erstellt und strukturiert hat. „Über dieses Interface können wir beispielsweise lokale Zeitungen mit vorgefilterten regionalen Events für ihre Veranstaltungstipps versorgen. Wir haben auch schon mit der nationalen Eisenbahngesellschaft SNCF zusammengearbeitet, um Zusammenhänge zwischen der Nutzung öffentlicher Verkehrsmittel und Veranstaltungen in ausgewählten Regionen zu untersuchen. Und vermutlich gibt es noch viele weitere Nutzungsmöglichkeiten für unsere Daten, die überhaupt noch erfunden werden müssen.“ 2015 hat Booking.com, der weltweite Marktführer im Bereich Online-Reservierung, Mapado als eines der innovativsten Start-up in der Tourismusbranche gewürdigt (2). Mapado möchte die Gunst der Stunde nutzen und demnächst auch nach Nordamerika expandieren. Das Geheimnis des Erfolgs? Vielleicht hat Jerry Nieuviarts den wichtigsten Punkt in seiner Twitter-Biografie preisgegeben: „One time, you are lucky, two times, you are good“ (3). Wenn man sich Jerrys Werdegang so anschaut, wo ein Triumph den nächsten jagt, möchte man glatt hinzufügen: „three times is a pattern.“ Mapado setzt auf Server-Lösungen von OVH Für das Hosting der Webapplikation und die Sammlung, Verfeinerung und Auswertung aller für die Bereitstellung der personalisierten Veranstaltungstipps notwendigen Daten verwendet Mapado sowohl VPS als auch Dedicated Server. „Unser Projekt ist ganz besonders ressourcenintensiv (CPU, RAM und Storage). Wir haben viele Nginx Webserver für das Hosting unserer Applikation auf Basis des PHP Symfony Framework.

Der interessanteste Teil unserer IT-Infrastruktur ist allerdings das Backoffice, wo wir 15 Server (VPS mit mehreren IP-Adressen) als Webcrawler oder für Rendering und Data Mining einsetzen. Wir verwenden verschiedene Datenbanktypen: MySQL für die Accounts unserer User und die Applikation für den Ticketkauf, MongoDB für die Speicherung der Events und die zugehörigen Metadaten sowie schließlich Elasticsearch für die eigentliche Suche anhand von Ort, Datum oder Stichwort.“ Weshalb sich das Unternehmen für die Server von OVH entschieden hat? „Das Preis-Leistungs-Verhältnis hat uns überzeugt, aber auch die Tools und Services, die bei den Servern inklusive sind, ganz besonders die OVH API, die wir sehr intensiv nutzen, um unsere Maschinen effizient zu verwalten.“

(1) Mapado verwendet für die Erstellung von Empfehlungen keine Cookies Dritter. Die Personalisierung startet für jeden Nutzer neu und basiert ausschließlich auf den Aktivitäten der angemeldeten Besucher.

(2) Die drei französischen Start-ups, auf die Booking.com aufmerksam wurde: http://www.usine-digitale.fr/editorial/les-trois-start-up-francaises-reperees-par-booking-com.N332372

(3) Eine Anspielung auf das Buch „Once You're Lucky, Twice You're Good: The Rebirth of Silicon Valley and the Rise of Web 2.0“ von Sarah Lacy