Aus unstrukturierten Texten wie wissenschaftliche Artikel, Nachrichten, Websites oder Social-Media-Posts die wichtigsten Themen zu identifizieren, ist für viele Anwendungen eine entscheidende Grundlage: Recommender-Systeme, Trenderkennung, Retrieval-Engines, Kategorisierung oder Clustering funktionieren besser und erreichen eine höhere Nutzerakzeptanz. Es fällt aber auch aktuellen NLP-Systemen nicht leicht, die relevanten Themen in einem Textbestand zu erkennen und ähnliche Themen zuverlässig zusammenzuführen. Vor allem der Umgang mit "noisy" Texten (wie Social-Media-Posts) erfordert Preprocessing-Schritte, geeignete Extraktionsmethoden und Qualitätssicherung, um brauchbare und verlässliche Ergebnisse zu erhalten.
Gemeinsam mit Dr. Gerhard Rolletschek, Gründer der Glanos GmbH, klären wir folgende Fragen:
Was ist Topic Modeling und Keyphrase/Keyword Extraction?
Wie gut ist die Qualität von Open-Source-Ansätzen und von Cognitive Services wie AWS, Azure, Google Cloud?
Worauf muss beim Einsatz geachtet werden?
Mehr über Dr. Gerhard Rolletschek und die Glanos GmbH erfahrt ihr unter folgenden Links:
[ Ссылка ]
[ Ссылка ]
Ihr wollt beim nächsten eMeetup persönlich dabei sein und mit Experten über aktuelle Themen aus dem Bereich Machine Learning, Künstliche Intelligenz und Data Science sprechen? Alle Termine und Informationen zu zukünftigen Data Science eMeetups erhaltet ihr unter folgendem Link: [ Ссылка ]
Ещё видео!