Data Science-Abschlussprojekte, Gruppe Nr. 34

von Ekaterina Butyugina

Programmieren auf einem Laptop

Wir freuen uns sehr, die Erfolge unserer neuesten Absolventinnen und Absolventen des Züricher Full-Time-DS-Batches Nr. 34 zu feiern, die ihre Data-Science-Reise mit fünf beeindruckenden, praxisnahen Projekten erfolgreich abgeschlossen haben. 

Diese Runde der Abschlusspräsentationen zeigte wie Data Science und KI branchenübergreifend einen spürbaren Mehrwert schaffen können – von der Transformation von Business-Development-Workflows bis hin zur Neugestaltung moderner Marktfindungsprozesse. 
 

Rohe Geschäftsideen in Echtzeit-Intilligenz verwandeln 

Studierende: MohammedLameesAmyAshley  

Galaxon ist ein KI-gestützter Business-Intelligence-Assistent, der Innovator:innen dabei unterstützt, schneller von vagen Ideen zu klaren, umsetzbaren Erkenntnissen zu gelangen. Heute wird Innovation häufig durch ineffiziente Recherchezyklen gebremst. Die Entwicklung einer neuen Geschäftsidee kann sechs bis acht Monate dauern, viele Konzepte sind zu Beginn nur grob definiert, und traditionelle Reporting-Prozesse sind langwierig und schwer zu interpretieren. 

Das Team hat es sich zum Ziel gesetzt, dieses Problem zu lösen, indem sie ein System entwickelten das mithilfe KI-basierter Schlussfolgerungen grobe Geschäftsideen in strukturierte Momentaufnahmen überführt. Anstatt sich auf statische Datenquellen zu verlassen, führt Galaxon eine Marktanalyse in Echtzeit durch und stellt so sicher, dass die gewonnenen Erkenntnisse den aktuellen Marktbedingungen entsprechen – und nicht auf veralteten Informationen basieren.  

  

Das Gesamtsystemdesign ist in der ersten Abbildung oben dargestellt und zeigt die Architektur von Galaxon. Diese Architektur ermöglicht es Galaxon, flexibel, skalierbar und reaktionsfähig auf sich schnell verändernde Geschäftsumfelder zu bleiben. 

Das Ergebnis dieses Prozesses ist ein kompakter und klar strukturierter Insight-Report, wie in der zweiten Abbildung unten dargestellt. Dieser von Galaxon generierte Ergebnisüberblick hebt die relevantesten Erkenntnisse und zentralen Insights hervor und ermöglicht es den Nutzern sich auf fundierte Entscheidungen zu konzentrieren, anstatt von einer Informationsflut überwältigt zu werden. 

  

 

Die Vorteile von Galaxon liegen klar auf der Hand. Das System reduziert den Rechercheaufwand erheblich, verbessert die Klarheit in der frühen Ideenentwicklung und hilft Innovatorinnen und Innovatoren schneller fundierte Entscheidungen zu treffen. Durch den Ersatz langer Recherchezyklen durch Echtzeit-Intelligenz befähigt Galaxon Teams selbstbewusst von der Ideation zur Umsetzung überzugehen. 

Für die zukünftige Weiterentwicklung plant das Team die Benutzeroberfläche zu optimieren um Benutzerfreundlichkeit, Interpretierbarkeit und die Effizienz der Interaktion insgesamt zu verbessern. Anschließend soll das Kernsystem durch fortgeschrittene Prompt-Engineering-Techniken weiter verfeinert werden, um die Schlussfolgerungsfähigkeiten zu stärken sowie die Präzision und Konsistenz der generierten Insights zu erhöhen. Abschließend ist vorgesehen, die Systemlatenz zu reduzieren, um schnellere Reaktionszeiten zu ermöglichen und ein nahtloseres Echtzeit-Nutzererlebnis zu unterstützen.
 

Identifizierung von Segmenten mit hohem Potenzial für Transaktionswachstum  

Studierende: Olga BazhenovaJaime AntolinGlory Mary GiviMudathir Awadaljeed 

Die SIX Group, ein zentraler Anbieter der Finanzmarktinfrastruktur der Schweiz, stellte unser Team vor die Herausforderung zu identifizieren wo für das Unternehmen das größte unerschlossene Potenzial für Transaktionswachstum liegt. Ziel war es, über Intuition hinauszugehen und eine datengetriebene Sicht auf Branchen, Händler und Regionen zu entwickeln, die die stärksten Chancen für Aktivierung und Reaktivierung bieten. 
Zu diesem Zweck kombinierten Olga, Jaime, Glory und Mudathir aggregierte, anonymisierte interne Transaktionsdaten mit öffentlichen demografischen Statistiken, regionalen Indikatoren sowie Unternehmensregisterdaten aus ZEFIX. Dadurch konnte ein umfassendes Bild der Schweizer Händlerlandschaft erstellt und quantifiziert werden, wo Wachstum am ehesten realisierbar ist. 

Ihre Analyse identifizierte drei zentrale Wachstumshebel: 

1.  Neuzuziehende in die Schweiz mit unmittelbarem Abrechnungsbedarf — Mit über 125.000 neuen ausländischen Einwohnerinnen und Einwohnern, die 2025 in die Schweiz kamen – stark konzentriert in Zürich, Waadt, Genf und Bern – stellt dieses Segment eine planbare und skalierbare Quelle neuer Transaktionen dar. Neuzuziehende haben einen sofortigen Abrechnungsbedarf und eine hohe digitale Affinität, was sie zu idealen Early Adopters macht. 

2. Händlerlücken und Reaktivierungspotenzial — Unter mehr als 5.000 Händlern identifizierte das Team: 

  • 387 neue Händler, die 2025 beigetreten sind, jedoch keinerlei Transaktionsaktivität aufweisen 

  • Einen großen Pool inaktiver, aber weiterhin operierender Unternehmen, der ein starkes Reaktivierungspotenzial darstellt 

  • Eine kleine Gruppe von Händlern, die für über 50 % der gesamten Transaktionslücke verantwortlich ist 

Diese Erkenntnisse zeigen klar auf, wo gezielte Ansprache und strukturiertes Onboarding erhebliches Volumen freisetzen können. 

3. Regionen mit hohem Potenzial — Mithilfe eines zusammengesetzten Scores, der Kundendichte und Adoptionslücken kombiniert, wurden die Regionen mit dem größten Wachstumspotenzial kartiert. Kunden in diesen prioritären Regionen repräsentieren über 200.000 zusätzliche Transaktionen, sofern sie das erwartete Leistungsniveau erreichen. Diese regionale Perspektive unterstützt SIX dabei Aktivierungsmaßnahmen gezielt dort einzusetzen, wo sie die größte Wirkung entfalten. 

 

Auf Basis dieser Erkenntnisse entwickelte das Team gezielte Empfehlungen für die Marketing- und Business-Development-Teams von SIX, darunter: 

  • Aktivierungsstrategien für Neuzuziehende 

  • Reaktivierungskampagnen für inaktive Händler 

  • Branchenspezifische Ansätze für unterdurchschnittlich performende Händler 

  • Regionale Priorisierung zur effizienten Ressourcennutzung 

Gemeinsam bilden diese Strategien ein einheitliches Rahmenwerk um das Transaktionswachstum in der gesamten Schweiz zu fördern. 

 

Wie Multi-Agenten-KI komplexe Entscheidungsfindung durch strukturierte Debatten verbessert 

Studierende: Alexey Vitsenko,  Martin Oehmke,  Rizwan Nasir 

Jede bedeutende geschäftliche Entscheidung – von der Entwicklung eines neuen Produkts bis zur Neugestaltung von Unternehmensrichtlinien – ist mit erheblichen Risiken verbunden. Die Herausforderung besteht nicht nur darin, die richtige Option zu wählen, sondern sicherzustellen, dass alle relevanten Perspektiven berücksichtigt wurden. Kognitive Verzerrungen, ungeprüfte Annahmen und begrenzte Blickwinkel können Ergebnisse stillschweigend beeinflussen – selbst in sehr erfahrenen Teams. 

Diese Herausforderung bildete die Grundlage dieses in Zusammenarbeit mit BMW entwickelten Projekts. Das Studierendenteam untersuchte, wie künstliche Intelligenz nicht dazu genutzt werden kann, eine einzelne „richtige“ Antwort zu liefern, sondern Entscheidungen vor ihrer Umsetzung rigoros zu hinterfragen. Ihre Lösung erforscht eine Multi-Agenten-KI-Architektur, in der spezialisierte Agenten Ideen debattieren, kritisieren und verfeinern – und so strukturierte Differenzen simulieren, um die Entscheidungsqualität zu verbessern. 

Von Antworten zu Argumenten: Das Kernkonzept 

Traditionelle KI-Systeme beantworten eine Nutzeranfrage typischerweise mit einer konsolidierten Antwort. Im Gegensatz dazu entwickelte das Team ein Multi-Agenten-System, in dem mehrere KI-Agenten dieselbe Fragestellung aus unterschiedlichen fachlichen Perspektiven betrachten. 

Jedem Agenten wird eine klar definierte Rolle im Entscheidungsprozess zugewiesen: 

  • Vorschlagender (Proposer) – formuliert eine erste Lösung oder Empfehlung 

  • Kritiker (Critic) – hinterfragt Annahmen, identifiziert Schwächen und unterzieht die Logik einem Stresstest 

  • Verfeinerer (Refiner) – verbessert Vorschläge durch die Integration berechtigter Kritik 

  • Reflektor (Reflector) – bewertet den Denkprozess und hebt verbleibende Unsicherheiten hervor 

Anstatt unabhängig zu arbeiten, treten diese Agenten in eine strukturierte, regelbasierte Debatte ein. Ziel ist nicht automatisch Konsens, sondern eine fundierte Synthese. 

Der Workflow folgt einem fünfstufigen Denkzyklus: 

  1. Anfrage- & Kontextdefinition – das Problem wird eingegrenzt und relevante Agenten werden ausgewählt 

  1. Erste Vorschläge – Agenten generieren unabhängige Sichtweisen 

  1. Strukturierte Debatte – Agenten hinterfragen gegenseitig Annahmen und Belege 

  1. Iterative Verfeinerung – Argumente entwickeln sich über mehrere Kritikrunden hinweg 

  1. Synthetisiertes Ergebnis – Erkenntnisse werden zu einer entscheidungsreifen Zusammenfassung konsolidiert 

Dieser Ansatz verwandelt KI von einem Frage-Antwort-Werkzeug in einen analytischen Partner, der Zielkonflikte und Unsicherheiten offenlegt. 

Von Antworten zu Argumenten: Das Kernkonzept 

Traditionelle KI-Systeme beantworten eine Nutzeranfrage typischerweise mit einer konsolidierten Antwort. Im Gegensatz dazu entwickelte das Team ein Multi-Agenten-System, in dem mehrere KI-Agenten dieselbe Fragestellung aus unterschiedlichen fachlichen Perspektiven betrachten. 

Jedem Agenten wird eine klar definierte Rolle im Entscheidungsprozess zugewiesen: 

  • Vorschlagender (Proposer) – formuliert eine erste Lösung oder Empfehlung 

  • Kritiker (Critic) – hinterfragt Annahmen, identifiziert Schwächen und unterzieht die Logik einem Stresstest 

  • Verfeinerer (Refiner) – verbessert Vorschläge durch die Integration berechtigter Kritik 

  • Reflektor (Reflector) – bewertet den Denkprozess und hebt verbleibende Unsicherheiten hervor 

Anstatt unabhängig zu arbeiten, treten diese Agenten in eine strukturierte, regelbasierte Debatte ein. Ziel ist nicht automatisch Konsens, sondern eine fundierte Synthese. 

Der Workflow folgt einem fünfstufigen Denkzyklus: 

  1. Anfrage- & Kontextdefinition – das Problem wird eingegrenzt und relevante Agenten werden ausgewählt 

  1. Erste Vorschläge – Agenten generieren unabhängige Sichtweisen 

  1. Strukturierte Debatte – Agenten hinterfragen gegenseitig Annahmen und Belege 

  1. Iterative Verfeinerung – Argumente entwickeln sich über mehrere Kritikrunden hinweg 

  1. Synthetisiertes Ergebnis – Erkenntnisse werden zu einer entscheidungsreifen Zusammenfassung konsolidiert 

Dieser Ansatz verwandelt KI von einem Werkzeug zum Fragen beantworten in einen analytischen Partner, der Zielkonflikte und Unsicherheiten offenlegt. 

Orchestrierung der Debatte: Der zentrale Koordinator - Um Struktur und Kohärenz sicherzustellen, stützt sich das System auf einen zentralen Koordinator. Anstatt eigene Meinungen beizutragen, steuert diese Komponente den Denkprozess selbst. Der Koordinator legt fest, welche Agenten teilnehmen, verfolgt die Entwicklung der Argumente, setzt Debattenregeln durch und sorgt für eine ausgewogene Repräsentation der Perspektiven. Sobald die Debatte konvergiert, fasst er validierte Beiträge zu einem einzigen, kohärenten Output zusammen, der für menschliche Entscheidungsträger konzipiert ist. 

Verankerung des Denkens mit Wissensbasis und RAG - Für die Anwendbarkeit in der Praxis betonte das Team, dass KI-Debatten auf unternehmensspezifischem Wissen basieren müssen und nicht auf generischen Internetdaten. Um dies zu gewährleisten, integriert das System Retrieval-Augmented Generation (RAG). 

Über das Engineering hinaus: Anwendung des Systems auf die HR-Strategie - Während die automobile Entwicklung ein naheliegender Anwendungsfall ist, zeigt das Projekt eine breitere Einsetzbarkeit. Das Team veranschaulichte dies anhand eines HR-Strategiebeispiels: Sollte ein Unternehmen eine Vier-Tage-Woche einführen, ohne die Gehälter zu reduzieren? 
 

 

Anstatt eine einzelne Empfehlung zu liefern, initiiert das System eine Debatte zwischen spezialisierten Agenten: 

  • HR-Strategie-Agent – bewertet Mitarbeitermotivation, Mitarbeiterbindung und Arbeitgebermarke 

  • Finanz-Agent – analysiert Auswirkungen auf die Produktivität, Kostenstrukturen und finanzielle Risiken 

  • Operations-Agent – prüft Umsetzbarkeit, Umsetzungstermine und Koordinationsherausforderungen 

Das finale Ergebnis ist kein einfaches Ja oder Nein, sondern eine strukturierte Empfehlung, die Auswirkungen auf Mitarbeitende, finanzielle Risiken und operative Machbarkeit miteinander abwägt – und dabei gegebenenfalls stufenweise Einführungen oder bedingte Schutzmaßnahmen berücksichtigt. 

Reduzierung von Bias und Steigerung der Entscheidungssicherheit – Ein zentrales Ergebnis des Projekts ist die systematische Verringerung von Bias. Indem mehrere Perspektiven gezielt dazu gebracht werden, sich gegenseitig herauszufordern, werden blinde Flecken und implizite Annahmen frühzeitig im Prozess sichtbar. Dies ist besonders kritisch in sicherheitssensiblen Umgebungen, in denen übersehene Faktoren schwerwiegende Konsequenzen haben können. 
Weitere Vorteile sind unter anderem: 

  • Konsistente, qualitativ hochwertige Argumentation über Abteilungen hinweg 

  • Transparente Audit-Trails, die nachvollziehbar machen, wie Entscheidungen zustande kamen 

  • Schnellere Managemententscheidungen durch frühzeitige, strukturierte Analyse 

KI als Rahmenwerk für diszipliniertes Denken – Dieses Capstone-Projekt zeigt, wie Multi-Agenten-KI komplexe Entscheidungsfindung verbessern kann, indem sie Meinungsverschiedenheiten strukturiert, anstatt eine einzelne „beste“ Antwort zu liefern. Durch das Explizitmachen von Annahmen sowie das Aufzeigen von Risiken und Zielkonflikten stärkt das System menschliches Urteilsvermögen, anstatt es zu ersetzen. Mit der fortschreitenden Reife von Enterprise-KI unterstreichen solche Ansätze die Rolle von KI als transparentes und skalierbares Rahmenwerk für diszipliniertes Denken in Zusammenarbeit mit menschlicher Expertise. 

Lola - HR-Vertragsmanagementsystem 

Studierende: Alejandra Vicaria, Catalina Cimpanu, Dora Novoa, Laura Fatta  

Die durchschnittliche HR-Abteilung verbringt unzählige Stunden mit manueller Dateneingabe und komplexer Papierarbeit. Diese repetitiven Aufgaben sind häufig fehleranfällig – etwa durch Tippfehler oder Inkonsistenzen – und führen zu Frustration und Ineffizienz. In einer Zeit, in der KI Arbeitsabläufe optimieren kann, haben HR-Teams das Potenzial, diese verlorene Zeit zurückzugewinnen. Dadurch können sie sich stärker auf strategisches Personalmanagement konzentrieren – allerdings nur, wenn ihnen die dafür notwendigen intelligenten Werkzeuge zur Verfügung stehen. 

Genau diese Aufgabe übernahm das Team für BAK Economics. BAK Economics ist ein führendes unabhängiges Wirtschaftsforschungsinstitut und eine Beratungsfirma, die empirische Wirtschaftsanalysen, fundierte Studien sowie modellbasierte Prognosen für Unternehmen, öffentliche Institutionen und politische Entscheidungsträger in der Schweiz und international erstellt. Zur Unterstützung der internen Abläufe forderte BAK das Team heraus, das manuelle Ausfüllen von Formularen durch einen intelligenten Workflow zu ersetzen, der die Erstellung und Verwaltung von Arbeitsverträgen automatisiert. 

Angesichts der Komplexität, mehrere Vertragsversionen zu verwalten, und der mühsamen manuellen Eingabe galt das Projekt als erfolgreich, wenn es dem Team gelingen würde: 

  • Eine dialogbasierte Benutzeroberfläche zu entwickeln, die Nutzer durch den Prozess führt 

  • Die Auswahl des richtigen Vertragstyps basierend auf Nutzereingaben zu automatisieren 

  • Fehlerfreie, unterschriftsreife Dokumente (PDF & DOCX) zu generieren 

Das Team setzte eine Strategie um, die KI und moderne Web-Frameworks nutzte und die Erwartungen sogar übertraf. Das Ergebnis umfasste: 

  • 5 unterschiedliche Vertragstypen, die erfolgreich automatisiert wurden (Unbefristet, Praktikum, Stundenlohn, Vertragsänderung und Umwandlung) 

  • Intelligente Funktionen wie natürliche Sprachverarbeitung für Datumsangaben (z. B. das Verständnis von „nächsten Montag“) sowie automatische Tippfehlerkorrektur 

  • Mehrsprachige Unterstützung der Benutzeroberfläche (Deutsch, Englisch, Spanisch) 

  • Eine umfassende Webanwendung, die den gesamten Lebenszyklus abdeckt – nicht nur die Konversation, sondern auch Mitarbeiterdatensätze, Datenbankeinträge und die finale Dokumentenauslieferung 

Um diese Ergebnisse zu erzielen, nutzte das Team eine Vielzahl von Werkzeugen, darunter Large Language Models (LLMs), Python-basierte Bibliotheken zur Dokumentenverarbeitung sowie Cloud-Infrastruktur. 
Die erste Komponente bestand in der Entwicklung des „Gehirns“ des Systems: des KI-Agenten. Diese Schicht verarbeitet Nutzereingaben, verwaltet den Gesprächszustand und validiert die gesammelten Daten. Sie umfasst einen intelligenten Korrektur-Workflow, der es Nutzern ermöglicht, Angaben vor der Finalisierung zu überprüfen und anzupassen. Zudem leitet das System die Nutzer automatisch auf den richtigen Vertrags-„Pfad“ (z. B. Neueinstellung vs. bestehender Mitarbeitender), ohne dass diese interne Bezeichnungen kennen müssen. 

Die zweite Komponente konzentrierte sich auf die Dokumentenerstellung und das Datenmanagement. Sobald der Agent alle erforderlichen Informationen (z. B. Gehalt, Arbeitspensum) gesammelt hat, nutzt das System Python-Tools, um Vorlagen automatisch auszufüllen. Zur weiteren Optimierung kommen Suchalgorithmen zum Einsatz, mit denen die KI bestehende Mitarbeitende in der Datenbank korrekt identifizieren kann – selbst wenn nur ein Teil des Namens eingegeben wird oder ein Tippfehler vorliegt. Alle Daten, einschließlich Audit-Logs und Mitarbeiterdatensätze, werden sicher in einer PostgreSQL-Datenbank gespeichert. Dies gewährleistet Datenintegrität und ermöglicht eine einfache „Mitarbeitersuche“ für zukünftige Vertragsänderungen. Die Ergebnisse lassen sich im unten dargestellten Logik-Flow nachvollziehen, der zeigt, wie das System unterschiedliche Beschäftigungsszenarien verarbeitet. 

Die dritte Komponente konzentrierte sich auf eine umfassende Webanwendung und eine Datenbankarchitektur, die weit über eine einfache Chat-Oberfläche hinausgeht. Das Team entwickelte eine robuste Full-Stack-Plattform auf Basis von Flask und stellte diese auf AWS bereit, unterstützt durch eine relationale Datenbank, die für die sichere Verwaltung des gesamten HR-Lebenszyklus konzipiert ist. Diese Architektur ermöglicht es Administratoren, zentrale Daten direkt innerhalb der Anwendung zu verwalten (z. B. Mitarbeiterdaten, Stellenprofile und Abteilungen). Über die reine Dokumentenerstellung hinaus verfolgt das System unterschiedliche Vertragsversionen, protokolliert Änderungsanträge zu Gehalt und Arbeitspensum und führt einen detaillierten Audit-Trail jeder Benutzeraktion. Darüber hinaus unterstützt das System Massenverarbeitungen von Daten, sodass Administratoren Excel-Exporte für Reportings erstellen können – parallel zur Generierung einzelner PDF-Arbeitsverträge. Auf diese Weise stellt die zugrunde liegende Anwendung sicher, dass trotz der dialoggesteuerten Interaktion durch den KI-Agenten jederzeit Datenintegrität, Sicherheit und vollständige administrative Kontrolle gewährleistet sind.  

 

Durch diese Schritte verwandelte das Team eine manuelle, fehleranfällige Aufgabe in einen effizienten, KI-gestützten Workflow. Das Tool erzeugt nicht nur systematisch saubere, qualitativ hochwertige Arbeitsverträge, sondern bietet BAK Economics zudem eine skalierbare Grundlage für künftige HR-Automatisierungen. 
 

Tygo Telecom KI-Chat-Assistent 

Studentierende: Fares Alharbi, Anas AlsaediDeena AlkhlewiAhmed Althiabi 
 
Tygo ist ein saudi-arabischer Mobilfunkanbieter, der weltweit flexible Konnektivität und kundenorientierte Datentarife anbietet. In diesem Capstone-Projekt wurde für Tygo ein System entwickelt, um Herausforderungen beim Abrufen und Schlussfolgern über große Mengen unstrukturierter Daten zu bewältigen. 

KI-Modelle sind zu leistungsstarken Werkzeugen für moderne Unternehmen geworden. Für relativ einfache Anwendungsfälle lassen sich Standardlösungen oft schnell implementieren und liefern unmittelbaren Mehrwert. Mit zunehmender Größe und Komplexität von Projekten werden jedoch die Grenzen generischer KI-Lösungen deutlich. Große, langfristige Initiativen bringen Herausforderungen wie unstrukturierte Altdaten, inkonsistente Formate und ein erhöhtes Risiko von Halluzinationen mit sich – insbesondere dann, wenn Modelle mit Anweisungen überladen werden, um jahrzehntelang angesammelten Kontext „zu verstehen“.  

Wie also kann eine KI-Lösung skalierbar und stabil gestaltet werden und dabei dennoch durch gut konzipierte Prompting-Techniken äußerst hilfreich und reaktionsschnell bleiben? In einem Digitalisierungsprojekt mit Tausenden von Dateien, die bis in die 1970er Jahre zurückreichen, liegen die Daten beispielsweise in vielen unterschiedlichen Formaten und Strukturen vor, was eine vollständig standardisierte Speicherung nahezu unmöglich macht. Das spätere Auffinden solcher Informationen erfordert häufig mühsame manuelle Prozesse – ein Bereich, in dem KI erhebliche Beschleunigung bieten könnte. Die Herausforderung besteht jedoch darin, eine KI-Lösung zu implementieren, die Projekte dieser Größenordnung bewältigen kann und dabei Halluzinationen verhindert, insbesondere wenn das Model über Jahrzehnte angesammelter Komplexität instruiert werden muss. 

Genau das haben Fares, Anas, Deena und Ahmed mit Tygo erreicht, indem sie einen Chatbot entwickelt haben, der Datentarife für Kundinnen und Kunden in einem komplexen Markt abruft: 
 

  

 

Sie analysierten das Tygo-Geschäft und entschieden sich dagegen, alle Informationen in einem reinen Rohtextformat zu speichern, aus dem das KI-Modell später über eine Vektordatenbank abrufen sollte. Stattdessen fügten sie den Embedding-Daten Metadaten hinzu, sodass die Datenbank bereits vor dem Zugriff durch das KI-Modell sortiert und gefiltert werden kann. Auf diese Weise lassen sich zwei wichtige Ziele erreichen: 

  • Reduzierung der Datenmenge, mit der auf Queryebene gearbeitet werden muss 

  • Dynamisches Prompting mithilfe der metadatenbezogenen Filter für eine jeweilige Anfrage 

Stellen Sie sich zum Beispiel vor, Sie haben 100 Artikel zu verkaufen. Anstatt der KI zu erlauben, alle Artikel zu durchsuchen, um die günstigsten 10 % zu identifizieren, können Preise als Metadaten zusammen mit den Embeddings gespeichert und vorab zum Sortieren oder Filtern der Ergebnisse genutzt werden. Auf diese Weise muss das Sprachmodell nur noch über die relevanteste Teilmenge nachdenken. Skaliert man diesen Ansatz von Hunderten auf Tausende oder sogar Millionen von Artikeln, ergeben sich erhebliche Effizienzgewinne. Zusätzliche Metadaten wie Datenquelle, Preise oder Dokumentdaten können ebenfalls eingebunden werden, um große Projekte leistungsfähig und überschaubar zu halten. 

 

Zur Umsetzung dieses Ansatzes werden Daten unabhängig von ihrem ursprünglichen Format oder ihrer Quelle gesammelt. Die Dokumente werden in Chunks aufgeteilt, eingebettet und mit Metadaten wie Quellenkennungen, Datumsangaben, Preisen oder anderen sortierbaren Attributen angereichert (siehe Abbildung oben). Diese angereicherten Chunks werden anschließend in einer Vektordatenbank gespeichert und bilden die Grundlage der Tygo-Chatbot-Architektur.  

Dieses Projekt zeigt, wie eine durchdachte Datenstrukturierung und effektive Retrieval-Strategien die Zuverlässigkeit und Skalierbarkeit KI-gestützter Systeme in komplexen Unternehmensumgebungen deutlich verbessern können. 

Fazit 

Mit dem Abschluss der Data-Science-Capstone-Projekte des DS-Batchs #34 feiern wir die beeindruckenden Leistungen unserer Absolvent:innen. Ihre Arbeiten zeigen eindrucksvoll, was entsteht, wenn technisches Know-how auf Kreativität trifft: Data Science entfaltet ihr volles Innovationspotenzial. 

Ein herzliches Dankeschön geht an unsere Partner, Mentor:innen und Dozent:innen, die die Teams während ihrer gesamten Reise begleitet haben. Mit ihrem Wissen, ihrer Unterstützung und der engen Zusammenarbeit haben sie entscheidend dazu beigetragen aus Ideen funktionierende Prototypen für reale Anwendungsfälle zu machen. 

An unsere Absolvent:innen: Eure Neugier, Ausdauer und euer Anspruch, echte Probleme zu lösen, machen diese Community so besonders. Wir sind gespannt, wohin euer Weg euch als Nächstes führt - und wie ihr die Zukunft von KI und datengetriebener Innovation weiter mitgestalten werdet. 

Wenn euch diese Projekte inspirieren, erfahrt hier, wie ihr Teil des nächsten Data-Science-Batchs an der Constructor Nexademy werden könnt und startet euer eigenes innovatives Projekt. 

Möchtest Du mehr über die Constructor Nexademy und technikbezogene Themen lesen? Dann finde hier weitere spannende Blogbeiträge.

Mehr Infos
Blog