Kitsuno ist keine Jobbörse. Es ist eine Pipeline — eine Abfolge spezialisierter KI-Agenten, die rohe Stellenanzeigen in bewertete, validierte und entwurfsfertige Möglichkeiten verwandeln. Dieser Artikel erklärt, wie jede Stufe funktioniert, welche Entscheidungen getroffen werden und wo der Mensch die Kontrolle behält.
Die Pipeline: sechs Agenten in Folge
Jede Stellenanzeige, die in Kitsuno eingeht, durchläuft sechs Stufen. Jede Stufe hat einen eigenen Agenten, ein eigenes KI-Modell und einen eigenen Zweck.
Stufe 1 — Scanner. Durchsucht Jobquellen nach einem Zeitplan. Die Frequenz hängt vom Plan ab: einmal täglich bei Kit (kostenlos), bis zu viermal täglich bei Pro. Zu den Quellen gehören globale Plattformen, nationale Arbeitsagenturen, Nischenportale und ATS-Plattformen via X-Ray-Suche. Der Scanner holt rohe Stellenanzeigen und speichert sie zur Verarbeitung.
Stufe 2 — Extractor. Liest jede rohe Stellenanzeige und extrahiert strukturierte Daten: Jobtitel, Unternehmen, Standort, Beschäftigungsart, Senioritätssignale, Sprachanforderungen, Gehalt (sofern verfügbar) und eine Geo-Scope-Klassifikation (weltweit, länderbeschränkt oder stadtbeschränkt). Diese strukturierten Daten bilden die Grundlage für alles Weitere.
Stufe 3 — Geo-Scope-Gate. Bevor Ressourcen für die vollständige Bewertung eingesetzt werden, prüft das System, ob die Stelle geografisch möglich ist. Die extrahierte Standortinformation wird mit den hinterlegten Arbeitserlaubnisregionen abgeglichen. Stellen, die auf ein Land beschränkt sind, für das keine Arbeitsgenehmigung vorliegt, werden vor der Bewertung gelöscht. Dieses Gate behandelt auch Remote-Ambiguität — „Remote” allein bedeutet nicht international, es sei denn, die Anzeige sagt es ausdrücklich.
Stufe 4 — Scorer. Der Kernschritt der Bewertung. Ein LLM erhält die vollständige Stellenbeschreibung und die strukturierten Karrierenachweise (Fähigkeiten, Erfahrung, Ausbildung, Zertifikate — aus dem Professional Record Store). Es bewertet die Passung anhand von vier Kriterien und liefert eine strukturierte Bewertung mit konkreten Übereinstimmungen und Lücken.
Stufe 5 — Writer. Wenn ein Entwurf angefordert wird, stellt der Writer-Agent Kontext aus der Karrierebibliothek, den Bewertungsdaten und einem eventuell vorhandenen Fit Report zusammen und generiert dann einen maßgeschneiderten Lebenslauf, ein Anschreiben und eine Bewerbungsmail. Drei aufeinanderfolgende KI-Aufrufe erzeugen jeden Dokumentabschnitt. Die Ausgabe verwendet die konfigurierten Einstellungen für Stimme, Sprache und Schwerpunkte.
Stufe 6 — Validator. Jedes KI-generierte Dokument durchläuft 14 automatisierte Qualitätsprüfungen, bevor es angezeigt wird. Probleme werden sichtbar markiert. Kritische Fehler bieten einen kostenlosen Neuentwurf. Die Validierungsergebnisse fließen über eine Selbstkorrekturschleife in künftige Entwürfe ein.
Die vier Bewertungskriterien
Jede Stelle wird auf einer 100-Punkte-Skala über vier gewichtete Dimensionen bewertet. Die Gewichtungen sind pro Suchprofil konfigurierbar — hier die Standardwerte.
Rollenübereinstimmung (40 Punkte). Wie gut passen die Anforderungen der Stelle zu den nachgewiesenen Fähigkeiten und Erfahrungen? Der Scorer analysiert Aufgaben, Fachexpertise und technische Anforderungen im Vergleich zu den Nachweisen in der Bibliothek. Kein Keyword-Matching — sondern semantisches Verständnis davon, was die Rolle erfordert und was die Karriere belegt.
Standort- und Remote-Kompatibilität (25 Punkte). Passt die Geografie? Der Scorer berücksichtigt Arbeitserlaubnisregionen, bevorzugte Standorte, akzeptierte Arbeitsmodelle (Remote, Hybrid, vor Ort) und die spezifischen Standortanforderungen der Stelle. Ein harter Ausschluss gilt: Ist die Stelle auf eine Region beschränkt, für die keine Arbeitsgenehmigung vorliegt, fällt die Standortbewertung nahe null — unabhängig davon, wie gut die fachliche Passung ist.
Senioritäts-Passung (20 Punkte). Stimmt das Erfahrungslevel? Der Scorer bewertet Führungsumfang, Erfahrungsjahre und Erwartungen an Leitungsverantwortung im Vergleich zum Karriereverlauf. Bevorzugte Senioritätsstufen lassen sich konfigurieren und irrelevante Stufen ausschließen.
Organisationstyp (15 Punkte). Passt die Art des Arbeitgebenden zu den eigenen Präferenzen? Konzern, Startup, NGO, Behörde, akademische Einrichtung — verschiedene Umgebungen passen zu verschiedenen Menschen. Der Scorer gleicht die Organisationssignale der Anzeige mit den hinterlegten Präferenzen ab.
Die Gesamtbewertung ergibt ein Fit-Urteil: starke Passung, mittlere Passung, schwache Passung oder keine Passung. Jede Bewertung zeigt ihre Aufschlüsselung — sichtbar wird, welches Kriterium was beigetragen hat, welche Fähigkeiten übereinstimmten und welche Lücken die KI identifiziert hat.
Der Validator: 14 Prüfungen, null Toleranz für Erfundenes
Der Validator ist ein eigenständiger Agent, dessen einzige Aufgabe es ist, die Fehler der anderen Agenten zu finden. Er läuft bei jedem Dokument vor der Auslieferung.
Kritische Fehler blockieren die Auslieferung und bieten einen kostenlosen Neuentwurf. Dazu gehören: leerer Inhalt, übrig gebliebene Vorlagen-Platzhalter, durchgesickerte KI-Selbstreferenzen, Sprachkonflikte (Deutsch angefordert, Englisch geliefert), Kontaktdaten im Anschreiben, Kennzahlen-Halluzinationen (Zahlen oder Prozentsätze, die in der Karrierebibliothek nicht existieren) und Ich-Form-Verstöße.
Warnungen werden als lesbare Hinweise angezeigt, die geprüft und verworfen werden können. Dazu gehören: ungewöhnliche Dokumentlänge, überstrapazierte Füllwörter (leveragen, Synergien, nutzen — das verbale Äquivalent eines leeren Anzugs), Inkonsistenzen bei Unternehmens- und Rollenbezeichnungen über Dokumente hinweg und eine LLM-gestützte Prüfung auf erfundene Behauptungen.
Die Selbstkorrekturschleife. Validierungsergebnisse werden nach jedem Entwurf gespeichert. Wenn ein Neuentwurf angefordert wird, werden die vorherigen Fehler als verbindliche Vermeidungsanweisungen in den Kontext des Writers injiziert. Die KI weiß, was beim letzten Mal schiefging, und vermeidet aktiv eine Wiederholung. Entwerfen, validieren, Fehler speichern, mit Bewusstsein neu entwerfen, erneut validieren.
Der Validator ist kalibriert, nicht allwissend. Kleine Modelle haben strukturelle Grenzen. Das Designprinzip sind lesbare, verwerfbare Hinweise — nicht null Fehlalarme. Transparenz über Einschränkungen ist selbst ein Qualitätssignal.
Multi-Modell-Architektur: das richtige Modell für jede Aufgabe
Kitsuno verwendet nicht ein Modell für alles. Verschiedene Aufgaben haben verschiedene Anforderungen — Geschwindigkeit, Genauigkeit, Kreativität, Kosten — und verschiedene Modelle bedienen sie am besten.
Scoring und Extraktion nutzen Modelle, die für strukturierte JSON-Ausgabe optimiert sind. Die Aufgabe ist Klassifikation: Gegeben diese Stelle und diese Karriere, liefere eine strukturierte Bewertung. Kleinere, schnellere Modelle bewältigen das zuverlässig, weil das Ausgabeformat eingeschränkt ist.
Schreiben nutzt größere Modelle, die für natürliche Sprachgenerierung optimiert sind. Anschreiben und berufliche Zusammenfassungen erfordern Nuancen, Stimmkonsistenz und die Fähigkeit, Nachweise zu überzeugenden Erzählungen zu verdichten. Zahlende Accounts erhalten für diese Aufgabe Premium-Modelle, weil der Qualitätsunterschied sichtbar ist.
Validierung nutzt schnelle, leichte Modelle. Die Aufgabe ist binäre Klassifikation (bestanden/nicht bestanden) bei spezifischen Prüfungen. Geschwindigkeit zählt, weil die Validierung nach jedem Entwurf läuft.
Concierge-Chat nutzt Modelle, die für Gesprächsqualität und Kontexttiefe ausbalanciert sind. Zahlende Accounts erhalten tiefere Kontextfenster und leistungsfähigere Modelle, aber die Persönlichkeit und Stimme bleiben über alle Stufen identisch.
EU-First-Routing. Personenbezogene Daten zahlender Accounts werden im Normalbetrieb ausschließlich über EU-basierte KI-Anbieter geroutet. Das ist keine Marketingaussage — es ist eine Architekturvorgabe, die in der Routing-Schicht erzwungen wird. Die konkreten Anbieter, Modelle und Fallback-Ketten sind dokumentiert, getestet und überwacht.
Free-Tier-Kaskade. Kostenlose Accounts erhalten die gleiche Bewertungsqualität über eine Kaskade von Free-Tier-Anbietern. Wenn ein Anbieter ausfällt, springt das System zum nächsten. Die Bewertungskriterien, Gewichtungen und Evaluationsmaßstäbe sind identisch — was sich ändert, ist der Anbieter, nicht die Methodik.
Das Brain: deterministische Intelligenz
Nicht alles erfordert ein LLM. Kitsunos Brain ist eine reine SQL- und Python-Diagnose-Engine, die 21 Regeln gegen die vorhandenen Daten prüft — null KI-Kosten, null Halluzinationsrisiko.
Das Brain prüft Dinge wie: Bibliotheksvollständigkeit (wie viele Fähigkeiten haben belastbare Nachweise), Pipeline-Gesundheit (Verhältnis Bewerbungen zu Rückmeldungen), Quelleneffektivität (welche Quellen starke Treffer liefern), Profilkonfigurationsqualität (fehlende Gewichtungen, leere Keyword-Listen) und Bereitschaftssignale (ist das Profil bereit für eine sinnvolle Jobsuche).
Das Brain generiert für jedes Profil ein Wissensdokument, das in den Concierge-Chat-Kontext einfließt. Wenn Kitso etwas Konkretes über eine Karriere sagt, spricht oft das Brain: deterministische Beobachtungen aus echten Daten, keine LLM-Spekulation.
Was überprüfbar ist
Jede Stufe der Pipeline erzeugt inspizierbaren Output.
Der Scorer zeigt seine Aufschlüsselung nach vier Kriterien, die wichtigsten Übereinstimmungen und Lücken für jede Stelle. Der Writer erzeugt Dokumente, die vor dem Versand geprüft werden. Der Validator zeigt seine Prüfergebnisse als Qualitätshinweise — grün, gelb oder rot — mit konkreten Beschreibungen. Die Diagnostik des Brain fließt in Kitsos Beobachtungen ein, die konkrete Stellen, Bewertungen und Fähigkeiten benennen.
Die Pipeline ist keine Blackbox mit einer Zahl am Ende. Sie ist eine Abfolge transparenter Schritte, jeder mit sichtbaren Eingaben und Ausgaben, bei denen der Mensch entscheidet, was als Nächstes passiert.
Das Open-Source-Verzeichnis europäischer Jobquellen auf GitHub entdecken →
Für die Prinzipien hinter diesen technischen Entscheidungen: Warum es Kitsuno gibt lesen. Für aktuelle Marktdaten aus dieser Pipeline: Market Pulse besuchen.