Wie bewertet Kitsuno die Passung von Stellenangeboten?

Jede Stelle wird anhand von vier gewichteten Kriterien bewertet: Rollenübereinstimmung (40 %), Standort- und Remote-Kompatibilität (25 %), Senioritäts-Passung (20 %) und Organisationstyp (15 %). Die Gewichtungen sind pro Suchprofil konfigurierbar. Die Bewertung erfolgt durch ein LLM, das die vollständige Stellenbeschreibung und die strukturierten Karrierenachweise erhält und eine Aufschlüsselung pro Kriterium mit konkreten Übereinstimmungen und Lücken liefert.

Welche Jobquellen durchsucht Kitsuno?

Kitsuno durchsucht Jobquellen in Europa und international — von globalen Plattformen wie LinkedIn und Indeed über nationale Arbeitsagenturen wie France Travail, NAV.no und die Arbeitsagentur bis hin zu Nischenportalen und ATS-Plattformen via X-Ray-Suche. Die Quellenliste wächst kontinuierlich. Ein Open-Source-Verzeichnis der Quellen ist auf GitHub verfügbar.

Wie funktioniert der Kitsuno-Validator?

Der Validator führt 14 automatisierte Prüfungen an jedem KI-generierten Dokument durch, bevor es angezeigt wird. Dazu gehören Halluzinationserkennung (Abgleich von Behauptungen mit der Karrierebibliothek), Entfernung von Vorlagen-Artefakten, Sprachabgleich, Schutz vor Kontaktdaten-Lecks und Erkennung von Füllwörtern. Kritische Fehler blockieren die Auslieferung. Warnungen werden als lesbare, verwerfbare Hinweise angezeigt.

Welche KI-Modelle verwendet Kitsuno?

Kitsuno nutzt eine Multi-Modell-Architektur mit EU-First-Routing. Verschiedene Agenten verwenden verschiedene Modelle, optimiert für ihre jeweilige Aufgabe: größere Modelle für Bewertungs- und Schreibqualität, kleinere Modelle für Extraktions- und Validierungsgeschwindigkeit. Daten zahlender Accounts werden im Normalbetrieb über EU-basierte Anbieter geroutet. Kostenlose Accounts erhalten dieselbe Bewertungsqualität über eine Free-Tier-Kaskade.

Verwendet Kitsuno meine Daten zum Trainieren von KI-Modellen?

Nein. Alle KI-Aufrufe sind reine Inferenz. Karrieredaten werden als Kontext für eine bestimmte Aufgabe gesendet und nie vom KI-Anbieter für Training gespeichert. Jede Anfrage enthält nur den für die jeweilige Aufgabe benötigten Kontext — die vollständige Bibliothek wird nie in einer einzigen Anfrage übertragen.

Was ist die Selbstkorrekturschleife?

Wenn der Validator Probleme in einem Entwurf findet, werden diese gespeichert. Beim Neuentwurf werden die vorherigen Validierungsfehler in den Kontext des Writers injiziert, damit dieselben Fehler nicht wiederholt werden. So entsteht eine Feedback-Schleife: Entwerfen, validieren, Fehler speichern, mit Bewusstsein der bisherigen Fehler neu entwerfen, erneut validieren.

Wie funktioniert der Standortabgleich bei Kitsuno?

Der Standortabgleich nutzt ein Geo-Scope-Gate, das vor der Bewertung läuft. Stellen werden als weltweit, länderbeschränkt oder stadtbeschränkt klassifiziert. Das System gleicht mit den hinterlegten Arbeitserlaubnisregionen ab und schließt geografisch unmögliche Stellen aus, bevor Ressourcen für die vollständige Bewertung eingesetzt werden. Remote bedeutet nicht automatisch international — das System prüft, ob eine Remote-Stelle standortbeschränkt ist.

Wie wir Arbeitsmarktsignale messen

Kitsuno ist keine Jobbörse. Es ist eine Pipeline — eine Abfolge spezialisierter KI-Agenten, die rohe Stellenanzeigen in bewertete, validierte und entwurfsfertige Möglichkeiten verwandeln. Dieser Artikel erklärt, wie jede Stufe funktioniert, welche Entscheidungen getroffen werden und wo der Mensch die Kontrolle behält.

Die Pipeline: sechs Agenten in Folge

Jede Stellenanzeige, die in Kitsuno eingeht, durchläuft sechs Stufen. Jede Stufe hat einen eigenen Agenten, ein eigenes KI-Modell und einen eigenen Zweck.

Stufe 1 — Scanner. Durchsucht Jobquellen nach einem Zeitplan. Die Frequenz hängt vom Plan ab: einmal täglich bei Kit (kostenlos), bis zu viermal täglich bei Pro. Zu den Quellen gehören globale Plattformen, nationale Arbeitsagenturen, Nischenportale und ATS-Plattformen via X-Ray-Suche. Der Scanner holt rohe Stellenanzeigen und speichert sie zur Verarbeitung.

Stufe 2 — Extractor. Liest jede rohe Stellenanzeige und extrahiert strukturierte Daten: Jobtitel, Unternehmen, Standort, Beschäftigungsart, Senioritätssignale, Sprachanforderungen, Gehalt (sofern verfügbar) und eine Geo-Scope-Klassifikation (weltweit, länderbeschränkt oder stadtbeschränkt). Diese strukturierten Daten bilden die Grundlage für alles Weitere.

Stufe 3 — Geo-Scope-Gate. Bevor Ressourcen für die vollständige Bewertung eingesetzt werden, prüft das System, ob die Stelle geografisch möglich ist. Die extrahierte Standortinformation wird mit den hinterlegten Arbeitserlaubnisregionen abgeglichen. Stellen, die auf ein Land beschränkt sind, für das keine Arbeitsgenehmigung vorliegt, werden vor der Bewertung gelöscht. Dieses Gate behandelt auch Remote-Ambiguität — „Remote” allein bedeutet nicht international, es sei denn, die Anzeige sagt es ausdrücklich.

Stufe 4 — Scorer. Der Kernschritt der Bewertung. Ein LLM erhält die vollständige Stellenbeschreibung und die strukturierten Karrierenachweise (Fähigkeiten, Erfahrung, Ausbildung, Zertifikate — aus dem Professional Record Store). Es bewertet die Passung anhand von vier Kriterien und liefert eine strukturierte Bewertung mit konkreten Übereinstimmungen und Lücken.

Stufe 5 — Writer. Wenn ein Entwurf angefordert wird, stellt der Writer-Agent Kontext aus der Karrierebibliothek, den Bewertungsdaten und einem eventuell vorhandenen Fit Report zusammen und generiert dann einen maßgeschneiderten Lebenslauf, ein Anschreiben und eine Bewerbungsmail. Drei aufeinanderfolgende KI-Aufrufe erzeugen jeden Dokumentabschnitt. Die Ausgabe verwendet die konfigurierten Einstellungen für Stimme, Sprache und Schwerpunkte.

Stufe 6 — Validator. Jedes KI-generierte Dokument durchläuft 14 automatisierte Qualitätsprüfungen, bevor es angezeigt wird. Probleme werden sichtbar markiert. Kritische Fehler bieten einen kostenlosen Neuentwurf. Die Validierungsergebnisse fließen über eine Selbstkorrekturschleife in künftige Entwürfe ein.

Die vier Bewertungskriterien

Jede Stelle wird auf einer 100-Punkte-Skala über vier gewichtete Dimensionen bewertet. Die Gewichtungen sind pro Suchprofil konfigurierbar — hier die Standardwerte.

Rollenübereinstimmung (40 Punkte). Wie gut passen die Anforderungen der Stelle zu den nachgewiesenen Fähigkeiten und Erfahrungen? Der Scorer analysiert Aufgaben, Fachexpertise und technische Anforderungen im Vergleich zu den Nachweisen in der Bibliothek. Kein Keyword-Matching — sondern semantisches Verständnis davon, was die Rolle erfordert und was die Karriere belegt.

Standort- und Remote-Kompatibilität (25 Punkte). Passt die Geografie? Der Scorer berücksichtigt Arbeitserlaubnisregionen, bevorzugte Standorte, akzeptierte Arbeitsmodelle (Remote, Hybrid, vor Ort) und die spezifischen Standortanforderungen der Stelle. Ein harter Ausschluss gilt: Ist die Stelle auf eine Region beschränkt, für die keine Arbeitsgenehmigung vorliegt, fällt die Standortbewertung nahe null — unabhängig davon, wie gut die fachliche Passung ist.

Senioritäts-Passung (20 Punkte). Stimmt das Erfahrungslevel? Der Scorer bewertet Führungsumfang, Erfahrungsjahre und Erwartungen an Leitungsverantwortung im Vergleich zum Karriereverlauf. Bevorzugte Senioritätsstufen lassen sich konfigurieren und irrelevante Stufen ausschließen.

Organisationstyp (15 Punkte). Passt die Art des Arbeitgebenden zu den eigenen Präferenzen? Konzern, Startup, NGO, Behörde, akademische Einrichtung — verschiedene Umgebungen passen zu verschiedenen Menschen. Der Scorer gleicht die Organisationssignale der Anzeige mit den hinterlegten Präferenzen ab.

Die Gesamtbewertung ergibt ein Fit-Urteil: starke Passung, mittlere Passung, schwache Passung oder keine Passung. Jede Bewertung zeigt ihre Aufschlüsselung — sichtbar wird, welches Kriterium was beigetragen hat, welche Fähigkeiten übereinstimmten und welche Lücken die KI identifiziert hat.

Der Validator: 14 Prüfungen, null Toleranz für Erfundenes

Der Validator ist ein eigenständiger Agent, dessen einzige Aufgabe es ist, die Fehler der anderen Agenten zu finden. Er läuft bei jedem Dokument vor der Auslieferung.

Kritische Fehler blockieren die Auslieferung und bieten einen kostenlosen Neuentwurf. Dazu gehören: leerer Inhalt, übrig gebliebene Vorlagen-Platzhalter, durchgesickerte KI-Selbstreferenzen, Sprachkonflikte (Deutsch angefordert, Englisch geliefert), Kontaktdaten im Anschreiben, Kennzahlen-Halluzinationen (Zahlen oder Prozentsätze, die in der Karrierebibliothek nicht existieren) und Ich-Form-Verstöße.

Warnungen werden als lesbare Hinweise angezeigt, die geprüft und verworfen werden können. Dazu gehören: ungewöhnliche Dokumentlänge, überstrapazierte Füllwörter (leveragen, Synergien, nutzen — das verbale Äquivalent eines leeren Anzugs), Inkonsistenzen bei Unternehmens- und Rollenbezeichnungen über Dokumente hinweg und eine LLM-gestützte Prüfung auf erfundene Behauptungen.

Die Selbstkorrekturschleife. Validierungsergebnisse werden nach jedem Entwurf gespeichert. Wenn ein Neuentwurf angefordert wird, werden die vorherigen Fehler als verbindliche Vermeidungsanweisungen in den Kontext des Writers injiziert. Die KI weiß, was beim letzten Mal schiefging, und vermeidet aktiv eine Wiederholung. Entwerfen, validieren, Fehler speichern, mit Bewusstsein neu entwerfen, erneut validieren.

Der Validator ist kalibriert, nicht allwissend. Kleine Modelle haben strukturelle Grenzen. Das Designprinzip sind lesbare, verwerfbare Hinweise — nicht null Fehlalarme. Transparenz über Einschränkungen ist selbst ein Qualitätssignal.

Multi-Modell-Architektur: das richtige Modell für jede Aufgabe

Kitsuno verwendet nicht ein Modell für alles. Verschiedene Aufgaben haben verschiedene Anforderungen — Geschwindigkeit, Genauigkeit, Kreativität, Kosten — und verschiedene Modelle bedienen sie am besten.

Scoring und Extraktion nutzen Modelle, die für strukturierte JSON-Ausgabe optimiert sind. Die Aufgabe ist Klassifikation: Gegeben diese Stelle und diese Karriere, liefere eine strukturierte Bewertung. Kleinere, schnellere Modelle bewältigen das zuverlässig, weil das Ausgabeformat eingeschränkt ist.

Schreiben nutzt größere Modelle, die für natürliche Sprachgenerierung optimiert sind. Anschreiben und berufliche Zusammenfassungen erfordern Nuancen, Stimmkonsistenz und die Fähigkeit, Nachweise zu überzeugenden Erzählungen zu verdichten. Zahlende Accounts erhalten für diese Aufgabe Premium-Modelle, weil der Qualitätsunterschied sichtbar ist.

Validierung nutzt schnelle, leichte Modelle. Die Aufgabe ist binäre Klassifikation (bestanden/nicht bestanden) bei spezifischen Prüfungen. Geschwindigkeit zählt, weil die Validierung nach jedem Entwurf läuft.

Concierge-Chat nutzt Modelle, die für Gesprächsqualität und Kontexttiefe ausbalanciert sind. Zahlende Accounts erhalten tiefere Kontextfenster und leistungsfähigere Modelle, aber die Persönlichkeit und Stimme bleiben über alle Stufen identisch.

EU-First-Routing. Personenbezogene Daten zahlender Accounts werden im Normalbetrieb ausschließlich über EU-basierte KI-Anbieter geroutet. Das ist keine Marketingaussage — es ist eine Architekturvorgabe, die in der Routing-Schicht erzwungen wird. Die konkreten Anbieter, Modelle und Fallback-Ketten sind dokumentiert, getestet und überwacht.

Free-Tier-Kaskade. Kostenlose Accounts erhalten die gleiche Bewertungsqualität über eine Kaskade von Free-Tier-Anbietern. Wenn ein Anbieter ausfällt, springt das System zum nächsten. Die Bewertungskriterien, Gewichtungen und Evaluationsmaßstäbe sind identisch — was sich ändert, ist der Anbieter, nicht die Methodik.

Das Brain: deterministische Intelligenz

Nicht alles erfordert ein LLM. Kitsunos Brain ist eine reine SQL- und Python-Diagnose-Engine, die 21 Regeln gegen die vorhandenen Daten prüft — null KI-Kosten, null Halluzinationsrisiko.

Das Brain prüft Dinge wie: Bibliotheksvollständigkeit (wie viele Fähigkeiten haben belastbare Nachweise), Pipeline-Gesundheit (Verhältnis Bewerbungen zu Rückmeldungen), Quelleneffektivität (welche Quellen starke Treffer liefern), Profilkonfigurationsqualität (fehlende Gewichtungen, leere Keyword-Listen) und Bereitschaftssignale (ist das Profil bereit für eine sinnvolle Jobsuche).

Das Brain generiert für jedes Profil ein Wissensdokument, das in den Concierge-Chat-Kontext einfließt. Wenn Kitso etwas Konkretes über eine Karriere sagt, spricht oft das Brain: deterministische Beobachtungen aus echten Daten, keine LLM-Spekulation.

Was überprüfbar ist

Jede Stufe der Pipeline erzeugt inspizierbaren Output.

Der Scorer zeigt seine Aufschlüsselung nach vier Kriterien, die wichtigsten Übereinstimmungen und Lücken für jede Stelle. Der Writer erzeugt Dokumente, die vor dem Versand geprüft werden. Der Validator zeigt seine Prüfergebnisse als Qualitätshinweise — grün, gelb oder rot — mit konkreten Beschreibungen. Die Diagnostik des Brain fließt in Kitsos Beobachtungen ein, die konkrete Stellen, Bewertungen und Fähigkeiten benennen.

Die Pipeline ist keine Blackbox mit einer Zahl am Ende. Sie ist eine Abfolge transparenter Schritte, jeder mit sichtbaren Eingaben und Ausgaben, bei denen der Mensch entscheidet, was als Nächstes passiert.

Das Open-Source-Verzeichnis europäischer Jobquellen auf GitHub entdecken →

Für die Prinzipien hinter diesen technischen Entscheidungen: Warum es Kitsuno gibt lesen. Für aktuelle Marktdaten aus dieser Pipeline: Market Pulse besuchen.