Semantische Extraktion als pure Leidenschaft

Semantische Extraktion als pure Leidenschaft

Unsere Informatiker lieben die Herausforderung

Die semantische Extraktion ist kein Standardproblem in der Informatik, ganz im Gegenteil, sie zählt zu den komplexesten – und interessantesten! - Disziplinen, denen sich ein Informatiker heutzutage stellen kann.

source code

Gerade die für die Informationsextraktion aus freitextlichen Dokumenten notwendigen Verarbeitungsschritte bilden in Verbindung mit den dabei zum Einsatz kommenden Technologien eine Herausforderung, der mit alltäglichen Lösungsansätzen nicht beizukommen ist.

JoinVisions Codebase wächst täglich und schon heute umfasst die komplette Pipeline für die semantische Verarbeitung von Lebensläufen und Jobangeboten mehrere Millionen Zeilen Programmcode und Wissensbasis. Jede Optimierung und jede Qualitätsverbesserung erhöht auch die Komplexität, ganz zu schweigen von neuen Produktfeatures oder unterstützten Dokumenttypen.

Jede einzelne Bewerbung, jeder CV, durchläuft eine beachtliche Anzahl an Verarbeitungsschritten: Der mehrphasigen Vorfilterung, die sich um die ggf. notwendige Zerlegung und Klassifikation der Bewerbungsunterlagen widmet, folgt die Dokumentenkonversion in ein eigenes Metaformat. Ihr folgt die zweidimensionale Strukturanalyse und die eigentliche semantische Extraktion mit Hilfe mehrerer hundert sogenannter Tagger. Die Transformation der extrahierten Informationen in ein weiteres Zwischenformat durch den Information-Linker und nicht zuletzt die Berechnung zahlreicher Statistiken, das Rendering der Ausgabegrafiken und das Verpacken des Ergebnisses in XML stehen am Ende des Prozesses.

Nichtsdestotrotz dauert die Verarbeitung von Lebensläufen, ja ganzer Bewerbungsmappen über unsere Web-Services in der Regel nur wenige hundert Millisekunden - Tendenz gleichbleibend und sinkend. Um dies zu bewerkstelligen, ist ein hohes Maß an Optimierung und auch Disziplin in der Entwicklung notwendig. Würde nicht jede neue Funktion nach deren Implementierung eingehend auf ihre Laufzeit und ihren Memory-Bedarf hin untersucht werden, würde die Verarbeitung vermutlich bereits ein Vielfaches an Zeit benötigen, was dazu führte, dass ein einzelner Lebenslauf vielleicht länger als eine Minute auf seine Bearbeitung warten müsste. Ein absolutes No-Go!

Natürlich spielen uns auch die Fortschritte in der Hardwareentwicklung in die Hände, ja machen semantische Systeme überhaupt erst produktivtauglich, "Throw Hardware on it" alleine würde aber nicht den steigenden Anforderungen unserer Produkte genügen. Trotz kontinuierlicher Erweiterung unseres Verarbeitungsclusters und den zuvor genannten Optimierungen im Kleinen wird auch regelmäßig das Gesamtsystem einem sogenannten "Profiling" unterzogen, um etwaige Flaschenhälse und Schwachpunkte in der Gesamtperformance zu identifizieren und diese zu optimieren. Auch nach Jahren der Optimierungen und des Tunings gelingen uns noch ganz elementare Beschleunigungen, die sich wiederum auf fast alle Module auswirken - so können ein paar geschickt optimierte Codezeilen gleich einige Prozent Zeit in der Gesamtverarbeitung einsparen.

Unser Service liefert dadurch eine gleichbleibend hohe Performance trotz kontinuierlicher Verbesserungen und ermöglicht es unseren Kunden, die stetig steigende Anzahl an digitalen Bewerbungen ohne Verzögerungen mit höchster Qualität zu verarbeiten. Und wir als Entwickler dieser Systeme stehen immer wieder vor spannenden Herausforderungen und können uns regelmäßig über Etappensiege freuen - wohlwissend, dass immer noch was geht!


Kontakt

Unser Büro

Prinz-Eugen-Straße Nr. 70

1040 Wien

contact@joinvision.com

+43 (0)1 505 80 70

+43 (0)1 505 80 70 60

Schreiben Sie uns







JoinVision-Logo

JoinVision ist führender Anbieter mehrsprachiger semantischer Recruiting-Technologie. Mit CVlizer und JOBolizer werden Bewerberunterlagen bzw. Stellenanzeigen automatisch erfasst, analysiert und beschlagwortet. Die Applikation MatchPoint liefert einen automatischen One-Klick-Vergleich von Bewerberprofilen mit Job-Angeboten und umgekehrt. HRexplorer bietet zusätzlich auch den Zugriff auf externe Stellenanzeigen- und Bewerberdatenpools.

In Verbindung bleiben

Aktuelle Tweets