Autor: Firma SHI

JSF Legacy Applikationen ablösen

JSF Legacy Applikationen ablösen

JSF (JavaServer Faces) war Anfang der 2000er-Jahre eine führende Technologie für die Entwicklung von Webanwendungen in Java. Auch heutzutage noch bauen Businesssoftware und Web-Applikationen vieler Unternehmen auf JSF.

Doch im Vergleich zu JSF zeichnen sich moderne Technologien wie Angular oder React mittlerweile durch wesentlich bessere Skalierbarkeit, Flexibilität und Performance sowie deutlich höhere Effizienz bei der Entwicklung aus. Schleppende oder fehlende Updates von Legacy-Komponenten können zudem zu Sicherheitsproblemen in der Zukunft führen.

Deswegen sollten Legacy-Technologien wie JSF möglichst durch modernere Frameworks wie z. B. React oder Angular ersetzt werden. Nur so lässt sich die Effizienz und Wettbewerbsfähigkeit eines Unternehmens langfristig sicherstellen. In unserem Whitepaper erfahren Sie genau, warum Sie JSF ablösen sollten und wie genau diese Ablösung idealerweise angegangen werden sollte.

Im folgenden Whitepaper finden Sie eine detaillierte Darstellung des nachstehenden Inhalts:

* Was ist JSF?

* Was bedeutet „Legacy Code“?

* Warum JSF ablösen?

* Wodurch sollte JSF abgelöst werden?

* Modernisierung ihrer JSF Applikationen

* Was ist die beste Lösung für die Ablösung ihrer JSF Anwendungen?

Hier geht’s zum Download:

Whitepaper JSF Ablöse

Über den Autor – Martin Rödig ist Entwicklungsleiter bei SHI

Nach seinem Masterstudium begann er 2006 bei der SHI GmbH und entwickelt und konzipiert seit dem die InfoPilot Plattform sowie kundenspezifische Webportale. Als Entwicklungsleiter ist er immer mit aktuellen Technologien und den gängigen Frameworks vertraut. Dies ermöglicht es ihm für den jeweiligen Anwendungsfall die passenden Frameworks zu finden. Besonders komplexe Systeme bei denen verschiedenste Produkte und Technologien zusammengebracht werden müssen, sind eine gern gesehene Herausforderung. NoSQL Datenbanken wie Solr (Search) oder Redis (Key-Value) gehören dabei zum täglichen Handwerkszeug.

Über die SHI GmbH

Seit über 30 Jahren ist die SHI GmbH mit Sitz in Augsburg ein etabliertes IT-Beratungs- und Softwarehaus, das passgenaue Lösungen für unterschiedlichste Branchen entwickelt. Als langjähriger Partner führender Technologieanbieter wie Cloudera, Elastic, Lucidworks, Apache Solr und OpenSearch bieten wir umfassende Expertise in der Implementierung innovativer und skalierbarer Such- und Analyseplattformen sowie effizienter Datenverarbeitungslösungen.

Unser Leistungsspektrum reicht von der strategischen Beratung über Migration und Integration bis zur individuellen Anpassung und kontinuierlichen Optimierung. Im Bereich der Individualentwicklung realisieren wir flexible Web-Applikationen, Schnittstellen und E-Commerce-Lösungen mit Fokus auf Langlebigkeit. Für Fachverlage haben wir die modulare Publikationsplattform InfoPilot entwickelt, die auf Open-Source-Basis eine effiziente Online-Vermarktung von Fachinhalten ermöglicht. SHI steht für ganzheitliche Betreuung, langfristige Partnerschaften und Wissensaustausch durch Workshops und Schulungen. Mit unserem engagierten Team in Augsburg sind wir Ihr zuverlässiger Partner für die digitale Transformation.

Adresse: SHI GmbH, Konrad-Adenauer-Allee 15, 86150 Augsburg Deutschland
Telefon: +49 821 – 74 82 633 0
E-Mail: info@shi-gmbh.com
Websiten: https://www.shi-gmbh.com, https://shi-softwareentwicklung.de, https://infopilot.de

Firmenkontakt und Herausgeber der Meldung:

SHI GmbH
Konrad-Adenauer-Allee 15
86150 Augsburg
Telefon: +49 (821) 7482633-0
Telefax: +49 (821) 7482633-29
http://www.shi-gmbh.com

Ansprechpartner:
Michael Anger
Head of Sales
E-Mail: michael.anger@shi-gmbh.com
Für die oben stehende Story ist allein der jeweils angegebene Herausgeber (siehe Firmenkontakt oben) verantwortlich. Dieser ist in der Regel auch Urheber des Pressetextes, sowie der angehängten Bild-, Ton-, Video-, Medien- und Informationsmaterialien. Die United News Network GmbH übernimmt keine Haftung für die Korrektheit oder Vollständigkeit der dargestellten Meldung. Auch bei Übertragungsfehlern oder anderen Störungen haftet sie nur im Fall von Vorsatz oder grober Fahrlässigkeit. Die Nutzung von hier archivierten Informationen zur Eigeninformation und redaktionellen Weiterverarbeitung ist in der Regel kostenfrei. Bitte klären Sie vor einer Weiterverwendung urheberrechtliche Fragen mit dem angegebenen Herausgeber. Eine systematische Speicherung dieser Daten sowie die Verwendung auch von Teilen dieses Datenbankwerks sind nur mit schriftlicher Genehmigung durch die United News Network GmbH gestattet.

counterpixel

Kostenloses Whitepaper OpenSearch

Kostenloses Whitepaper OpenSearch

Entdecken Sie die leistungsstarken Möglichkeiten von OpenSearch für Enterprise Search und Data Analytics! Dieses Whitepaper bietet einen tiefen Einblick in die Open-Source-Software, die speziell für Organisationen entwickelt wurde, um die Suche und Analyse von Daten aus verschiedenen internen Quellen zu optimieren.

Erfahren Sie, wie OpenSearch mit fortschrittlichen Funktionen wie Machine Learning, Datenintegration und Dashboards die Fragmentierung von Unternehmensdaten überwindet und effiziente Suchergebnisse liefert. Tauchen Sie ein in die Welt der Datenvisualisierung und lassen Sie sich von den umfassenden Sicherheits- und Compliance-Möglichkeiten überzeugen.

Im folgenden Whitepaper finden Sie eine detaillierte Darstellung des nachstehenden Inhalts:

1. Einleitung

2. OpenSearch als Enterprise Search Lösung

3. Datenintegration

4. OpenSearch Data Prepper

5. OpenSearch Dashboards

6. Machine Learning

7. Sicherheit und Compliance

8. Community und Support

Zum Download:

Whitepaper OpenSearch

Arsal Jalib ist Senior Consultant Search & Analytics bei SHI

Arsal Jalib hat seinen Master in Informatik an der TU Berlin mit seiner Abschlussarbeit zum Thema „Deep Learning“ abgeschlossen. Er war mehrere Jahre als Softwarequalitätsbeauftragter und Softwareentwickler tätig. Derzeit interessiert er sich eher für Such- und Analysethemen und liebt es, neue Dinge zu lernen. Seit April 2022 ist er Mitglied des Search & Analytics Teams bei der SHI GmbH.

Über die SHI GmbH

Seit über 30 Jahren ist die SHI GmbH mit Sitz in Augsburg ein etabliertes IT-Beratungs- und Softwarehaus, das passgenaue Lösungen für unterschiedlichste Branchen entwickelt. Als langjähriger Partner führender Technologieanbieter wie Cloudera, Elastic, Lucidworks, Apache Solr und OpenSearch bieten wir umfassende Expertise in der Implementierung innovativer und skalierbarer Such- und Analyseplattformen sowie effizienter Datenverarbeitungslösungen.

Unser Leistungsspektrum reicht von der strategischen Beratung über Migration und Integration bis zur individuellen Anpassung und kontinuierlichen Optimierung. Im Bereich der Individualentwicklung realisieren wir flexible Web-Applikationen, Schnittstellen und E-Commerce-Lösungen mit Fokus auf Langlebigkeit. Für Fachverlage haben wir die modulare Publikationsplattform InfoPilot entwickelt, die auf Open-Source-Basis eine effiziente Online-Vermarktung von Fachinhalten ermöglicht. SHI steht für ganzheitliche Betreuung, langfristige Partnerschaften und Wissensaustausch durch Workshops und Schulungen. Mit unserem engagierten Team in Augsburg sind wir Ihr zuverlässiger Partner für die digitale Transformation.

Firmenkontakt und Herausgeber der Meldung:

SHI GmbH
Konrad-Adenauer-Allee 15
86150 Augsburg
Telefon: +49 (821) 7482633-0
Telefax: +49 (821) 7482633-29
http://www.shi-gmbh.com

Ansprechpartner:
Dipl.-Ing.(FH) Michael Anger
Head of Sales
E-Mail: michael.anger@shi-gmbh.com
Für die oben stehende Story ist allein der jeweils angegebene Herausgeber (siehe Firmenkontakt oben) verantwortlich. Dieser ist in der Regel auch Urheber des Pressetextes, sowie der angehängten Bild-, Ton-, Video-, Medien- und Informationsmaterialien. Die United News Network GmbH übernimmt keine Haftung für die Korrektheit oder Vollständigkeit der dargestellten Meldung. Auch bei Übertragungsfehlern oder anderen Störungen haftet sie nur im Fall von Vorsatz oder grober Fahrlässigkeit. Die Nutzung von hier archivierten Informationen zur Eigeninformation und redaktionellen Weiterverarbeitung ist in der Regel kostenfrei. Bitte klären Sie vor einer Weiterverwendung urheberrechtliche Fragen mit dem angegebenen Herausgeber. Eine systematische Speicherung dieser Daten sowie die Verwendung auch von Teilen dieses Datenbankwerks sind nur mit schriftlicher Genehmigung durch die United News Network GmbH gestattet.

counterpixel

Mehrwert für RWS-Verlage und deren Kunden durch den Einsatz von Info-Pilot

Mehrwert für RWS-Verlage und deren Kunden durch den Einsatz von Info-Pilot

In einer Zeit, in der immer mehr Inhalte schnell und automatisiert durch KI entstehen, brauchen Verlage eine ausgewogene Mischung aus klassisch erarbeiteten und schnell produzierten Inhalten, um ihre Zielgruppen nachhaltig zu binden. Diese beiden Ansätze stehen nicht im Widerspruch – sie ergänzen sich und stärken gemeinsam das publizistische Angebot, erläutert Arkadius Nowakowski im folgenden Interview: „Durch den Einsatz moderner Retrievaltechnologien können RWS-Verlage ihren Nutzern erheblichen Mehrwert bieten, der über die bloße Bereitstellung digitaler Inhalte hinausgeht.“

RWS-Verlage bieten schon lange digitale Inhalte in Datenbanken an. Welchen Mehrwert können diese Verlage ihren Nutzern durch den Einsatz moderner Retrievaltechnologien bieten?

Durch den Einsatz moderner Retrievaltechnologien können RWS-Verlage ihren Nutzern erheblichen Mehrwert bieten, der über die bloße Bereitstellung digitaler Inhalte hinausgeht. Eine intelligente Suche, die spezifisch auf juristische Bedürfnisse zugeschnitten ist, ermöglicht eine effiziente Erkennung von Paragraphen und Aktenzeichen. Benutzer von juristischen Portalen geben innerhalb der Suchmaske unterschiedliche Konstellationen aus Gesetzeskürzeln – wie GG, BGB oder EStG – zusammen mit Paragraphen- und Artikelnummern ein. Dabei hängt die Zusammensetzung der Suchphrase von persönlichen Gewohnheiten ab, was dem Suchsystem eine hohe Flexibilität bei gleichzeitiger Gewährleistung einer schnellen Antwortzeit abverlangt. Die Infopilot-Suche implementiert eine Erweiterung der Standard-Solr-Suche. Hierbei können Paragraphen und Aktenzeichen gefunden werden, welche die integrierte Solr-Seach-Engine von Haus aus nicht finden kann. Zeitglich wird die Suchdauer um 30% bis 50% reduziert. Bei einem perfekten Treffer wird der gesuchte Paragraph bzw. Artikel, nahezu unmittelbar nach der Sucheingabe, im InfoPilot-Lesebereich angezeigt. Beispielsweise führt die Eingabe einer der Sucheingaben “Art. 3 Abs 2 ESTG”, “3 ESTG” oder “ESTG § 3” zum sofortigen Öffnen von Paragraph 3 im Gesetz ESTG. Dies beschleunigt den Rechercheprozess erheblich und sorgt dafür, dass Nutzer schnell und präzise die benötigten Informationen finden.

Darüber hinaus profitieren Endnutzer wie Anwälte und Richter von angereicherten Inhalten, beispielsweise durch Passivzitierung. Durch die Passivzitierung kann man alle Inhalte, welche auf das aktuelle Dokument verweisen, auflisten und auch Kategorisieren, zum Beispiel nach Dokumenttypen wie Zeitschriften, Bücher, Onlineartikel usw. Dies hilft dem Benutzer weiter hilfreiche Dokumente schnell zum aktuell recherchierten Thema zu finden.

Durch Anbindung verschiedener Quellen kann nicht nur klassischer Verlagscontent (Bücher/Zeitschriften ) integriert werden sondern auch Inhalte aus Online-CMS-Systemen, News-Feeds oder beliebigen REST-Schnittstellen. Damit greift der Kunde immer auf aktuelle Informationen aus allen dem Verlag zugänglichen Inhalten zu.

Ein weiterer bedeutender Vorteil ist die Bereitstellung von Schnittstellen für den Buchhandel. Hierbei wird eine nahtlose Integration und Verfügbarkeit von Inhalten über zusätzliche Kanäle außerhalb der Verlagsportale ermöglicht, die den Zugang und die Distribution von Verlagsinhalten erheblich erleichtert. Buchhandelsplattformen erhalten einen gesicherten Zugriff auf die Verlagsinhalte und können über das eigene Shopsystem Verkäufe mit den eigenen Endkunden abwickeln. Hierbei müssen Endkundenaccounts, mit dem der Buchhandel arbeitet, nicht explizit auf der InfoPilot-Plattform angelegt werden, was den Verwaltungsaufwand für den Verlag minimiert.

Schließlich bietet die Integration von personalisierten Chatbots über ein RAG-System mit selbst gehorstetem LLM den Endnutzern eine interaktive und maßgeschneiderte Unterstützung Chatbots können juristische Fachfragen kontextualisiert beantworten, komplexe Sachverhalte zusammenfassen und als intelligente Assistenten den Rechtsanwender bei seiner täglichen Arbeit unterstützen – immer auf Basis der qualitätsgesicherten Verlagsinhalte und unter Wahrung höchster Datenschutzstandards. Das Verhalten des Chatbots wird einmalig eingerichtet. Durch vom Verlag gelieferten Testdaten wird das Chatbot-Verhaltens für den Umgang mit den Verlagsdaten optimiert. Nach dieser initialen Konfigurationsphase kann der Verlag seine Werke neu Produzieren wobei der Chatbot automatisiert mit den aktualisierten Werksdaten gespeist wird.

Die automatisierte Anreicherung der Inhalte führt dazu, dass juristische Fachinformationen umfassender, zugänglicher und nützlicher werden, indem sie in einen größeren Kontext gestellt und mit zusätzlichen Werkzeugen zur effizienten Nutzung ausgestattet werden.

Die zentrale Herausforderung für diesen Mehrwert liegt in der Anreicherung der Inhalte. Was genau bedeutet Anreicherung in Bezug auf juristische Fachinhalte?
Die Anreicherung von juristischen Fachinhalten bezieht sich auf die systematische Erweiterung der bestehenden redaktionellen Daten durch automatisierte Prozesse. Ein zentraler Aspekt dabei ist die automatisierte Linkerkennung und das damit verbundene Importieren aus externen Quellen. In der Praxis werden während der Datenaufbereitung der Volltexte, Referenzen auf aus anderen Quellen verfügbare Rechtstexte erkannt. Referenzierte Rechtstexte werden daraufhin vollautomatisiert importiert und auf der Verlagsplattform dem Endkunden zugänglich gemacht. Die Referenzen im Volltext müssen hierbei nicht als explizite Links vorliegen. Für den Verlag genügt es, ein Gesetz mit Paragraphen oder Artikeln im Volltext zu erwähnen – der InfoPilot Workflow übernimmt den Rest. Natürlich ist auch eine vereinfachte Variante implementiert, bei der Fachvokabular, Themengebiete/Kategorien erkannt und automatisch verlinkt werden.

Verlagskunden haben hierdurch zwei Vorteile. Der referenzierte Volltext kann direkt innerhalb der Verlagsplattform in einer parallelen Ansicht gelesen werden. Das Feature “paralleles Lesen” zeigt im Splitscreen den Verlagscontent und den importierten Rechtstext nebeneinander an. Der Anwender ist somit in der Lage einfach den Überblick zu behalten. Zusätzlich greifen unterstützend für importierte Rechtstexte Standard-Features wie die Volltextsuche, Lesezeichen und der Textmarker. Letzterer ermöglicht das Erstellen von persönlichen Notizen, die bei Bedarf auch mit den Mitarbeitern des Endkunden geteilt werden können. Nicht nur Endkunden ziehen einen Nutzen aus dem automatisierten Import von verlinkten externen Quellen. Autoren können sich dank dieser Automatisierung auf ihre Kernkompetenz konzentrieren: die Erstellung qualitativ hochwertiger Fachinhalte, ohne hierbei manuell Links einfügen zu müssen.

Insgesamt führt die automatisierte Anreicherung der Inhalte dazu, dass juristische Fachinformationen umfassender, zugänglicher und nützlicher werden, indem sie in einen größeren Kontext gestellt und mit zusätzlichen Werkzeugen zur effizienten Nutzung ausgestattet werden.

Zusammengefasst bietet die InfoPilot-Plattform eine umfassende Automatisierung der Datenverarbeitung, die es Verlagen ermöglicht, ihre Inhalte aufwandsneutral zu importieren und den Nutzern eine verbesserte Suchfunktion zu bieten.

Was genau leistet die InfoPilot-Plattform in Bezug auf Automatisierung dieser Prozesse?
Die InfoPilot-Plattform spielt eine entscheidende Rolle bei der Automatisierung der Prozesse zur Anreicherung juristischer Fachinhalte. Ein wesentlicher Bestandteil ist die effiziente Datenmigration, die durch Push-Technologien aus externen Systemen ermöglicht wird. Dadurch können Daten schnell und zuverlässig in das System integriert werden. Durch Erweiterungen in Drupal oder WordPress ist es auch möglich, innerhalb des CMS direkt auf den gesamten Verlagscontent zu verlinken, selbst wenn der Verlinkte Content aus einem ganz anderen System stammt.  Importierte Daten werden vom InfoPilot Workflow in HTML konvertiert. Dies stellt sicher, dass die Inhalte auf verschiedenen Endgeräten und Plattformen optimal dargestellt werden können. Nach der Umwandlung werden alle Daten in einem speziellen Verlagsschema indexiert, was eine strukturierte und zielgerichtete Suche innerhalb der Plattform ermöglicht.

Ein weiterer Schlüsselprozess ist das Chunking und die anschließende Vektorisierung Daten. Diese Verfahren sorgen dafür, dass die Inhalte in kleinere, verwertbare Einheiten zerlegt und in einem Format gespeichert werden, das eine semantische Suche ermöglicht. Dadurch können Nutzer über einen Chatbot noch präzisere Suchergebnisse erzielen und Inhalte kontextbezogen erschließen.

Zusammengefasst bietet die InfoPilot-Plattform eine umfassende Automatisierung der Datenverarbeitung, die es Verlagen ermöglicht, ihre Inhalte aufwandsneutral zu importieren und den Nutzern eine verbesserte Suchfunktion zu bieten.

Welche konkreten Erfahrungen aus Kundenprojekten habt ihr bei der Einführung und betrieb des InfoPilot gemacht?
Bei der Einführung und dem Betrieb der InfoPilot-Plattform haben wir wertvolle Erfahrungen aus unseren Kundenprojekten gesammelt, die zeigen, wie effektiv die Plattform im Verlagswesen eingesetzt werden kann. In erster Linie ist es von Vorteil, wenn der Verlag bereits mit einer einheitlichen XML-Struktur für seine Daten arbeitet. Diese Standardisierung ermöglicht eine konsistente Datenverarbeitung und erleichtert die Integration in den InfoPilot Workflow, so dass der Kunde selbstständig weitere Werke hinzufügen kann.

Ein weiterer wichtiger Aspekt ist die flexible Nutzung der Inhalte. Statt sich auf ein einzelnes Produkt wie ein Buch zu beschränken, können die Inhalte jetzt in zahlreichen Produkten verwendet werden. Dies maximiert den Wert der vorhandenen Daten und ermöglicht eine vielseitige Anwendung in verschiedenen Applikationen und Kontexten.

Zusätzlich haben wir festgestellt, dass die traditionelle, statische Inhaltsverzeichnisstruktur (TOC) immer mehr durch dynamisch generierte TOCs ersetzt wird, die auf Metadaten basieren. Diese Facetten-TOCs bieten den Nutzern eine individuell zugeschnittene Navigation und erleichtern das Auffinden relevanter Informationen.

Ein besonders beeindruckender Vorteil ist die gesteigerte Effizienz in der Content-Produktion. Dank der InfoPilot-Plattform können Inhalte viel schneller produziert und live geschaltet werden. Dies ist besonders bei aktuellen News von Vorteil, die innerhalb weniger Minuten live verfügbar sein müssen, um den hohen Ansprüchen moderner Nutzer gerecht zu werden. Der Verlag kann hierbei News über ein integriertes CMS bequem, schnell und sicher erstellen.

Insgesamt haben diese Erfahrungen gezeigt, dass die InfoPilot-Plattform nicht nur die Arbeitsabläufe optimiert, sondern auch den Nutzern einen erheblichen Mehrwert bietet, indem sie Flexibilität, Geschwindigkeit und Benutzerfreundlichkeit vereint.

Das Fachlektorat wird weiterhin benötigt. Rechtlich relevante Texte, die neu erstellt werden, sollten, egal wie diese entstehen, immer noch einmal fachlich auf Korrektheit geprüft werden.

Lässt sich alles automatisieren? Oder anders gefragt: Für welche Aufgaben wird das Know-how eines Fachlektorats benötigt?
Das Fachlektorat wird weiterhin benötigt. Rechtlich relevante Texte, die neu erstellt werden, sollten, egal wie diese entstehen, immer noch einmal fachlich auf Korrektheit geprüft werden. Dies gilt insbesondere, wenn Artikel mit Hilfe von KI erstellt werden. Vom Gericht veröffentlichte Entscheide oder von Regierungen veröffentlichte Texte können aber direkt übernommen werden, da diese von der bereitstellenden Instanz geprüft wurden und mit der Veröffentlichung gültig sind.

Euer Vortrag trägt auf dem CrossMediaForum trägt den „Automatisierter XML-Workflow für Verlage: Unterstützung in der Verarbeitung, Erweiterung, Erschließung und On-Demand Distribution juristischer Inhalte“. Was wird die Hauptbotschaft sein?
In einer Zeit, in der immer mehr Inhalte schnell und automatisiert durch KI entstehen, brauchen Verlage eine ausgewogene Mischung aus klassisch erarbeiteten und schnell produzierten Inhalten, um ihre Zielgruppen nachhaltig zu binden. Diese beiden Ansätze stehen nicht im Widerspruch – sie ergänzen sich und stärken gemeinsam das publizistische Angebot.

Arkadius Nowakowski arbeitet bei SHI und ist Referent auf dem CrossMediaForum.

https://heinoldandfriends.de/2025/05/30/mehrwert-fuer-rws-verlage-und-deren-kunden-durch-den-einsatz-von-infopilot/

 

Über die SHI GmbH

Seit über 30 Jahren ist die SHI GmbH mit Sitz in Augsburg ein etabliertes IT-Beratungs- und Softwarehaus, das passgenaue Lösungen für unterschiedlichste Branchen entwickelt. Als langjähriger Partner führender Technologieanbieter wie Cloudera, Elastic, Lucidworks, Apache Solr und OpenSearch bieten wir umfassende Expertise in der Implementierung innovativer und skalierbarer Such- und Analyseplattformen sowie effizienter Datenverarbeitungslösungen.

Unser Leistungsspektrum reicht von der strategischen Beratung über Migration und Integration bis zur individuellen Anpassung und kontinuierlichen Optimierung. Im Bereich der Individualentwicklung realisieren wir flexible Web-Applikationen, Schnittstellen und E-Commerce-Lösungen mit Fokus auf Langlebigkeit. Für Fachverlage haben wir die modulare Publikationsplattform InfoPilot entwickelt, die auf Open-Source-Basis eine effiziente Online-Vermarktung von Fachinhalten ermöglicht. SHI steht für ganzheitliche Betreuung, langfristige Partnerschaften und Wissensaustausch durch Workshops und Schulungen. Mit unserem engagierten Team in Augsburg sind wir Ihr zuverlässiger Partner für die digitale Transformation.

Adresse: SHI GmbH, Konrad-Adenauer-Allee 15, 86150 Augsburg Deutschland
Telefon: +49 821 – 74 82 633 0
E-Mail: info@shi-gmbh.com
Websiten: https://www.shi-gmbh.com, https://shi-softwareentwicklung.de, https://infopilot.de

Firmenkontakt und Herausgeber der Meldung:

SHI GmbH
Konrad-Adenauer-Allee 15
86150 Augsburg
Telefon: +49 (821) 7482633-0
Telefax: +49 (821) 7482633-29
http://www.shi-gmbh.com

Ansprechpartner:
Dipl.-Ing.(FH) Michael Anger
Head of Sales
E-Mail: michael.anger@shi-gmbh.com
Für die oben stehende Story ist allein der jeweils angegebene Herausgeber (siehe Firmenkontakt oben) verantwortlich. Dieser ist in der Regel auch Urheber des Pressetextes, sowie der angehängten Bild-, Ton-, Video-, Medien- und Informationsmaterialien. Die United News Network GmbH übernimmt keine Haftung für die Korrektheit oder Vollständigkeit der dargestellten Meldung. Auch bei Übertragungsfehlern oder anderen Störungen haftet sie nur im Fall von Vorsatz oder grober Fahrlässigkeit. Die Nutzung von hier archivierten Informationen zur Eigeninformation und redaktionellen Weiterverarbeitung ist in der Regel kostenfrei. Bitte klären Sie vor einer Weiterverwendung urheberrechtliche Fragen mit dem angegebenen Herausgeber. Eine systematische Speicherung dieser Daten sowie die Verwendung auch von Teilen dieses Datenbankwerks sind nur mit schriftlicher Genehmigung durch die United News Network GmbH gestattet.

counterpixel

Mehr Relevanz durch Ähnlichkeit

Mehr Relevanz durch Ähnlichkeit

In der heutigen datengetriebenen Welt sind Relevanz und Personalisierung entscheidende Erfolgsfaktoren für digitale Anwendungen. Egal ob in E-Commerce, Medienportalen oder unternehmensinternen Wissensdatenbanken – Nutzer:innen erwarten Vorschläge, die wirklich passen. Genau hier kommt das Feature MoreLikeThis (MLT) von Apache Solr ins Spiel.

Was ist "MoreLikeThis"?

MoreLikeThis (kurz: MLT) ist eine leistungsstarke Funktion in Apache Solr, die es ermöglicht, dokumentenähnliche Inhalte anhand ihrer Textmerkmale zu finden. Dabei werden – ähnlich wie bei modernen Empfehlungssystemen – semantisch relevante Dokumente ermittelt, die inhaltlich dem Ausgangsdokument ähneln.

Die Idee:

MLT analysiert das Vorkommen und die Gewichtung bestimmter Terme (z. B. Wörter in Titel oder Beschreibung) und verwendet diese Informationen, um verwandte Inhalte zu identifizieren – ganz ohne explizite Tags oder strukturierte Metadaten.

Wie funktioniert MLT in Solr?

MLT basiert auf Termfrequenzanalyse und verwendet Metriken wie TF-IDF (Term Frequency – Inverse Document Frequency), um relevante Schlüsselbegriffe aus einem Referenzdokument zu extrahieren. Anschließend wird eine Abfrage aus diesen Begriffen generiert, um ähnliche Dokumente zu identifizieren.

Wichtige Parameter dabei sind:

  • mlt.fl – die Felder, auf denen die Ähnlichkeitsanalyse basiert (z. B. Titel, Beschreibung, Inhalt).
  • mlt.mindf – minimale Dokumentfrequenz eines Begriffs.
  • mlt.mintf – minimale Termfrequenz im Quelltext.
  • mlt.count – Anzahl der zurückgegebenen ähnlichen Dokumente.

Beispiel-Request:

/solr/collection/select?q=id:123&mlt=true&mlt.fl=title,description&mlt.count=5

Use Cases in der Praxis

1. Produktempfehlungen im E-Commerce Kund:innen sehen ein Produkt – Solr schlägt automatisch ähnliche Artikel vor, basierend auf Titel, Beschreibung und Kategorie.

2. Ähnliche Artikel in Newsportalen Unter jedem Artikel erscheinen relevante Beiträge, die thematisch nahe liegen, ohne dass Redaktionen manuell kuratieren müssen.

3. Kontextuelle Wissensvorschläge in Intranets Mitarbeiter:innen finden auf Basis eines angezeigten Dokuments ähnliche Inhalte, was die Navigation durch komplexe Wissensdatenbanken erleichtert.

4. Duplicate Detection & Clustering MLT kann auch verwendet werden, um Duplikate (Plagiate) oder stark überlappende Inhalte zu identifizieren.

Vorteile von MoreLikeThis

Vollständig integriert in Solr – kein externer Recommender notwendig

Flexibel konfigurierbar durch zahlreiche Parameter

Skalierbar für große Datenmengen

Sofort einsatzbereit mit bestehender Indexstruktur

Domänenunabhängig – funktioniert für Produkte, Artikel, Bücher, juristische Texte u.v.m.

Grenzen & Tipps

Obwohl MLT mächtig ist, gibt es auch Grenzen:

  • Es arbeitet statistisch, nicht semantisch – Begriffe müssen tatsächlich im Text vorkommen.
  • Mehrsprachigkeit kann problematisch sein, wenn nicht ausreichend normalisiert wurde.
  • Ergebnisse können verfälscht werden, wenn Felder zu „rauschig“ oder zu generisch sind.

Pro-Tipp: Eine Kombination mit Textanalyse, Stopword-Listen und Custom Tokenization kann die Qualität der Empfehlungen deutlich steigern.

Fazit

MoreLikeThis ist ein unterschätztes Juwel in Apache Solr. Es liefert wertvolle Ergebnisse mit minimalem Konfigurationsaufwand und lässt sich hervorragend in bestehende Suchlösungen integrieren. Für Unternehmen, die ihre Inhalte intelligenter verknüpfen und personalisieren wollen, ist MLT ein sofort einsetzbarer Hebel – ganz ohne den Aufbau komplexer Recommendation Engines.

Auch auf LinkedIn

Mehr Relevanz durch Ähnlichkeit

 

Über die SHI GmbH

Seit über 30 Jahren ist die SHI GmbH mit Sitz in Augsburg ein etabliertes IT-Beratungs- und Softwarehaus, das passgenaue Lösungen für unterschiedlichste Branchen entwickelt. Als langjähriger Partner führender Technologieanbieter wie Cloudera, Elastic, Lucidworks, Apache Solr und OpenSearch bieten wir umfassende Expertise in der Implementierung innovativer und skalierbarer Such- und Analyseplattformen sowie effizienter Datenverarbeitungslösungen.

Unser Leistungsspektrum reicht von der strategischen Beratung über Migration und Integration bis zur individuellen Anpassung und kontinuierlichen Optimierung. Im Bereich der Individualentwicklung realisieren wir flexible Web-Applikationen, Schnittstellen und E-Commerce-Lösungen mit Fokus auf Langlebigkeit. Für Fachverlage haben wir die modulare Publikationsplattform InfoPilot entwickelt, die auf Open-Source-Basis eine effiziente Online-Vermarktung von Fachinhalten ermöglicht. SHI steht für ganzheitliche Betreuung, langfristige Partnerschaften und Wissensaustausch durch Workshops und Schulungen. Mit unserem engagierten Team in Augsburg sind wir Ihr zuverlässiger Partner für die digitale Transformation.

Adresse: SHI GmbH, Konrad-Adenauer-Allee 15, 86150 Augsburg Deutschland
Telefon: +49 821 – 74 82 633 0
E-Mail: info@shi-gmbh.com
Websiten: https://www.shi-gmbh.com, https://shi-softwareentwicklung.de, https://infopilot.de

Firmenkontakt und Herausgeber der Meldung:

SHI GmbH
Konrad-Adenauer-Allee 15
86150 Augsburg
Telefon: +49 (821) 7482633-0
Telefax: +49 (821) 7482633-29
http://www.shi-gmbh.com

Ansprechpartner:
Dipl.-Ing.(FH) Michael Anger
Head of Sales
E-Mail: michael.anger@shi-gmbh.com
Für die oben stehende Story ist allein der jeweils angegebene Herausgeber (siehe Firmenkontakt oben) verantwortlich. Dieser ist in der Regel auch Urheber des Pressetextes, sowie der angehängten Bild-, Ton-, Video-, Medien- und Informationsmaterialien. Die United News Network GmbH übernimmt keine Haftung für die Korrektheit oder Vollständigkeit der dargestellten Meldung. Auch bei Übertragungsfehlern oder anderen Störungen haftet sie nur im Fall von Vorsatz oder grober Fahrlässigkeit. Die Nutzung von hier archivierten Informationen zur Eigeninformation und redaktionellen Weiterverarbeitung ist in der Regel kostenfrei. Bitte klären Sie vor einer Weiterverwendung urheberrechtliche Fragen mit dem angegebenen Herausgeber. Eine systematische Speicherung dieser Daten sowie die Verwendung auch von Teilen dieses Datenbankwerks sind nur mit schriftlicher Genehmigung durch die United News Network GmbH gestattet.

counterpixel

Für die oben stehenden Pressemitteilungen, das angezeigte Event bzw. das Stellenangebot sowie für das angezeigte Bild- und Tonmaterial ist allein der jeweils angegebene Herausgeber verantwortlich. Dieser ist in der Regel auch Urheber der Pressetexte sowie der angehängten Bild-, Ton- und Informationsmaterialien. Die Nutzung von hier veröffentlichten Informationen zur Eigeninformation und redaktionellen Weiterverarbeitung ist in der Regel kostenfrei. Bitte klären Sie vor einer Weiterverwendung urheberrechtliche Fragen mit dem angegebenen Herausgeber.