Documentum’s neue Suche – xPlore
Nov 25, 2010 | by Lars Vornholt | 0 Comments

Die neue Volltext-Suche von Documentum heißt xPlore und ist dem Einem oder Anderen vielleicht unter DSS (Documentum Serach Service) bereits bekannt. xPlore ist seit dem 01.11.2010 mit der Version 1.0 verfügbar (Documentum6.5 SP2 oder neuer) und soll die bisherige Suche „FAST“ ablösen. FAST wird ab Ende 2011 nicht mehr in Documentum Umgebungen supported. Hier ein erster Eindruck von xPlore und einige Unterschiede zu FAST.

 

xPlore besteht aus zwei Komponenten: dem Index Agent und dem Index Service. Der Index Agent exportiert Daten und Dokumente nachdem diese geändert wurden und stellt sie dem Index Service zum Indizieren zur Verfügung. Der Index Service baut auf Lucene und EMC´s xDB auf. Lucene ist ein OpenSource Softwareprojekt von Apache und basiert auf einem Java Suchmaschinen-Framework, mit dem Text-Indizes erzeugt und durchsucht werden können.

 

EMC hat nach internen Tests folgende Ergebnisse bekannt gegeben:

  • 50% höheren Durchsatz bei Suchanfragen
  • 40% höherer Datendurchsatz beim Indizieren von Dokumenten
  • 9x Performancesteigerung bei „underpriviliged users“
  • Kosteneffiziente vertikale und horizontale Skalierbarkeit
  • Hohe Verfügbarkeit – xPlore unterstützt N+1 aktiv/passiv Instanzen im Cluster und aktiv/aktiv Instanzen mit shared data
  • Disaster recovery – xPlore unterstützt online Backup (hot backup)
  • Datenspeicher – xPlore unterstützt sowohl SAN als auch NAS
  • Virtualisierung – eine Installation auf eine VM wird unterstützt

 

xPlore – Die wesentlichen Unterschiede zu FAST

Änderungen bei xPlore:

  • alle Suchbegriffe werden mit „Und“ und nicht wie bei FAST mit „Oder“ verknüpft
  • Gruppen und ACL´s werden mit indiziert
  • es gibt keine Wildcards mehr
  • Wegfall einer Beschränkung der Ordnertiefe
  • Eigenständige Administrationsoberfläche

 

Die Teilworterkennung der Volltextsuche kann aktiviert werden, nach Aussagen von EMC wirkt sich dieses aber negativ auf die Performance aus und das mit dem Faktor 3. Durch die Indizierung der Berechtigungen mittels ACL und Gruppen werden die Suchergebnisse bereits auf dem Indexserver gefiltert und nicht erst auf dem Content Server. Dies führt zu einer deutlichen Verbesserung der Performance. Somit wird zum Beispiel nicht für jedes Dokument eine Zusammenfassung generiert. Jedoch bleibt bei diesem Verfahren ein kurzer Zeitrahmen, in dem Dokumente mit den veralteten Rechten indiziert sind. Dies kann dazu führen, das Nutzer Dokumente über die Suche finden auf denen Ihnen kurz zuvor die Berechtigung entzogen wurde.

   

xPlore – Administration

Documentum liefert für xPlore eine eigene Administrationskonsole aus. Dieser wird auf dem JBoss des Index Servers installiert und bietet eine Vielzahl an Möglichkeiten für die Überwachung und Administration.

 

abbildung-1_-xplore-administrator31

 

  Abbildung 1: xPlore Administrator

 

Mit dem Auditing des Index Servers können eine Vielzahl von Auswertungen gefahren werden. Zum Beispiel können die langsamsten/schnellsten Querys selektiert werden oder welcher User welche oder wie viele Suchanfragen gestellt hat.

Auch der Index Agent bringt ein Administrationsinterface mit, über das der Index Agent gestartet und gestoppt werden kann. Zusätzlich besteht die Möglichkeit über eine DQL-Query Dokumente oder Typen nachträglich zu indizieren.  Weiterhin bietet der Index Agent einen „reindex“ Modus, mit dem sich einfach den Index neu aufgebaut werden kann.

 

 

Mögliche Konfigurationen / Strategien

Mehrere Instanzen des Index Service können von einem oder mehreren Index Agents bedient werden. Somit wird die Last des Indizierens auf die Instanzen verteilt. Die Instanzen können auf verschiedener Hardware installiert werden und benötigen lediglich Zugriff auf die gemeinsam genutzten Daten.  

 

 

abbildung-2-xplore-aufbau2

Abbildung 2: xPlore Aufbau (xPlore-Deploymelt Guide)

Weiterhin besteht die Möglichkeit, mehrere Index Agents so zu konfigurieren, dass sie sich die zu indizierenden Daten teilen. Ein Index Agent verarbeitet die zu indizierenden Dokumente und der andere übernimmt nur die Indizierung der Typen „dm_acl“ und „dm_group“. Auf diese Weise ist sichergestellt, das auch beim Import einer großen Menge von Daten die Berechtigungen aktuell bleiben.

 

 

FAST durch xPlore ablösen

Für die Ablösung von FAST in einer Produktivumgebung durch xPlore bietet EMC ein Szenario zur „sanften“ Migration. Hierbei indiziert xPlore das Repository, während FAST normal weiter arbeitet und die Suchanfragen beantwortet. Sobald xPlore das komplette Repository indiziert hat, kann der aktive Wechsel von FAST zu xPlore vorgenommen werden. Mit diesem Dual Mode ist sichergestellt, dass die Suche auch während der Migration erreichbar bleibt.