Może zaistnieć sytuacja, że chcemy zindeksować jakieś repozytorium danych, po to by mieć możliwość pełnotekstowego wyszukiwania informacji. Jednak w tym repozytorium zgromadzone są dokumenty zapisane w różnych formatach, często w takich, z których bardzo rzadko, a nawet w ogóle nie korzystamy. Chcąc przyspieszyć proces indeksowania danych, oraz zawęzić późniejsze wyniki wyszukiwania tylko do dokumentów zapisanych w wybranych przez nas formatach danych należy stworzyć odpowiednie filtry.
 

Result Resource Filter jest filtrem, którego głównym zadaniem jest ograniczenie działania tzw. „crawler(ów)” wykorzystywanych w procesie indeksowania danych. Najczęściej wykorzystywanymi formatami danych w przedsiębiorstwach są dokumenty zapisane w popularnych formatach takich jak np.: *.doc, *.ppt, *.pdf, *.xls, *.html i praktycznie tylko te dokumenty są przez pracowników wykorzystywane. Jeżeli zatem nie istnieje potrzeba wyszukiwania informacji zapisanych w innych formatach danych, możemy skorzystać z wspomnianego powyżej filtra, by zawęzić wyniki wyszukiwania do tych formatów danych.

Procedura definiowania Result Resource Filter:

  1. Idź do System Administration -> System Configuration -> Knowledge Management -> Content Management -> Global Services -> Resource Filters -> Result Resource Filter.
  2. Wybierz New.Mamy tutaj 2 możliwości. Albo możemy podać formaty dokumentów, które chcemy aby zostały zindeksowane lub też możemy podać formaty dokumentów, których nie chcemy indeksować. Różnica jest taka, że w pierwszym przypadku zindeksowane zostaną dokumenty tylko określonego typu np.: *.doc, *.ppt, *.pdf, natomiast w drugim zostaną zindeksowane wszystkie dokumenty poza tymi, które wymieniliśmy jako te, które nie mają być brane pod uwagę np.: *.zip, *.xml itp.
  3. Wybierając pierwszą opcję z rozwijanego menu Item ID Mode wybierz include.
  4. W pole Item ID Patterns wpisz odpowiednie formaty danych (np. *.ppt, *.doc, *.pdf).
  5. Wybierając drugą opcję z rozwijanego menu Item ID Mode wybierz exclude.
  6. W pole Item ID Patterns wpisz odpowiednie formaty danych (np. *.zip, *.xml).
  7. Jeżeli chcesz aby crawler rozpoznawał duże i małe litery należy zaznaczyć opcję Case Sensitive.
  8. Wybierz  OK.
  9. Tworząc teraz nowy profil crawler(a) do wyboru będą stworzone powyżej filtry.
5. Wybierając drugą opcję z rozwijanego menu Item ID Mode wybierz exclude.
6. W pole Item ID Patterns wpisz odpowiednie formaty danych (np. *.zip, *.xml).5. Wybierając drugą opcję z rozwijanego menu Item ID Mode wybierz exclude.
6. W pole Item ID Patterns wpisz odpowiednie formaty danych (np. *.zip, *.xml).