[phpBB Debug] PHP Warning: in file [ROOT]/ext/tas2580/seourls/event/listener.php on line 213: Undefined array key "FORUM_NAME"
REDAXO Forum • rex_search Artikel nicht indexiert
Seite 1 von 1

rex_search Artikel nicht indexiert

Verfasst: 30. Nov 2015, 11:10
von Phoebus Ryan
Hallo zusammen,
ich habe bei einem Projekt aktuell das Problem, dass rex_search aus irgendeinem Grund nicht alle Artikel indexiert. Aufgefallen ist es bei einem Artikel der in der root liegt (also keine Überkategorie hat) aber online ist. Wenn ich den Index aktualisiere mittels "Index schrittweise erstellen" taucht der Artikel gar nicht in der Liste der indexierten Seiten auf obwohl er mehrere hundert Seiten/Artikel/PDFs indexiert.

Redaxo 4.6.1
RexSearch: Neuste (0.7.8?)

Woran kann das liegen?

Gruss Thomas

Re: rex_search Artikel nicht indexiert

Verfasst: 30. Nov 2015, 12:36
von RexDude
Hi,

ich denke du musst hier selber das Problem zuerstmal eingrenzen. Z.B. kannst du test machen ob es wirklich damit zusammenhängt das es ein Rootartikel ist oder ob der gleiche Artikel in einer Katageorie auch Probleme macht. Und ja halt einfach von Hand debuggen. Artikel löschen, umbennenen, nackte RERDAXO Install und schauen wann die Indizierung nicht mehr läuft etc. Und hilfreich ist auch die PHP Fehlermeldungen auch wirklich eingeschaltet zu haben ;) Beim Indizierungsprozess von RexSearch gab es bei mir schon öfter mal Errors die ich erst fixen musste damit dann die Indizierung sauber durchlief. Z.B. hatte ich mal vergessen per is_object() zu prüfen ob OOArticle/OOCategory mir wirklich auch ein Objekt zurückgegeben haben. Im normalen Betrieb gings aber bei RexSearch Indizierung halt nicht.

Re: rex_search Artikel nicht indexiert

Verfasst: 30. Nov 2015, 14:15
von Phoebus Ryan
Danke für das schnelle Feedback. Ich denke aber nicht, dass es an den Rootartikeln liegt, weil andere Rootartikel indexiert sind und es auch werden. Das Errorreporting ist eingeschaltet, hilft aber leider nicht weiter.

Es werden ja beim schrittweise indexieren alle Artikel via Ajax aufgerufen (/redaxo/index.php?page=rexsearch&ajax=generate&do=incremental&type=art&id=XXX). Wenn ich den besagten Rootartikel manuell auf diese Weise aufrufe kommt folgende Meldung:
Article (ID=42,de) is excluded because of a redirect
Article (ID=42,en) is excluded because of a redirect

Bei allen anderen ist das nicht so; auf welche Art kann diese Seite weiterleiten? Wenn ich den Artikel anzeigen lasse findet ebenfalls kein Redirect statt. Die Seite lässt sich auch nicht indexieren wenn ich sämtliche Slices auf "offline" stelle (via slice_status).

Re: rex_search Artikel nicht indexiert

Verfasst: 30. Nov 2015, 14:18
von Thomas.Blum
Hej,

Schau dir mal die regex an. Ggf. matcht die auf deinen Inhalt

https://github.com/xong/rexsearch/blob/ ... c.php#L612

Das slice offline stellen bringt m.E. nichts

vg Thomas

Re: rex_search Artikel nicht indexiert

Verfasst: 30. Nov 2015, 14:26
von Phoebus Ryan
Ich habs rausgefunden:

In der class.rexsearch.inc.php gibt es den Abschnitt:

Code: Alles auswählen

if(file_exists($article_content_file) AND preg_match($this->encodeRegex('~(header\s*\(\s*["\']\s*Location\s*:)|(rex_redirect\s*\()~is'), rex_get_file_contents($article_content_file)))
{
	die($article_content_file);
  $return[$v] = A587_ART_REDIRECT;
  continue;
}
In diversen Modulen kommen Weiterleitungen vor (in dem betroffenen Artikel auch), jedoch sind diese immer an Bedingungen geknüpft, die rexsearch niemals auslösen würde. Es ist also sehr ungeschickt einfach die Cachefiles nach einem solchen Befehl zu durchsuchen weil eben Seiten mit Redirect (in meinem Fall login/logout) nicht indexiert werden.

Edit: Sorry Thomas; habs grad parallel rausgefunden. Jetzt stellt sich nur noch die Frage wie ich es löse

Re: rex_search Artikel nicht indexiert

Verfasst: 1. Dez 2015, 20:20
von Xong
Hi,

man muss Redirects bei der Indexierung leider ausschließen, weil sonst die Indexierung nicht funktioniert, wenn so ein Redirect stattfindet.

Du kannst aber natürlich immer noch alle Inhalte indexieren, indem du einfach über die DB-Spalten der rex_article_slice-Tabelle gehst.