Hallo zusammen,
ich habe bei einem Projekt aktuell das Problem, dass rex_search aus irgendeinem Grund nicht alle Artikel indexiert. Aufgefallen ist es bei einem Artikel der in der root liegt (also keine Überkategorie hat) aber online ist. Wenn ich den Index aktualisiere mittels "Index schrittweise erstellen" taucht der Artikel gar nicht in der Liste der indexierten Seiten auf obwohl er mehrere hundert Seiten/Artikel/PDFs indexiert.
Redaxo 4.6.1
RexSearch: Neuste (0.7.8?)
Woran kann das liegen?
Gruss Thomas
Hallo,
Wir haben in letzter Zeit festgestellt, dass die Kommunikation via Slack viel schneller und zielführender ist als ein Beitrag im Forum. Aufgrund der neuen und besseren Möglichkeiten der Kommunikation haben wir uns entschlossen das Forum nur noch als Archiv zur Verfügung zu stellen. Somit bleibt es weiterhin möglich hier nach Lösungen zu suchen. Neue Beiträge können nicht mehr erstellt werden.
Wir empfehlen, für deine Fragen/Probleme Slack zu nutzen. Dort sind viele kompetente Benutzer aktiv und beantworten jegliche Fragen, gerne auch von REDAXO-Anfängern! Slack wird von uns sehr intensiv und meistens "rund um die Uhr" benutzt
Selbst einladen kannst Du dich hier: https://redaxo.org/slack/
Wir haben in letzter Zeit festgestellt, dass die Kommunikation via Slack viel schneller und zielführender ist als ein Beitrag im Forum. Aufgrund der neuen und besseren Möglichkeiten der Kommunikation haben wir uns entschlossen das Forum nur noch als Archiv zur Verfügung zu stellen. Somit bleibt es weiterhin möglich hier nach Lösungen zu suchen. Neue Beiträge können nicht mehr erstellt werden.
Wir empfehlen, für deine Fragen/Probleme Slack zu nutzen. Dort sind viele kompetente Benutzer aktiv und beantworten jegliche Fragen, gerne auch von REDAXO-Anfängern! Slack wird von uns sehr intensiv und meistens "rund um die Uhr" benutzt
Selbst einladen kannst Du dich hier: https://redaxo.org/slack/
-
- Beiträge: 164
- Registriert: 27. Okt 2014, 15:57
Re: rex_search Artikel nicht indexiert
Hi,
ich denke du musst hier selber das Problem zuerstmal eingrenzen. Z.B. kannst du test machen ob es wirklich damit zusammenhängt das es ein Rootartikel ist oder ob der gleiche Artikel in einer Katageorie auch Probleme macht. Und ja halt einfach von Hand debuggen. Artikel löschen, umbennenen, nackte RERDAXO Install und schauen wann die Indizierung nicht mehr läuft etc. Und hilfreich ist auch die PHP Fehlermeldungen auch wirklich eingeschaltet zu haben Beim Indizierungsprozess von RexSearch gab es bei mir schon öfter mal Errors die ich erst fixen musste damit dann die Indizierung sauber durchlief. Z.B. hatte ich mal vergessen per is_object() zu prüfen ob OOArticle/OOCategory mir wirklich auch ein Objekt zurückgegeben haben. Im normalen Betrieb gings aber bei RexSearch Indizierung halt nicht.
ich denke du musst hier selber das Problem zuerstmal eingrenzen. Z.B. kannst du test machen ob es wirklich damit zusammenhängt das es ein Rootartikel ist oder ob der gleiche Artikel in einer Katageorie auch Probleme macht. Und ja halt einfach von Hand debuggen. Artikel löschen, umbennenen, nackte RERDAXO Install und schauen wann die Indizierung nicht mehr läuft etc. Und hilfreich ist auch die PHP Fehlermeldungen auch wirklich eingeschaltet zu haben Beim Indizierungsprozess von RexSearch gab es bei mir schon öfter mal Errors die ich erst fixen musste damit dann die Indizierung sauber durchlief. Z.B. hatte ich mal vergessen per is_object() zu prüfen ob OOArticle/OOCategory mir wirklich auch ein Objekt zurückgegeben haben. Im normalen Betrieb gings aber bei RexSearch Indizierung halt nicht.
-
- Beiträge: 164
- Registriert: 27. Okt 2014, 15:57
Re: rex_search Artikel nicht indexiert
Danke für das schnelle Feedback. Ich denke aber nicht, dass es an den Rootartikeln liegt, weil andere Rootartikel indexiert sind und es auch werden. Das Errorreporting ist eingeschaltet, hilft aber leider nicht weiter.
Es werden ja beim schrittweise indexieren alle Artikel via Ajax aufgerufen (/redaxo/index.php?page=rexsearch&ajax=generate&do=incremental&type=art&id=XXX). Wenn ich den besagten Rootartikel manuell auf diese Weise aufrufe kommt folgende Meldung:
Article (ID=42,de) is excluded because of a redirect
Article (ID=42,en) is excluded because of a redirect
Bei allen anderen ist das nicht so; auf welche Art kann diese Seite weiterleiten? Wenn ich den Artikel anzeigen lasse findet ebenfalls kein Redirect statt. Die Seite lässt sich auch nicht indexieren wenn ich sämtliche Slices auf "offline" stelle (via slice_status).
Es werden ja beim schrittweise indexieren alle Artikel via Ajax aufgerufen (/redaxo/index.php?page=rexsearch&ajax=generate&do=incremental&type=art&id=XXX). Wenn ich den besagten Rootartikel manuell auf diese Weise aufrufe kommt folgende Meldung:
Article (ID=42,de) is excluded because of a redirect
Article (ID=42,en) is excluded because of a redirect
Bei allen anderen ist das nicht so; auf welche Art kann diese Seite weiterleiten? Wenn ich den Artikel anzeigen lasse findet ebenfalls kein Redirect statt. Die Seite lässt sich auch nicht indexieren wenn ich sämtliche Slices auf "offline" stelle (via slice_status).
- Thomas.Blum
- Entwickler
- Beiträge: 5063
- Registriert: 24. Aug 2004, 22:11
- Wohnort: Dresden
- Kontaktdaten: Website
Re: rex_search Artikel nicht indexiert
Hej,
Schau dir mal die regex an. Ggf. matcht die auf deinen Inhalt
https://github.com/xong/rexsearch/blob/ ... c.php#L612
Das slice offline stellen bringt m.E. nichts
vg Thomas
Schau dir mal die regex an. Ggf. matcht die auf deinen Inhalt
https://github.com/xong/rexsearch/blob/ ... c.php#L612
Das slice offline stellen bringt m.E. nichts
vg Thomas
-
- Beiträge: 164
- Registriert: 27. Okt 2014, 15:57
Re: rex_search Artikel nicht indexiert
Ich habs rausgefunden:
In der class.rexsearch.inc.php gibt es den Abschnitt:
In diversen Modulen kommen Weiterleitungen vor (in dem betroffenen Artikel auch), jedoch sind diese immer an Bedingungen geknüpft, die rexsearch niemals auslösen würde. Es ist also sehr ungeschickt einfach die Cachefiles nach einem solchen Befehl zu durchsuchen weil eben Seiten mit Redirect (in meinem Fall login/logout) nicht indexiert werden.
Edit: Sorry Thomas; habs grad parallel rausgefunden. Jetzt stellt sich nur noch die Frage wie ich es löse
In der class.rexsearch.inc.php gibt es den Abschnitt:
Code: Alles auswählen
if(file_exists($article_content_file) AND preg_match($this->encodeRegex('~(header\s*\(\s*["\']\s*Location\s*:)|(rex_redirect\s*\()~is'), rex_get_file_contents($article_content_file)))
{
die($article_content_file);
$return[$v] = A587_ART_REDIRECT;
continue;
}
Edit: Sorry Thomas; habs grad parallel rausgefunden. Jetzt stellt sich nur noch die Frage wie ich es löse
Re: rex_search Artikel nicht indexiert
Hi,
man muss Redirects bei der Indexierung leider ausschließen, weil sonst die Indexierung nicht funktioniert, wenn so ein Redirect stattfindet.
Du kannst aber natürlich immer noch alle Inhalte indexieren, indem du einfach über die DB-Spalten der rex_article_slice-Tabelle gehst.
man muss Redirects bei der Indexierung leider ausschließen, weil sonst die Indexierung nicht funktioniert, wenn so ein Redirect stattfindet.
Du kannst aber natürlich immer noch alle Inhalte indexieren, indem du einfach über die DB-Spalten der rex_article_slice-Tabelle gehst.