Hoi hoi,
noch als Idee für Stoppwörter:
- eventuell ist es noch hilfreich einfach komplette Zahlenblöcke zu entfernen.
Ich habe wieder die Redaxo Demo (+ bissl Inhalt).
Dort werden nun viele Keywords in der Art von:
8221 -> html entitie
0611, 504, .. -> Telefon
usw.
Ich frage mich ob es zu weit geht, wenn Standardmäßig alle reine Zahlenblöcke entfernt werden, aber Sinnvoll ist es meiner Meinung nach allemal.
Desweiteren hab ich diesen und ähnliche Keywords:
Dies kommt anscheinend daher, dass die Tags einfach entfernt werden.
Dort wäre es Sinnvoll, wenn z.b. bei
Code: Alles auswählen
<a href="index.php?article_id=8">Was ist REDAXO</a></li><li id="rex-article-9" class="rex-normal"><a href="index.php?article_id=9">Für wen ist REDAXO</a></li>
Die Tags mit einem Leerzeichen ersetzt werden.
Ich denke doppelte Leerzeichen lässt du bereits an einer Stelle ersetzen.
Dadurch wären dann zumindest diese zusammen geschriebenen Ausdrücke weg, und würde auch aufgesplitet werden.
Neue Keywords, bzw. Keywords nach denen ich Suche werden immer mit clang = -1 angelegt. Danach funktioniert auch wieder die Zählung, jedoch eben in der falschen clang ID.
Irgendwo geht da die clang ID verloren =(.
der Completer ist auf das Datenbanklayout mit clang angepasst.
mfg