Seite 1 von 1

Regexp Pattern für Glossar gesucht

Verfasst: 9. Mai 2017, 14:10
von wolfgang
Ich möchte gerne das Glossar Addon etwas erweitern. Die jetzige Version ist lediglich für einen einfachen Aufbau des HTML Quelltextes geeignet, bei dem die Glossarbegriffe auch brav direkt zwischen a-Tags oder h-Tags stehen. Im praktischen Leben steht aber heutzutage so ziemlich alles im HTML Quelltext.
Deswegen ist meine Idee, die Ersetzung mehrstufig zu gestalten, das heißt zunächst alle Stellen, die nicht dem gewünschten Ergebnis entsprechen zu markieren, anschließend den korrekten Glossareintrag zu verlinken und dann die Markierungen wieder zu entfernen. Ich bin natürlich auch für andere Vorschläge offen, es soll aber flexibel bleiben. Mit dem Ausschlussverfahren lassen sich auch weitere Kriterien hinzufügen ohne das zentrale Regex anzufassen.
Daher habe ich hier einmal ein regex101 aufgesetzt. Man sieht in dem Beispiel gut, woran mein Regex scheitert - es ist die leicht vereinfachte Version aus dem aktuellen Addon.

https://regex101.com/r/2sDgX3/1/

Ich sage jetzt schon mal Danke für eure kreativen Ideen!

Re: Regexp Pattern für Glossar gesucht

Verfasst: 9. Mai 2017, 20:45
von Gregor.Harlan
Ich habe mich mal der Aufgabe gestellt. Wenn ich das richtig sehe, trifft dieser Regex die gewünschten Suchwörter:

https://regex101.com/r/3uCvri/1

Re: Regexp Pattern für Glossar gesucht

Verfasst: 20. Jun 2017, 15:48
von wolfgang
Vielen Dank Gregor für das Regex! Uuuh - wie einfach das aussieht und ich hab ein echtes Brett vor dem Kopf.

Wie auch immer, ich habe versprochen das AddOn so weit zu bringen, dass es mal getestet werden kann.

Basis des neuen Glossar AddOns awglossar ist die Version von Oliver - an dieser Stelle vielen Dank für die Vorarbeit und die Unterstützung bei Fragen. Genial!

Nach diversen Versuchen habe ich die Ersetzungsengine etwas umgebaut. Ein Teil der Ersetzung basiert nun auf DOMDocument, das heißt, dass der HTML Code der Seite geparst wird um jene Stellen zu markieren, wo der Glossarbegriff nicht ersetzt werden soll. z.B. innerhalb von a-Tags. Oder von h1...h6. Zusätzlich können Tags, in denen keine Ersetzung stattfinden soll in den Einstellungen angegeben werden (z.B. ul,aside...).

Das AddOn ist derzeit auf einer Multidomain Seite im Einsatz, auf der es für jede Domain eine eigene Glossarseite gibt. Diese Seiten können ebenfalls in den Einstellungen definiert werden.

Oli und ich haben diskutiert, ob das AddOn FOR-würdig ist. Das darf nun hier (oder gerne auch in Slack) herzlich diskutiert werden. Zunächst, bis es noch ein paar getestet haben, habe ich es erstmal als normales AddOn zum Download bereitgestellt:

[https://redaxo.org/download/addons/awglossar/]

Viel Spaß beim Testen.

Re: Regexp Pattern für Glossar gesucht

Verfasst: 21. Jun 2017, 12:12
von wolfgang
Das Glossar heißt nun multiglossar (danke an Dirk für die Namensidee) und hat demnach einen neuen Link:

[https://redaxo.org/download/addons/multiglossar/]