Hack: wysiwyg -> HTML entfernen z.B. aus Word

Alles rund um die Erstellung von Patches, Behebung von Bugs und Contributions
Benutzeravatar
mausi
Senior Member
Beiträge: 449
Registriert: Di 27. Jan 2004, 16:17
Wohnort: Welver
Kontaktdaten:

Hack: wysiwyg -> HTML entfernen z.B. aus Word

Beitragvon mausi » Di 16. Jun 2009, 23:13

Hallo!

Das Problem HTML-Tags aus z. B. Word-Dateien ist so alt wie es Web-Editoren gibt. Daher verstehe ich nicht, dass in den vergangenen Jahren im WE-Editor kein Button zum Entfernen dieser Tags angeboten wird. "Formatierung" löschen entfernt ja leider nicht alle.

Ich bediene mich einfach eines kleineren Hacks, da viele Kunden einfach nicht verstehen was sie da alles kopieren:

In der weWysiwyg.js füge ich in der Funktion "removefromat" diese Zeile hinzu in Z.2628 (WE6):

text = text.replace(/<.*?>/gi, ''); // remove all tags

Damit werden sämtliche Tags entfernt. Wäre schön wenn es diese Funktion demnächst mal als extra Button gäbe ;)

gm
OMOC.interactive https://www.omoc.de/ - webEdition e.V. Gründungsmitglied & Ex Fördermitglied

bolleone
Senior Member
Beiträge: 601
Registriert: So 4. Jul 2004, 00:24
Wohnort: Düsseldorf
Kontaktdaten:

Re: Hack: wysiwyg -> HTML entfernen z.B. aus Word

Beitragvon bolleone » Mi 17. Jun 2009, 07:52

Hallo,

nur eine kurze Frage dazu: werden dann nicht auch alle Tags entfernt, die der Redakteur bewußt setzt, z.B. für Textformatierungen?
multimediadesign.net · Atelier für Kommunikation
Grimmstr. 3 · 40235 Düsseldorf
Telefon ++49-211-4981791 · Telefax ++49-211-4981792
http://www.multimediadesign.net · bolle@multimediadesign.net

we:willRockYou
Senior Member
Beiträge: 919
Registriert: Fr 22. Mai 2009, 21:40
Wohnort: Berlin
Kontaktdaten:

Re: Hack: wysiwyg -> HTML entfernen z.B. aus Word

Beitragvon we:willRockYou » Mi 17. Jun 2009, 08:16

Ja, aber ist das denn nicht auch gewollt, wenn der Redakteur auf "Remove Format" klickt? Ich finde das eine gute Verbesserung.

Mausi, wenn Du Deine Hacks in die Bugbase als Feature-Request einträgst, steigt die Chance dass das jemand für die nächste Version übernimmt.
EOF; //totally retired

bolleone
Senior Member
Beiträge: 601
Registriert: So 4. Jul 2004, 00:24
Wohnort: Düsseldorf
Kontaktdaten:

Re: Hack: wysiwyg -> HTML entfernen z.B. aus Word

Beitragvon bolleone » Mi 17. Jun 2009, 09:53

oh sorry, das hatte ich falsch verstanden - als Ergänzung für den Klick auf "Formatierungen entfernen" wäre das natürlich grandios. Meine Redakteure wundern sich auch immer, dass die von ihnen erzeugten Seiten so seltsam aussehen, wenn sie Inhalte direkt aus Word in WebEdition kopieren. Ist ja auch kein Wunder bei dem ganzen Geschröggel, was da mitgeschleppt wird...
multimediadesign.net · Atelier für Kommunikation
Grimmstr. 3 · 40235 Düsseldorf
Telefon ++49-211-4981791 · Telefax ++49-211-4981792
http://www.multimediadesign.net · bolle@multimediadesign.net

ArminSchulz
Senior Member
Beiträge: 250
Registriert: Do 1. Jan 1970, 02:00
Wohnort: Berlin
Kontaktdaten:

Re: Hack: wysiwyg -> HTML entfernen z.B. aus Word

Beitragvon ArminSchulz » Mi 17. Jun 2009, 10:22

Also bitte das ganze in den bugtracker als Feature Request!
Dr. Armin Schulz

Astendo GmbH
www.astendo.de

Benutzeravatar
mausi
Senior Member
Beiträge: 449
Registriert: Di 27. Jan 2004, 16:17
Wohnort: Welver
Kontaktdaten:

Re: Hack: wysiwyg -> HTML entfernen z.B. aus Word

Beitragvon mausi » Do 18. Jun 2009, 13:17

hi!

irgendwie klappt der mailversand bei neuen antworten nicht mehr (nachtrag: seit dem neuen forum landen die mails bei gmx im spam)

jau, werde das gleich dort hinterlegen. bin ja da registriert :)

danke für das feedback - mausi

nachtrag: http://forum.webedition.de/viewtopic.php?f=116&t=13500 auch sicherlich interessant ;)
OMOC.interactive https://www.omoc.de/ - webEdition e.V. Gründungsmitglied & Ex Fördermitglied

Benutzeravatar
MadSonic
Senior Member
Beiträge: 162
Registriert: Mo 12. Dez 2005, 14:37

Re: Hack: wysiwyg -> HTML entfernen z.B. aus Word

Beitragvon MadSonic » So 21. Jun 2009, 13:17

Echt genial Mausi, nervt echt mit Word! Leider klappts bei mir nicht, sind immernoch Word Exkremente drin nach dem Entfernen.
Gruß
Fatih
LG Fatih

we:willRockYou
Senior Member
Beiträge: 919
Registriert: Fr 22. Mai 2009, 21:40
Wohnort: Berlin
Kontaktdaten:

Re: Hack: wysiwyg -> HTML entfernen z.B. aus Word

Beitragvon we:willRockYou » So 21. Jun 2009, 13:46

Fatih, hast Du den Browser-Cache gelöscht? Die weWysiwyg.js wird vermutlich nicht automatisch neu geladen.

Alternative zum Cache löschen: Datei im Browser direkt aufrufen und manuell neu laden: F5 / Cmd+R
EOF; //totally retired

Benutzeravatar
mausi
Senior Member
Beiträge: 449
Registriert: Di 27. Jan 2004, 16:17
Wohnort: Welver
Kontaktdaten:

Re: Hack: wysiwyg -> HTML entfernen z.B. aus Word

Beitragvon mausi » So 21. Jun 2009, 18:39

... der Hack entfernt lediglich die umschließenden HTML-Tags, nicht den Inhalt. D.h. die Word Sachen werden nun sichtbar und können manuell entfernt werden. Viele Kunden mussten übrigens tatsächlich im We-Frame Shift-Reload ausführen, bevor man den Hack nutzen konnte ...

gm
OMOC.interactive https://www.omoc.de/ - webEdition e.V. Gründungsmitglied & Ex Fördermitglied

we:willRockYou
Senior Member
Beiträge: 919
Registriert: Fr 22. Mai 2009, 21:40
Wohnort: Berlin
Kontaktdaten:

Re: Hack: wysiwyg -> HTML entfernen z.B. aus Word

Beitragvon we:willRockYou » So 21. Jun 2009, 18:45

mausi hat geschrieben:... der Hack entfernt lediglich die umschließenden HTML-Tags, nicht den Inhalt. D.h. die Word Sachen werden nun sichtbar und können manuell entfernt werden.
D.h. es geht hier um HTML-Kommentare, oder? (Entschuldigt, ich habe nie versucht etwas aus Word hineinzukopieren ;))

Falls ja, würde ich vorschlagen erst die gesamten Kommentare zu entfernen, und danach die restlichen Tags. Beim jetzigen regulären Ausdruck würde nur der einleitende Kommentar-Tag bis zum ersten richtigen Tag gelöscht.

Versuchs mal so: /<!--.*?-->|<[^>]*>/g
EOF; //totally retired

Benutzeravatar
mausi
Senior Member
Beiträge: 449
Registriert: Di 27. Jan 2004, 16:17
Wohnort: Welver
Kontaktdaten:

Re: Hack: wysiwyg -> HTML entfernen z.B. aus Word

Beitragvon mausi » So 21. Jun 2009, 21:48

... nee, auch richtige Tags:

<meta content="text/html; charset=utf-8" http-equiv="Content-Type" /><meta content="Word.Document" name="ProgId" /><meta content="Microsoft Word 9" name="Generator" /><meta content="Microsoft Word 9" name="Originator" /><link href="file:///K:/msoclip1/01/clip_filelist.xml" rel="File-List" /><!--[if gte mso 9]>

Normal
0
21


</xml><![endif]--><style>
<!--
/* Font Definitions */
@font-face
{font-family:"Syntax Terror";
panose-1:0 0 0 0 0 0 0 0 0 0;
mso-font-charset:0;
mso-generic-font-family:auto;
mso-font-pitch:variable;
mso-font-signature:3 0 0 0 1 0;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
{mso-style-parent:"";
margin:0cm;
margin-bottom:.0001pt;
mso-pagination:widow-orphan;
font-size:12.0pt;
font-family:"Times New Roman";
mso-fareast-font-family:"Times New Roman";}
@page Section1
{size:612.0pt 792.0pt;
margin:70.85pt 70.85pt 2.0cm 70.85pt;
mso-header-margin:36.0pt;
mso-footer-margin:36.0pt;
mso-paper-source:0;}
div.Section1
{page:Section1;}
-->
</style><span lang="EN-GB" style="font-size: 12pt; font-family: &quot;Times New Roman&quot;;">Text </span><b><span lang="EN-GB" style="font-size: 12pt; font-family: &quot;Syntax Terror&quot;;">Text Text Text Text Text
Text Text Text Text Text Text Text Text Text Text Text Text Text Text Text Text
Text Text Text Text Text Text Text Text Text Text Text Text Text Text Text Text
Text Text Text Text Text Text</span></b>
OMOC.interactive https://www.omoc.de/ - webEdition e.V. Gründungsmitglied & Ex Fördermitglied

we:willRockYou
Senior Member
Beiträge: 919
Registriert: Fr 22. Mai 2009, 21:40
Wohnort: Berlin
Kontaktdaten:

Re: Hack: wysiwyg -> HTML entfernen z.B. aus Word

Beitragvon we:willRockYou » So 21. Jun 2009, 22:45

mausi hat geschrieben:... nee, auch richtige Tags:
...ja, aber eben auch Kommentare.

Wenn schon, kann man ja gleich den ganzen Müll entfernen. Dann auch gleich noch den CSS-Quatsch.

/<style[^>]*>.*?<\/style>|<!--.*?-->|<[^>]*>/g
EOF; //totally retired

Benutzeravatar
mausi
Senior Member
Beiträge: 449
Registriert: Di 27. Jan 2004, 16:17
Wohnort: Welver
Kontaktdaten:

Re: Hack: wysiwyg -> HTML entfernen z.B. aus Word

Beitragvon mausi » So 21. Jun 2009, 23:47

... ok, hab´s noch erweitert, damit es auch bei Word klappt:

text = text.replace(/<style[^>]*>.*?<\/style>|<!--.*?-->|<!--.*?>|<[^>]*>/gi, ''); // remove all tags

ps. Danke ;)
OMOC.interactive https://www.omoc.de/ - webEdition e.V. Gründungsmitglied & Ex Fördermitglied

Benutzeravatar
MadSonic
Senior Member
Beiträge: 162
Registriert: Mo 12. Dez 2005, 14:37

Re: Hack: wysiwyg -> HTML entfernen z.B. aus Word

Beitragvon MadSonic » Di 23. Jun 2009, 11:49

ihr seid klasse :)

jetzt wird der ganze kram bei mir sichtbar und kann ohne quellcodemodus gelöscht werden.
Vielleicht geht das ja irgendwann mal ganz automatisch 8)
LG Fatih

we:willRockYou
Senior Member
Beiträge: 919
Registriert: Fr 22. Mai 2009, 21:40
Wohnort: Berlin
Kontaktdaten:

Re: Hack: wysiwyg -> HTML entfernen z.B. aus Word

Beitragvon we:willRockYou » So 19. Jul 2009, 16:31

Ich sehe gerade dass die Funktion removeformat eigentlich nur optische Auszeichnungen entfernen soll. Logische Auszeichnungen (Überschriften, Listen) bleiben erhalten, was ich als sinnvolle Funktion sehe.

Ich denke wir sollten eher einen weiteren Button einsetzen, statt das Verhalten des alten (removeformat) zu ändern.

Ich setze auch einen Kommentar in den Feature-Eintrag.

Und da dieser hier noch nicht verlinkt ist: #3718
EOF; //totally retired


Zurück zu „Patches, Bugs und Contributions“

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 13 Gäste