Seite 1 von 2

" " steht fast überall im Quellcode

Verfasst: Di 28. Sep 2004, 15:04
von moews
Hallo Leute, also in mehreren Artikeln finde ich ständig folgende Zeichenkette: " " obwohl ich die Texte vorher in einem Editor kopiert hatte (aus einem Word-Dokument) um alle unnötigen Dinge zu entfernen. Trotzdem steht im Quellcode ständig diese Zeichenkette...

Verfasst: Di 28. Sep 2004, 15:39
von RonDog
:wink: HTML Handbuch lesen...Bild oder guckst Du Google...
  is the entity used to represent a non-breaking space. It is essentially a standard space, the primary difference being that a browser should not break (or wrap) a line of text at the point that this   occupies.

Verfasst: Di 28. Sep 2004, 17:11
von Halchteranerin
@RonDog: ich vermute, die Frage lautete nicht nach der Bedeutung von   sondern nach der Ursache, warum das dort steht/erscheint.

Hier steht was dazu, laenger hatte ich keine Lust zu suchen, aber das sollte auch reichen: http://www.contenido.de/forum/viewtopic ... light=nbsp

Verfasst: Di 28. Sep 2004, 19:47
von RonDog
@Halchteranerin

Mag sein, dass Du recht hast, dann habe ich was gelesen, was nicht gefragt wurde. OK, dann verstehe ich dennoch nicht, warum diese Frage überhaupt (so) gestellt wurde.

Fakt ist erst mal, dass i.d.R. " " nur an Stellen steht, wo zusätzliche Leerzeichen benötigt werden.

Wenn man allerdings die Frage dahingehend interpretiert: "wer produziert diese ' '-s", dann kann man sich die Frage eigentlich (und einfach) selbst beantworten, in dem man den identischen Text 'manuell' eingibt und die Ergebnisse vergleicht. Word ist nun mal eine HTML-'Dreckschleuder' und wie schon in zig Beiträgen bemurmelt, der schlechteste aller Editoren, um Texte in ein CMS zu übertragen. Die Übertragung in einen 'anderen Editor' muss nicht notwendigerweise heissen, dass alles an HTML-Schrott entfernt wurde. Zumindest gehört " " sicher nicht zu den Zeichen(Ketten), die autom. entfernt werden, wenn man einen HTML-fähigen Editor verwendet. Nimmt man einen reinen ASCII-Editor (wie Win Notepad), dann ist sicher alles an Formatierung futsch! Alternativ kann man ja auch aus Word reine ASCII Daten mit CRLF speichern. Ich kenne die Word / CMS Debatte aus verschiedenen Foren, und jeder betroffenen (ich auch) bestätigt, dass aus Word alles andere als vernünftiges HTML kommt. Da über 98% aller Betriebe mit Ms Office arbeitet, ist das leider ein Dauerproblem, wenn Kunden ihre Daten von Word in ein CMS transferieren. Möglicherweise ist Open Office da eine bessere Alternative, doch diese kommt auch nur wieder für Entwickler in Frage, weil sich keine Firma das antut, zwei verschiedene Officesysteme parallel zu installieren.

Verfasst: Di 28. Sep 2004, 20:40
von Halchteranerin
@Ron: Danke fuer den 'Vortrag'. Aber hast du auch nur einen klitzekleinen Blick in den Thread geworfen, zu dem ich den Link gepostet habe? Das hat nichts, aber auch rein gar nichts, weder mit Word noch mit irgendwelchen Editoren zu tun.

  hat uebrigens auch nicht zwingend mit 'zusaetzlichen Leerzeichen' zu tun. Das ist einfach ein sogenanntes 'geschuetztes Leerzeichen' und kann auch einzeln benutzt werden, ohne ein weiteres (normales) Leerzeichen.

Und nur so nebenbei: aus OpenOffice uebernommene Texte sehen auch nicht viel besser aus.

Ich bin wahrlich keine Microsoft-Anhaengerin, aber gegen Word bei jeder Gelegenheit zu wettern, ob es etwas mit dem Thema zu tun hat oder nicht, bringt niemandem etwas.

Verfasst: Di 28. Sep 2004, 21:54
von RonDog
@Ron: Danke fuer den 'Vortrag'.
Bitte, gern geschehen...
hast du auch nur einen klitzekleinen Blick in den Thread geworfen
Ja, habe ich...
  hat uebrigens auch nicht zwingend mit 'zusaetzlichen Leerzeichen' zu tun. Das ist einfach ein sogenanntes 'geschuetztes Leerzeichen' und kann auch einzeln benutzt werden, ohne ein weiteres (normales) Leerzeichen.
Jetzt ist es an mir, für Deinen kleinen Vortrag zu danken...
aber gegen Word bei jeder Gelegenheit zu wettern
War 'ne Feststellung! Mehr nicht!

Re: " " steht fast überall im Quellcode

Verfasst: Di 28. Sep 2004, 22:37
von emergence
und damit wir wieder auf das thema zurück kommen...
moews hat geschrieben:Hallo Leute, also in mehreren Artikeln finde ich ständig folgende Zeichenkette: " " obwohl ich die Texte vorher in einem Editor kopiert hatte (aus einem Word-Dokument) um alle unnötigen Dinge zu entfernen. Trotzdem steht im Quellcode ständig diese Zeichenkette...
was steht wo ? was wurde genau gemacht ? läßt sich das reproduzieren ? zb auf meinen rechner ? (obwohl ich auch kein word habe...) welche contenido version ? wurde was am spaw verändert ?

möglichkeiten gibt es viele...

Re: " " steht fast überall im Quellcode

Verfasst: Di 28. Sep 2004, 23:20
von Halchteranerin
moews hat geschrieben:Trotzdem steht im Quellcode ständig diese Zeichenkette...
heisst 'staendig', dass es oefter in EINEM Artikel auftritt, oder dass es in jedem Artikel EINMAL auftritt? Falls letzteres, schau dir den von mir vorher angegebenen Link an. Falls ersteres, solltest du das Problem etwas genauer beschreiben. :wink:

Verfasst: Mi 29. Sep 2004, 09:44
von moews
Okay, da ich mich nicht ganz deutlich ausgedrückt habe...nun noch einmal meine Erläuterung:

Problem: Der Kunde liefert Word-Dokumente für die entsprechenden Seiten. Diese Texte müssen dann ins CMS. Einfach kopieren geht nicht (klar: scheiß HTML von WORD), da dann etliche Formatierungen von Word übermommen werden. Nun konnte ich das umgehen, indem ich den entsprechenden Text erst in den Standard-Editor (von Windows) kopiere um alle Formatierungen zu entfernen und anschließend ins CMS. Alles wunderbar.... nun ist mir aber aufgefallen, dass ich z.B. (hier ein Auszug)

Code: Alles auswählen

Verarbeitungs- und  Vulkanisat-eigenschaften Ihrer Formulierungen genau auf die entsprechende Anwendung einstellen können. 2-Komponenten-Siliconformulierungen werden z. B. zur Herstellung
ständig (hier zweimal) das geschützte Leerzeichen drin habe und das teilweise nicht nur zweimal sondern 20mal. Warum das? Ich weiß es nicht. Deshalb habe ich dieses Problem hier geschildert um zu erfahren, ob es ein Problem ist, was bekannt ist oder ob einfach etwas falsch gemacht wird. Reproduzieren konnte ich das Problem bisher nicht...


Nun noch an RonDog: Also deine Ausführungen waren sehr interessant. Ich glaub mehr muss ich dazu nicht sagen... unnötig.

Und an die Halchteranerin: Danke!!! ;-)


Zum System: läuft auf eigenem WebServer, Contenido 4.4.4 mit allem drum und dran...

Verfasst: Mi 29. Sep 2004, 10:00
von timo
tja, das ist nicht so einfach: wenn du aus Word etwas in den Texteditor kopierst, gibt es trotzdem Unterschiede zwischen Leerzeichen und Leerzeichen: Eines ist geschützt (wird zu  ), eines nicht. Sie sehen beide gleich aus, haben aber andere ASCII-Werte.

Verfasst: Mi 29. Sep 2004, 10:01
von moews
timo hat geschrieben:tja, das ist nicht so einfach: wenn du aus Word etwas in den Texteditor kopierst, gibt es trotzdem Unterschiede zwischen Leerzeichen und Leerzeichen: Eines ist geschützt (wird zu  ), eines nicht. Sie sehen beide gleich aus, haben aber andere ASCII-Werte.
Hi Timo, du wie kann ich das Problem dann umgehen? Gibt es dafür eine Patentlösung? ;-)

Verfasst: Mi 29. Sep 2004, 10:13
von timo
Eigentlich nicht - es sei denn, du setzt schon bei Word an...

Sind denn die &nbsp's bei dir überhaupt ein Problem?

Verfasst: Mi 29. Sep 2004, 10:27
von moews
Na ja mal ja und mal nein. In Tabellen sind Sie ein Problem, da dadurch die Darstellung verändert wird, also Texte die noch eine Zeile höher sitzen müssten, sitzen dann eben eine Zeile tiefer und das sieht blöd aus. Ggf. muss ich dann wohl die Zeichenkette manuell entfernen. Der Aufwand ist bloß etwas ärgerlich.

Aber Danke für deine Hilfe!!!!

Verfasst: Mi 29. Sep 2004, 11:50
von prefix
der wysiwyg-editor produziert bei mir auch sehr oft (nicht immer) zu beginn des textes ein geschütztes leerzeichen. ich hau das dann per regexp in den functions.con.php raus

Verfasst: Mi 29. Sep 2004, 13:40
von RonDog
@ moews

Geht doch, oder?

Hättest Du gleich zu Beginn den Beitrag so ausführlich geschrieben wie jetzt (Mi Sep 29, 2004 8:44), hätte es keine Missverständnisse gegeben. Wenn Du die Anderen im Nebel stochern lässt, dann darfst Du Dich nicht wundern, wenn mal einer Deine Anfrage falsch interpretiert.