Hier ist zu sehen, was mit Datei passiert, wenn ich in PDF "Speichern als Text" wähle.
Du musst die Datei schon irgendwie online stellen, so verweist die nur auf Deine Festplatte, die ich nicht lesen kann.
Zu diesem Test:
- Ich habe die PDF-Datei von yandex mal im Adobe Reader geöffnet. Korrekte Anzeige (s.o.). Dann als Text speichern und Text anschauen. Ja, in dem Fall ist der Text kaputt. Liegt wohl daran, dass Adobe Reader bei diesem Menüpunkt nicht korrekt arbeitet bzw. keine Wahl der Textkodierung erlaubt. D.h. aber nur, dass der Adobe Reader repariert werden müsste, nicht das System!
- Jetzt habe ich mal die PDF-Datei von yandex im Adobe Reader geöffnet, den russischen Text markiert und in die Zwischenablage kopiert. Dann in Textedit wieder eingefügt. Alle Zeichen werden korrekt dargestellt.
- Jetzt habe ich mal die PDF-Datei von yandex in Vorschau (schon in Tiger vorhanden und meist schneller als der Adobe Reader) geöffnet, den russischen Text markiert und in die Zwischenablage kopiert. Dann in Textedit wieder eingefügt. Alle Zeichen werden korrekt dargestellt.
Fazit:
Die Option "Als Text speichern" vom Adobe Reader ist nicht geeignet, weil man keine Textkodierung vorgeben kann und anscheinend auch keine automatisch richtig gewählt wird. Fehler im Adobe Reader!
Das Übernehmen als Text ist aber problemlos über die Zwischenablage sowohl aus dem Adobe Reader als auch aus Vorschau möglich.
Daraus folgt: Keine "Reparatur" (d.h. eigentlich Beschädigung" des Systems notwendig.
Anderen Bild ist HTML und PDF - beide UTF-8; um es für Window lesbar zu wäre, HTML mit der Hilfe "NVU" app. erstelle in "Window" 1251
Ja, was denn jetzt? UTF-8 oder Windows 1251?
TextEdit/Einstelungen/ öfnen automatisch - von einem Cod zu anderen
"Automatisch" heisst nur, dass TextEdit von alleine raten(!) soll, was richtig ist. Das ist bei reinen Texten sehr schwierig und führt natürlich oft zu Fehlern. Besser wäre es beim Öffnen direkt die Kodierung vorzugeben oder an allen Stellen UTF-8 zu verwenden.
Nebenbei, sogar bei iTunes, wenn Datei Name Russisch ist, sieht es so aus
Innerhalb von iTunes werden ja die ID3-Tags angezeigt und nicht Dateinamen! Je nachdem wer diese da rein geschrieben hat, kann es zur gleichen Kodierungsproblematik kommen. Ich kenne Titel, die werden in iTunes korrekt mit deutschen Umlauten angezeigt, andere haben statt der deutschen Umlaute unleserliche Zeichen. In dem Fall sind die vom Ersteller falsch kodiert worden und wenn ich das korrigiere funktioniert es auch. Wie auch immer: Das ist eine andere Baustelle.
So ganz ist Deine Arbeitsweise noch nicht klar geworden:
- Was ich verstanden habe ist, dass Du den Textinhalt von PDFs in TextEdit weiterverarbeiten möchtest. Das funktioniert, wie ich oben beschrieben habe. Kaputtmachen des Systems ("Reparieren") ist nicht notwendig.
- Was für andere Formate Du bekommst, selber erstellst und wo anders dann nicht gelesen werden können, ist noch nicht klar. Versuche das einfach mal Schritt für Schritt zu beschreiben, dann ist es einfacher zu verstehen und der Fehler, der garantiert in der Bedienung des komplexen Themas Textkodierung liegt, besser einzugrenzen und zu beheben.
Du hast noch nicht geschrieben, welcher Apple Service das war. Musst Du natürlich nicht schreiben, aber würde mich schon interessieren. Die scheinen ja dafür Geld zu bekommen, dass sie das System kaputt machen und dann nach einem Update wieder reparieren, oder aber dafür, dass sie simple Einstellungen machen.