<< Themensammlung Organisieren

Windows: Wie man nur den Text aus Dokumenten extrahiert

textminingtool

Mit dem Freewareprogramm "Text Mining Tool" kann man den Text aus Dokumenten wie PDFs, HTML- oder Worddateien extrahieren - und zwar nur den Text.

Im Gegensatz zum schlichten Copy&Paste holt Text Mining Tool nur den Text aus den Dokumenten. Etwaige Formatierungen eingebundener Bilder werden so nicht mitkopiert. Auch ist das Kopieren von im Ursprungsdokument durch Objekte stark fragmentiertem Text mit Text Mining Tool wesentlich leichter.

Einziger Nachteil: Wie man im Screenshot sehen kann, werden Umlaute leider nicht korrekt verarbeitet:

 

Wer aber damit leben kann, ausgiebig mit Text arbeitet und diesen aus Dokumenten extrahieren muss, für den wird Text Mining Tool die Arbeit wesentlich erleichtern.

Text Mining Tool ist Freeware und Windows only.

» Text Mining Tool - free converter of PDF, DOC, CHM, RTF, HTML files to text

( gefunden bei Lifehacker )

Frau überlegt beim Schreiben
Diese Regeln und Formulierungen helfen

Weiterlesen

Roter Hintergrund Mann mit Smarthone in der Hand
So geht's

Weiterlesen

Sie wollen ein Angebot oder die gratis Teststellung für die Unterweisung?

88 E-Learnings zu den Herausforderungen der aktuellen Arbeitswelt