はじめに
最近、行政や企業の広報文書、家電製品・パソコンと周辺機器の取扱説明書などは、それぞれのWebサイトにPDF文書の形で置いてある所が増えてきました。
PDF文書を読むには、一般的にはAdobe Readerが使われますが、これが サイズが大きくて動きが重く、文書を読んだり テキスト保存したりするのに手間がかかります。
そこで、最初の導入と設定に多少 手間はかかりますが、その後 PDF文書を簡単にテキストファイルに変換して読むことが出来るフリーソフト「xdoc2txt」を紹介いたします。
このソフトを使うと、PDFの他にも Word・Excel・html・一太郎などの各種文書から、テキストを抽出することが出来ます。
また、最近はPDF文書にセキュリティをかけて、テキストを抽出できないようにしてある物が増えていますが、「xdoc2txt」を使うと、Adobe Readerでテキスト保存できないものもテキストファイルで保存できる場合があります。
ただし、万能ではありません。例えばPDFにテキストが組み込まれておらず、全てが画像になっているものなどはテキストに変換することが出来ません。 画像だけのPDFは、OCRソフト等で文字認識するしか方法がありません。
「xdoc2txt」が大幅に変更されました
2013年1月に、「xdoc2txt」が新しいバージョンに改定されました。 Unicodeに対応すると共に、これまでは、別のファイルとして配布されていた「cryptlib.dll」が統合され、バージョンの数字が、これまでの 1.x から 2.x に一新されました。
※「cryptlib.dll」は、アクセス制限のかかったPDFを、パスワード無しでテキスト化するのに必要なプログラムです。
「cryptlib.dll」の統合によって、これまでは別途ダウンロードして解凍→コピーという作業がなくなり、簡略化されました。それに伴い、パスワード無しで暗号化されたPDFをテキストに変換スルのに必要だったオプション -n が廃止されました。
上記の変更に合わせて、このページの説明も、新しいバージョン 2.00 に基づいた内容に変更しました。
実践パソコン環境
Windows 10 pro 64bit + PC-talker 10 v1.09
Windows7 Pro 64bit SP1 + PC-Talker7 2.12
Windows7 Pro 32bit SP1 + PC-Talker7 2.12
WindowsXP SP3 + PC-Talker XP 2.07
※2016年9月 現在
ソフトの概要
ソフト名 | xdoc2txt |
---|---|
バージョン | 2.16.1 ( 2016年9月現在 ) |
動作OS | 2000/XP/Vista/Windows 7(32bit/64bit)/Windows 8(32bit/64bit)/ Windows 10(32bit/64bit)/ Server 2003/Windows Server 2008 R2(64bit) / Windows Server 2012(64bit) / Windows Server 2012 R2(64bit) |
種別 | フリーソフト |
作者 | hishida 様 |
公式サイト: |
xdoc2txt http://ebstudio.info/home/xdoc2txt.html |
必要なランタイム |
Microsoft Visual C++ 2010 再頒布可能パッケージ (x86) (別ウィンドウで開きます) |
ダウンロード
「xdoc2txt」の公式サイト
xdoc2txt
http://ebstudio.info/home/xdoc2txt.html
にアクセスして、
Ver2.x(Unicode版) の項目の下の最新バージョンのリンクからダウンロードして、適当な場所に保存します。保存する場所はどこでもかまいません。
※ここではCドライブの直下(ルート)に保存し、そのまま 同じ場所に解凍した、という仮定で以降の説明を進めていきます。
セットアップ
1.解凍
上記で保存したファイル「xd2tx(バージョンの数字).zip」を解凍します。解凍すると、「xd2tx(バージョンの数字)」というフォルダが得られます。このフォルダを開くと、次の三つのフォルダと、一つのファイルが入っています。
・フォルダ
com
command
dll
・ファイル
README.txt
2.ショートカットの作成
上記のフォルダの中の「command」というフォルダを開きます。このフォルダには、「xdoc2txt」のコマンドライン版の、二つのファイルが入っています。
xdoc2txt.exe … プログラム本体
xdoc2txt.txt … 説明書
3.ショートカットの作成とリンク先の書き替え
@「xdoc2txt.exe」にカーソルを合わせて、Altキー、または Applicationキーを押します。
Aメニューが開きますので、上矢印キーで「ショートカットの作成」を選んで Enterキーを押します。
B「xdoc2txt.exe - ショートカット.lnk」というショートカットファイルが作成されますので、そこにカーソルを合わせます。
CAltキー、または Applicationキーでメニューを開き、上矢印キーで「プロパティ」を選んで Enterキーを押します。または、Altキー+Enterキーを押します。
D「プロパティ」のダイアログボックスが開きます。最初は「リンク先」のテキストボックスにフォーカスされていて、
リンク先(T): C:\xd2tx(バージョンの数字)\command\xdoc2txt.exe
とガイドされます。
Eここで、左矢印キーを一回押します。はじめはテキストボックスに入力された文字列が選択状態になっているため、そのまま新しく文字を入力すると、最初に入力されていた文字列が消えてしまうためです。
Fカーソルを右に戻し、
半角スペース
半角の - (マイナス記号)
半角小文字の f
を入力していきます。
全体の文字列は、以下のようになります。
C:\xd2tx(バージョンの数字)\command\xdoc2txt.exe -f
「-f」は、「xdoc2txt」で変換されたテキストを、ファイルに出力するためのオプションです。出力されたファイルの拡張子は、自動的に「.txt」となります。
G文字列を確認したら、Tabキーで「OK」のボタンに移動して Spaceキーを押します。 「プロパティ」のダイアログボックスが閉じます。
H「xdoc2txt.exe - ショートカット.lnk」にカーソルを合わせたまま、Ctrlキー+X(切り取り)、または Ctrlキー+C(コピー)を押します。
現在開いているExplorerは、そのまま開いた状態のまま、次の手順に進みます。
※切り取りでもコピーでも、どちらでもかまいません。
4.ショートカットの移動(またはコピー)
@Windowsキー+R を押して、「ファイル名を指定して実行」のダイアログボックスを開きます。
Aテキストボックス(コンボボックス)に、
WindowsXPの場合は
sendto
Windows 7 / Windows 10 の場合は
shell:sendto
と入力します。
BTabキーで「OK」のボタンに移動して Spaceキーを押します。 Explorerが起動して「送る(sendto)フォルダ」が開きます。
CCtrlキー+V を押して、先ほど切り取り(またはコピー)しておいたショートカットを貼り付けます。
Dショートカットが移動 またはコピーされたことを確認したら、「送る(sendto)フォルダ」のExplorerを閉じます。
E「xdoc2txt」のフォルダを開いているExplorerも閉じます。これでセットアップ完了です。
「xdoc2txt」の使い方
キーボードでの操作
1.Explorer(マイドキュメント・コンピューターなど)で、目的のファイル(PDFやWord文書.doc)などにカーソルを合わせます。
2.Altキー またはApplicationキーを押してメニューを開き、「送る」という項目にカーソルを合わせます。
3.右矢印キーを押して、サブメニューを開きます。
4.上下矢印キーで「xdoc2txt」という項目にカーソルを合わせて、Enterキーを押します。
※この時、「コマンドプロンプト」という音声が聞こえることがあります。コマンドライン版の「xdoc2txt」が動作する時に、コマンドプロンプトのウィンドウが開くため、それをPC-Talkerが読み上げるためです。
5.同じフォルダの中に、同じファイル名(拡張子だけが.txtになっています)でテキストに変換されたファイルが出力されます。
Windows XPでは リストビューの一番最後に、Windows7では 元のファイルの下に、それぞれ出力されます。
※MyFileの送るメニューから実行した場合は、F5キーを押してリストビューの表示を更新して下さい。
マウスで操作するには
デスクトップにショートカットをコピーしておくと、Explorerから PDF等のファイルをドラッグすることによって、テキストに変換することが出来ます。ショートカットのコピーの手順は以下のとおりです。
1.セットアップが完了した後、Explorerを起動して、「xdoc2txt」 → 「command」のフォルダを開きます。
※「送るフォルダ」にショートカットを移動している場合は、「送るフォルダ」を開きます。
2.その中の、「xdoc2txt.lnk」を、デスクトップにドラッグ&ドロップします。
.lnk という拡張子は表示されていない場合がありますが、ファイルのサイズ 1KB で判断することが出来ます。
xdoc2txtを簡単にセットアップ出来るツール
誰でも使えるxdoc2txt
最初に書いたように、これまでよりも「xdoc2txt」のセットアップの作業は簡略化されました。ダウンロードや解凍、ショートカットの作成やリンク先の書き替えなど、慣れている人にとっては、それほど難しい作業ではありません。
しかし、入門者〜初心者のユーザーにとっては難しい作業かもしれません。そこで、そうした人達でも、簡単にセットアップが行えるツール「誰でも使えるxdoc2txt_201」を作成しました。
圧縮ファイルをダウンロードして解凍し、ツールの実行ファイルを実行するだけで、自動的に上記の作業を行ないますので、すぐに「xdoc2txt」を使うことが出来ます。
このツールのダウンロードと詳しい説明は、以下のページを参照して下さい。
──このページの本文 終わり──