PDFを書き起こしてテキストで書く方法

2022年4月26日

PDFを書き起こしてテキストで書く方法

無料のオンライン変換サイトを使用する

フリーソフトウェアを使ってテキストを抽出する方法については、以下の記事「PDFからテキスト(テキスト)を抽出する方法」のセクションを参照してください。

これは、WindowsとMacの両方で使用することができます。

PDFから画像やテキストを抽出する方法

グーグルドライブにアクセスする

Googleドライブ(https://drive.google.com/)に移動し、[新規作成]ボタンを押します。

ファイルのアップロード
PDFテキスト変換Googleドライブファイルをアップロードする

出てきたメニューから、[Upload file].

ファイルの選択
PDFテキスト変換Googleドライブファイルを選択してください

「開く」ダイアログボックスが表示されます。(1) 選択[Arbitrary file]とプレス (2)[Open]ボタン。

グーグルドキュメントで開く
PDFテキスト変換グーグルドキュメント

(1) 右クリック[Uploaded file].(2) 選択[Open in app](3)[Google Docs].

テキスト抽出の完了
PDFテキスト変換グーグルドライブのテキスト抽出が完了しました

Google ドキュメントが新しいタブで開きます。これでテキストの抽出が完了しました。

お使いの携帯電話(iPhone)でアプリを使用する

CamScanner というアプリを使ってテキストを抽出する方法について説明します。

CamScannerは、手書きのメモや領収書などの重要な文書を高速でスキャンして保存し、画像やPDFからテキストを簡単に抽出できます。

アプリをインストールする
PDFテキスト変換カムスキャナのインストール

アプリストアカムスキャナーアプリをインストールします。

無料メンバーシップにサインアップする

CamScannerは、無料会員登録により、1日4回までOCRを使用することができます。

以下、会員登録の方法を説明します。

PDFテキスト変換カムスキャナアプリを開きます

カムスキャナーアプリを開きます。

PDFのテキスト変換カムスキャナI

選ぶ[Me]画面の右下にあります。

PDFテキスト変換カムスキャナ会員登録

押す[Login/ Register].

PDFのテキスト変換カムスキャナの電子メール

(1)「メールアドレス」を入力し、(2)項目を確認する[Agree to the Terms of Use and Privacy Policy].

(3)[Next Step]ボタン。

PDFテキスト変換カムスキャナのパスワード

(1)「パスワード」と入力し、(2)を押す[Next Step]ボタン。

PDFテキスト変換カムスキャナの電子メール認証

入力したメールアドレスに確認メールが届きました。

[[Please confirm your email address]ボタン。

PDFテキスト変換カムスキャナ認証完了

メールアドレスが確認されました。

PDFのテキスト変換カムスキャナアカウント

CamScannerアプリに戻ると、メンバーとして登録されています。

PDF からテキストを抽出する

PDF からテキストを抽出する方法については、こちらをご覧ください。

PDFテキスト変換カムスキャナ PDFで保存したアプリを開きます

今回は、「ファイル」アプリに保存されたPDFテキストを抽出します。

開く[File]アプリ。

PDFテキスト変換カムスキャナは、PDFを長押し

長押し[Any PDF].

PDFのテキスト変換カムスキャナの共有

出てきたメニューから、[Share].

PDFテキスト変換カムスキャナでPDFを開く

(1)[Scroll “Sideways" of “App Menu", (2) Select the app of[CamScanner].

PDFテキスト変換カムスキャナで保存

[[Save]ボタン。

PDFテキスト変換カムスキャナを選択して保存

[[Save]ボタン。

カムスキャナーのアップロードが完了しました

PDF がアップロードされました。

pdf-テキスト変換カムスキャナ テキストを抽出するファイルを選択します

選ぶ[Page where you want to extract text].

※無料会員は抽出できるテキスト数に制限がありますので、制限を超えたデータ数から抽出したい場合は別途料金をお支払いいただく必要があります。

PDFテキスト変換カムスキャナのテキスト表示

[テキスト]を選択します。

PDFテキスト変換カムスキャナPDF認識

[[Recognize]ボタン。

PDFテキスト変換カムスキャナPDFフルページ

選ぶ[Any character recognition range (e.g. recognize full page)].

PDFテキスト変換カムスキャナのテキストを抽出

選ぶ[Export]画面の右下にあります。

PDFテキスト変換カムスキャナPDFのTXTとして保存

[Txt ファイルとしてエクスポート]を選択します。

PDFのテキスト変換カムスキャナPDFメール

任意の共有方法(電子メールなど)を選択します。

PDFのテキスト変換カムスキャナは、電子メールで送信

(1)「メールアドレスに送信」と入力し、(2)を押す[↑]ボタン。

PDFテキスト変換カムスキャナオープン添付ファイル

I rec私が入力した電子メールアドレスでTxtファイルをeived。

ダブルクリック[Attachment]をクリックして開きます。

PDFテキスト変換カムスキャナのテキスト抽出完了

これでテキストの抽出が完了しました。

画面右上の「共有」ボタンでファイルを保存できます。

アドビアクロバットのOCR機能を使用する

光学式文字認識(OCR)は、画像内の文字を認識し、編集可能なテキストに変換する技術です。

今回の記事では、Adobe Acrobat Pro DC の OCR 機能を使用してテキストを抽出する方法を説明します。

* Adobe Acrobat Reader DC の無料版では、テキストを抽出することはできませんのでご注意ください。

お使いのPCにアドビアクロバットスタンダード/プロDCをまだインストールしていない場合は、以下のリンクから購入できます。

pdf-text-conversionAdobe Acrobat Pro で開く

スキャンした画像の PDF を Adobe Acrobat Pro DC で開きます。

pdf-text-conversion edit Adobe Acrobat Pro PDF

画面右側のメニューから、[Edit PDF].

pdf-text-conversion Adobe Acrobat Pro 文字認識開始

文字認識が開始されます。

pdf-text-conversion Adobe Acrobat Pro Text Selection

PDFは編集可能なテキストと画像に変換されました。

選ぶ[Text you want to extract].

pdf-text-conversion Adobe Acrobat Pro copy

選択したテキストを「右クリック」して選択します。[Copy]出てきたメニューから。

pdf-テキスト変換メモ帳の起動

始める[Document creation software (e.g. Notepad)].

pdf-テキスト変換アドビアクロバットプロペースト

空白を「右クリック」して選択します。[Paste]出てきたメニューから。

pdf-テキスト変換アドビアクロバットプロテキスト抽出完了

これでテキストの抽出が完了しました。

PDF にテキストを送信できない場合

Adobe Acrobat Pro DC を使用してテキストを抽出しても機能しない場合は、次の方法でスキャンした画像を修正してみてください。

pdf-テキスト変換 Adobe Acrobat Pro スキャン補正

スキャンした画像の PDF を Adobe Acrobat Pro DC で開きます。

pdf - テキスト変換アドビアクロバットプロスキャンとOCR

選ぶ[Scan and OCR]画面右側のメニューから。

pdf-text-conversion Adobe Acrobat Pro 補正の選択

選択 (1)[Correction]および (2)[Scanned Documents].

pdf-テキスト変換アドビアクロバットプロ補正ボタン

[[Correction]ボタン。

pdf-text-conversion Adobe Acrobat Pro 補正後のテキストの抽出

(1) 選択[Recognition of text](2)[In this file].

pdf-text-conversion Adobe Acrobat Pro Text Extraction Button

[[Text Recognition]ボタン。

pdf-テキスト変換アドビアクロバットプロ補正完了

これで、テキストが抽出可能になりました。