PDFのテキスト層を、正しく管理する。
透明テキスト修正のためのエンジニアリング・ツール。
テキスト抽出後の検索漏れや、コピー時の文字化け。PDFの内部構造に起因する不満を解消するために開発されました。
当サービスの目的
LucidPDF Editor Projectは、「PDFの不透明なデータを、透明で確かな情報へと整える」ことを目的としています。
テキスト抽出は利便性の高い技術ですが、構造的な読み取りミスは避けられません。本ツールは、専門的なソフトウェアを介さずとも、ブラウザ上でPDF内部のテキスト座標やUnicodeマッピングを直接修正できる環境を提供することで、実務におけるデータ品質の向上に寄与します。
1. 編集モードの使いかた
画面上部の「モード」を切り替えることで、プレビュー画面上でのマウス操作が変わります。
【操作】プレビュー上の文字をクリックします。
【効果】クリックした文字が右側の表(グリッド)で自動選択され、その場所までスクロールします。修正箇所を特定するのに最適です。
【操作】プレビュー上で追加したい範囲をドラッグします。
【効果】入力画面が表示され、指定した場所に新しい文字データを追加できます。読み飛ばされた文字を補完するのに最適です。
【操作】ひとまとまりとして扱いたい範囲をドラッグで囲みます。
【効果】範囲ごとに読む方向(縦・横)を指定でき、リストの順番を入れ替えることで、PDF全体の読み取り順序を自由に制御できます。
【操作】プレビュー上の文字を直接ドラッグして動かします。
【効果】文字の座標がリアルタイムに更新されます。検索時のハイライト位置がズレている場合などに直感的に修正可能です。
2. 各機能の詳細
メイン操作ボタン
| ボタン名 | 機能の詳細 | 保存先・備考 |
|---|---|---|
| PDF分割 / 連結 | 複数ページPDFを1ページずつに分解、または複数の1ページPDFを一つにまとめます。 | ブラウザ内で完結。DLフォルダに保存。 |
| 保存 | 現在編集中のデータをサーバー側のデータベースへ確定保存します。 | サーバー(SQLite)※30分で消去 |
| PDF出力 | 修正したテキストを透明な文字として埋め込んだ新しいPDFを生成します。原本の見た目は変わりません。 | DLフォルダに保存。 |
| 初期化 | 現在の全作業データを破棄し、セッションを完全に終了します。 | サーバー上の全データが即座に物理削除されます。 |
編集ツールバー
グリッド(表)上部のボタンで、高度な編集が可能です。
- ↑ / ↓ : 選択した文字の読み取り順序を入れ替えます。
- №更新 : 行と文字の順序番号を現在の並び順に基づいて一括で振り直します。
- 字揃え : 複数の文字の座標を整列させ、同一行として認識されるよう更新します。
- TSV出力/読込 : 構造化されたテキストデータをExcel等で扱える形式で書き出し・読み込みします。
当サービスのご利用には、あらかじめテキスト抽出処理(OCR等)が施された、透明テキスト層を持つPDFファイルが必要です。テキスト層が存在しないPDFは、現在そのままでは編集できません。 詳細な仕様やセキュリティについてはFAQページをご確認ください。
運営者・お問い合わせ
運営者情報
開発者:木尻 徹(甲信越在住)