OCRの『誤字』を逃さない。
だれでも簡単に使える、透明テキスト修正ツール。

PDFの文字が検索できない、コピーすると文字化けする...そんな悩みをマウスとキーボード操作で解決します。

当サービスの目的と使命

LucidPDF Editor Projectは、「だれもがデジタル情報を正しく、便利に使いこなせるようにする」ことを目標に開発されました。

世の中のたくさんの書類がPDFになっています。それらを便利にする「文字の読み取り（OCR）」はとても助かる機能ですが、どうしても読み間違いが発生してしまいます。そのせいで、大事な書類が検索にヒットしなかったり、文字をコピーしたときにぐちゃぐちゃになってしまったりすることがあります。

私たちは、難しい知識や特別なソフトがなくても、だれでもブラウザ一つで「PDFの裏側の文字」をサッと直せるようにしたいと考えています。お仕事の書類から個人のメモまで、あらゆるPDFを「使いやすく」変えるお手伝いをいたします。

🚀 1分でわかる！クイックスタート

📂

1. ファイルを選ぶ

「エディターを開く」から、直したいPDFを選択します。すぐに画面に表示されます。

🔄

2. 文字を並び替える

「並び替え」モードから枠を指定して文字順、文字回転を実行します。

🖱️

3. 文字をクリック

PDF上の「直したい文字」を直接クリック！右側の表が連動して動くので、そのまま正しい文字を入力します。

💾

4. PDFを保存

「PDF出力」ボタンを押すだけ。修正された「検索できるPDF」がダウンロードされます。

1. このサービスでできること

OCR（光学文字認識）によって読み取られたPDFの「透明テキスト層」を、誰でも簡単に、かつ精密に修正・再構築できるブラウザベースの編集ツールです。

OCR結果の修正・編集

PDFから抽出された文字情報の誤字脱字を、Excelのようなグリッド形式で直接書き換えられます。

直感的・視覚的な操作

プレビュー画面上で文字をマウスでドラッグして位置を微調整したり、足りない文字をその場に書き足したりできます。

自由な並び替え（読み順の制御）

「この段落を先に読む」といった指定をマウスで囲むだけで、読み取り順序を自由に入れ替えられます。

複数ファイルのバッチ処理

大量の1ページPDFを一括で読み込み、矢印キーやボタンで次々と切り替えながら効率的に編集を進められます。
※分割直後のみ。再読込み後は履歴表示「●」が表示されません。

TSV入出力とPDF作成

編集データはTSV（タブ区切り）形式で保存・管理可能。最終的に、検索可能な透明テキスト層付きPDFとして出力できます。

PDF分割・連結ツール

ブラウザ上で動作する分割・連結機能を備えており、複数ページPDFを扱いやすい1ページ単位に素早く整理できます。

完全無料で使い放題

広告表示にご協力いただくことで、全ての高度な編集機能を無料でご利用いただけます。

2. サービスの仕組み

本サービスは、PDF内の文字情報を以下の4つの主要データとして精密に取得・管理しています。

回転 (Rotation): 文字がどの向き（0, 90, 180, 270度）を向いているか。
サイズ (Font Size): 文字の大きさ（フォントサイズ）。
座標 (Coordinates): ページ内の絶対的な位置（X座標、Y座標）。
列座標 (Column/Line): 表や文書としての「行」や「列」の揃い。

技術的な背景： PDF出力時には、送信されたPDF（または背景画像）の上に、これらの情報に基づいた「透明なテキスト層」をミリ単位の精度で正確に重ね合わせています。これにより、見た目はそのままに、文字の検索やコピーができる PDF が完成します。

3. ご利用の際の注意点

ステートレス設計: セキュリティとリソース保護のため、サーバー上にはお客様のPDFファイルを一切保存しません。解析や生成の都度、ブラウザから必要なデータを送信し、処理完了後やダウンロード後に一時ファイルを即座に破棄する仕組みを採用しています。
セッション保護 (Binding): セキュリティ強化のため、各セッション（作業データ）は作成時のIPアドレスおよびブラウザ環境 (User-Agent) に紐付けられます。同じデバイスの同じブラウザ以外からのアクセスを拒絶することで、他人があなたのデータにアクセスするのを強力に防いでいます。
アップロードファイル制限: 各ユーザー（IPアドレス基準）の同時セッション（TSVデータ保持）数は最大10に制限されています。また、サーバー全体の安全のため、全ユーザー合計で100の上限が設けられています。上限を超える場合は古いデータから順に自動削除されます。
ファイルサイズ制限: 高精度なOCR API（Azure AI）との連携およびサーバー負荷軽減のため、アップロード可能なファイルサイズはシステム設定に基づき制限（標準10MB程度）されています。
ファイルサイズの増大: 透明テキスト層PDFと背景画像PDFの2つのPDFを重ねる合成手法のため、出力されるファイルサイズは元のサイズより大きくなる場合があります。
1ページ単位の処理を推奨: サーバーへの負荷を抑え、動作の安定性を保つため、原則として1ページずつの処理を前提としています（分割・連結機能を活用してください）。
データの自動消去: セキュリティ維持のため、最後の操作から30分経過するとデータベース上のテキスト編集データは自動的に物理削除されます。作業中はこまめに保存・出力を推奨します。
利用範囲の限定: 当サービスは、ご自身で所有する資料や、著作権法で認められた「私的使用」の範囲内での利用を前提としています。
ブラウザ環境: 大量データのグリッド描画を伴うため、最新のGoogle ChromeまたはMicrosoft Edgeでの利用を強く推奨します。
文字埋込み：文字の連続性、検索のヒット率を優先するため、縦書時の埋込みは画像と異なり90度回転となります。

4. 編集モードの使いかた

画面上部の「モード」を切り替えることで、マウスで行える操作が変わります。

📍 通常選択モード

【操作】プレビュー上の文字をクリックします。
【効果】クリックした文字が右側の表（グリッド）で自動的に選択され、その場所までスクロールします。修正したい文字をすぐに見つけるのに便利です。

📝 文字の挿入モード

【操作】プレビュー上で追加したい範囲をドラッグ（マウスを押したまま動かす）します。
【効果】入力画面が表示されます。文字を入力して「確定」を押すと、その場所に新しい文字データが追加されます。

🔄 並び替えモード

【操作】プレビュー上で、ひとまとまりとして扱いたい範囲をドラッグして囲みます。
【効果】右下に「並び替え領域」リストが現れます。囲んだ範囲ごとに読む方向（縦・横）を指定でき、リストの順番を入れ替えることで全体の並び順を制御できます。

🎯 文字位置の微調整モード

【操作】プレビュー上の文字をドラッグして好きな場所へ動かします。
【効果】文字の座標（位置情報）がリアルタイムに更新されます。OCRの読み取り位置が少しズレている場合などに、マウスで直感的に直せます。

5. 詳細ガイド・各機能の使い方

【重要】LucidPDF Editorの処理方針
サーバーへのファイルサイズ肥大化および過負荷を避けるため、当サービスは原則として「1ページ単位」での読み込み・編集・PDF出力処理を行います。
このため、複数ページのPDFをまとめて編集したい場合は、お客様のローカル環境（ダウンロードフォルダ等）にてあらかじめ「分割」を行い、必要に応じて「連結」をお願いいたします。

メイン操作ボタンの機能・条件・保存先

ボタン名	機能の詳細と実行条件	データの格納場所
PDF分割	機能：複数ページのPDFを1ページずつの独立したPDFファイルに分解します。条件：サーバーへの送信は行わず、ブラウザ（お客様のPC）内で完結するため安全・高速に処理されます。目的：サーバー負荷軽減のため、1ページごとに編集・出力するための前準備として使用します。	ローカルのダウンロードフォルダ
PDF連結	機能：ダウンロードフォルダ等にある複数の1ページPDFを選択し、一つの複数ページPDFに連結します。条件：連結したいファイルを複数選択（Ctrl+A等）して実行します。目的：個別に修正・出力した各ページを、最終的に一つのファイルにまとめる際に使用します。	ローカルのダウンロードフォルダ
ファイル選択ファイルリスト ← → ボタン	機能：編集したいPDFを読み込みます。複数のファイルを一度に選択して読み込むことが可能です。リスト：選択したファイルの名前と進捗（済・編集中）が表示されます。 ← →：現在の編集内容を自動保存しながら、リスト内の前後のファイルへ素早く切り替えます。	ブラウザメモリ / サーバーDB（一時）
保存	機能：現在編集中のTSVデータをサーバー側のSQLiteデータベースへ確定保存します。条件：手動保存のほか、入力停止から60秒後に「自動保存」がバックグラウンドで動作します。	サーバー側のSQLiteデータベース
PDF出力	機能：修正したテキストを透明な文字として埋め込んだ新しい1ページPDFを生成します。条件：原本の画像（見た目）は一切変更せず、内部の検索・コピー用テキスト層のみを差し替えます。	ローカルのダウンロードフォルダ
初期化	機能：現在の全作業データを破棄し、セッションを完全に終了します。条件：実行すると、サーバー上の原本PDF、生成済みPDF、およびDBレコードが即座に物理削除されます。	（すべての保存データが消去されます）

編集ツールバーの機能

機能ボタン	詳細な機能説明
↑ / ↓	選択した行（文字）の読み取り順序を上下に入れ替えます。
№更新	行(L)と文字(P)の順序番号を現在の並び順に基づいて一括で振り直します。
行削除 / 行復元	不要な文字情報の削除や、削除した直後の状態への戻し操作を行います。
字揃え	選択した複数の文字の座標を整列させ、同一行(L)として認識されるよう更新します。
TSV出力	現在のテキスト構造をExcel等で編集可能なTSV形式でローカルに保存します。
表示 (文字の表示・非表示)	プレビュー画面上の赤字（透明テキスト）の表示・非表示を切り替えます。
文字色 (チェック)	右側の表（グリッド）において、文字の種類（英数・記号等）に応じて色分けを行い、視認性を高めます。
全文検索	右上の検索窓に文字を入力し、↑↓ボタンで全ページからヒット箇所を検索・移動できます。
拡大・縮小	「+」「-」「100%」ボタンを使用して、プレビュー画面の表示倍率を自在に調整できます。

編集モードの切り替え

詳細は「2. 編集モードの使いかた」をご覧ください。プレビュー上でのマウス操作（クリック・ドラッグ）により、直感的な編集が可能です。

データの保存場所について

サーバーDB: 編集中のTSVテキストデータが保存されます。原本のPDFファイルは保存されません。
サーバー一時領域: 生成されたPDFファイルがダウンロード待ちの間だけ一時的に保存され、送信完了後に即座に物理削除されます。
サーバーメモリ: 実行中の解析・生成タスクにおいて、必要なデータが最小限のメモリ（ストリーミング形式）で処理されます。
ブラウザメモリ: 元のPDFファイル、および現在表示しているページの最新状態が保持されます。
ローカルPC: 「PDF出力」「TSV出力」および「分割・連結」結果がダウンロードフォルダに保存されます。

※透明テキスト（OCR層）がないPDFは編集できませんのでご注意ください。

よくある質問

Q. 料金は無料ですか？

A. はい、すべての機能を無料でご利用いただけます。サーバー維持のため広告を表示しております。

Q. フォントやレイアウトは崩れますか？

A. 透明テキストのみを書き換えるため、元の画像の見た目は維持されますが、フォントの種類によっては重なりが発生する場合があります。

Q. アップロードしたファイルが他人に流出することはありませんか？

A. はい、ご安心ください。各セッションは個別のIDで管理されており、他のユーザーがお客様のファイルにアクセスすることはできません。また、作業終了時または一定時間の経過でシステムから完全に消去されます。

Q. 30分経つとどうなりますか？

A. セキュリティ維持のため、セッションを終了しファイルを削除します。削除前には画面に通知が表示されますが、放置された場合は自動で実行されます。

プライバシーポリシー・個人情報の取り扱い

LucidPDF Editorは、ユーザーのプライバシーを最優先事項として考え、個人情報の保護に努めています。アドセンス広告の配信やCookieの使用、データの取り扱いに関する詳細は、独立したプライバシーポリシーページにまとめています。

プライバシーポリシーの詳細を見る

データの保存期間について：
セキュリティ維持のため、編集中のテキストデータおよび生成されたPDFデータは、セッション終了時（「初期化」ボタン押下時）または最終操作から30分経過した時点で、サーバー（データベース）上から物理的に自動消去されます。

推奨動作環境

当サービスを快適にご利用いただくために、以下の環境を推奨します。

ブラウザ: Google Chrome / Microsoft Edge / Safari (最新版)
JavaScript: 有効に設定してください（自動保存およびプレビュー機能に使用します）
Cookie: 有効に設定してください（セッション管理に使用します）
ディスプレイ: 横幅1280px以上のPC環境（グリッド編集を伴うため、タブレットやスマートフォンでの高度な編集は非推奨です）

セキュリティとデータ消去

当サービスでは、高度な編集機能を提供するため、解析や生成の都度、ブラウザから送信されたPDFデータをサーバーのメモリ上で一時的に処理します。

徹底したデータ削除ポリシー：

手動削除: 画面内の「初期化」ボタンを押すと、即座にデータベース内の編集テキスト、および生成済みPDFデータを物理的に完全削除します。
自動削除: 最後に操作してから30分間経過すると、警告メッセージを表示したのち、システムが自動的に全データをデータベースから破棄します。

※削除されたデータはサーバー上から消滅し、復元は不可能です。作業完了後は速やかにダウンロードを行ってください。

全通信のSSL(HTTPS)暗号化
サーバーDBには一時的な管理情報のみを保持し、セッション終了と同時に物理削除
処理用メモリの積極的な解放

利用規約

当サービスを利用するにあたり、以下の規約に同意したものとみなします。

免責事項: 本サービスを利用したことによる、いかなる損害（データ消失、業務停止等）についても運営者は一切の責任を負いません。
自己責任: 機密性の高い、あるいは公序良俗に反するファイルのアップロードは行わないでください。
サービスの変更・停止: 当サービスは予告なく機能の変更、または提供を停止することがあります。
トレーサビリティの確保: 著作権保護および不正利用防止のため、出力される PDF には不可視の状態でセッションIDが埋め込まれます。これにより、著作権侵害等の請求があった際に、生成元のセッションを追跡することが可能になります。

禁止事項

利用者は、当サービスの利用にあたり、以下の行為を行ってはなりません。

法令または公序良俗に違反する行為
サーバーやネットワークの機能を破壊・妨害する行為
当サービスの運営を妨害するおそれのある行為
不正な目的を持って当サービスを利用する行為
他のユーザーに成りすます行為

著作権・所有権について

「あなたのデータは、あなたのものです」

ユーザーの権利: アップロードされたファイルや、編集して新しく作成されたPDFの著作権は、すべてお客様（または元の権利者）に帰属します。LucidPDF Editorがお客様のデータを無断で二次利用したり、所有権を主張したりすることは一切ありません。安心してご活用ください。
当サービスの権利: LucidPDF Editor のシステム、デザイン、ロゴ等に関する知的財産権は、すべて運営者に帰属します。
責任の制限: 著作権を侵害する内容のアップロードはお控えください。万が一第三者との間で紛争が生じた場合、当プロジェクトでは責任を負いかねます。
権利侵害への対応: 著作権侵害の申し立てがあった場合、埋め込まれたセッションIDを基に調査を行い、必要に応じて法的機関への情報提供を行う場合があります。

運営者情報・お問い合わせ

運営者情報

開発者：木尻徹

お問い合わせ

サービスに関するご意見・ご要望、バグ報告、またはお仕事の依頼については、以下の窓口までお願いいたします。

お問い合わせ: お問い合わせフォームで送信する

※共有サーバー運用のデモアプリのため、返信にお時間をいただく場合がございます。

オープンソースソフトウェア

本サービスは以下のオープンソースソフトウェアを使用しています。

Flask: BSD-3-Clause License
pypdf: BSD-3-Clause License
fpdf2: LGPL-3.0 License
pdfplumber: MIT License
pikepdf: MPL-2.0 License
Flask-WTF: BSD-3-Clause License
flup: BSD-2-Clause License
pymysql: MIT License
Azure SDK for Python: MIT License

6. 安心してお使いいただくための仕組み（セキュリティ）

LucidPDF Editorは、大切な書類を安全に守るため、以下のような仕組みで情報を保護しています。専門的な対策を自動で行っているため、安心して作業に集中いただけます。

🛡️ IPアドレス・User-Agentバインディング (app.py: check_session_auth)

セッションIDおよびタスクIDは、生成時のクライアントIPアドレスとブラウザ識別子（User-Agent）に厳格に紐付けられます。万が一、セッションIDが第三者に漏洩したとしても、異なるデバイスやネットワーク環境からのアクセスはサーバー側で自動的に遮断されます。

🔐 署名付きクッキーによる二重検証 (app.py: check_session_auth)

データベース上のID検証に加え、Flaskの署名付きセッション（Cookie）による検証を併用しています。サーバーが発行した正当な署名を持つブラウザからのみ、該当データへのアクセスが許可される二重の防壁を構築しています。

🧹 徹底した物理削除と空間解放 (repository.py: delete_session / SQLite VACUUM)

セッション終了時（「初期化」ボタン）や有効期限（30分）経過時には、DBレコードの削除だけでなく、SQLiteの VACUUM または incremental_vacuum 命令を実行し、ファイル内のデータ領域からも情報を物理的に抹消します。

🚀 自動・即時クリーンアップ (maintenance.py / services.py)

アップロードされた原本PDFおよび生成された一時ファイルは、処理完了後やダウンロード後に即座に物理削除されます。また、バックグラウンドのメンテナンスプロセスが、不慮の事態で残った孤立データを定期的に走査・消去し、サーバーのクリーンな状態を維持します。

🌐 プロキシ環境下でのIP正当性確保 (app.py: ProxyFix)

Werkzeug ProxyFix を導入し、共有サーバー等のリバースプロキシ環境下でも、クライアントの真のIPアドレスを正確に特定・バインドすることで、中間者によるなりすましを防止しています。

🚫 詳細エラーの外部露出防止 (app.py: errorhandler)

システム内部で予期せぬエラーが発生した場合でも、スタックトレースや内部パス、データベース構造などの詳細情報は一切ユーザーに返されません。セキュリティを考慮した一貫した汎用エラーメッセージのみが表示され、攻撃の手がかりを与えません。

安全面が気になる方へ：
当サービスは、サーバーにファイルを「置きっぱなし」にしない設計になっています。作業が終わればすぐにデータは消去されるため、非常に安全な仕組みです。

OCRの『誤字』を逃さない。だれでも簡単に使える、透明テキスト修正ツール。