中文 English 日本語

Umi-OCR

Umi-OCR

Umi-OCR LICENSE ダウンロード スター フォーク 翻译状态

無料、オープンソース、大量文字が一括認識できるのソフトウェア
Windows7 x64以上と互換性があります

- **無料**: このプロジェクトのすべてのコードはオープンソースで完全に無料です。 - **便利**: 解凍して使用し、オフラインで実行し、ネットワークは必要ありません。 - **効率的**: 高効率のオフライン OCR エンジンが付属しています。コンピュータのパフォーマンスが十分であれば、オンライン OCR サービスよりも速くなることがあります。 - **柔軟**: カスタマイズ可能なインターフェースをサポートし、コマンドラインや HTTP API など、複数の呼び出し方法をサポートします。

1-タイトル-1.png

![1-タイトル-2.png](https://tupian.li/images/2023/11/19/6559909fdeeba.png) ## ソースコードの使用: 開発者は続ける前に、[プロジェクトのビルド](#プロジェクトのビルド)を読んでください ## リリースのダウンロード: - **GitHub** https://github.com/hiroi-sora/Umi-OCR/releases/latest - **Source Forge** https://sourceforge.net/projects/umi-ocr - **Lanzou (蓝奏云)** https://hiroi-sora.lanzoul.com/s/umi-ocr
• Scoop インストーラー [Scoop](https://scoop.sh/) はWindowsで動作するコマンドラインインストーラーで、複数のアプリケーションを簡単に管理できます。まず Scoop をインストールし、次に以下のコマンドを使用して `Umi-OCR` をインストールしてください: - `extras` バケットを追加: ``` scoop bucket add extras ``` - (オプション1)Umi-OCR をインストール( `Rapid-OCR` エンジン付属、互換性が高い): ``` scoop install extras/umi-ocr ``` - (オプション2)Umi-OCR をインストール( `Paddle-OCR` エンジン付属、やや高速): ``` scoop install extras/umi-ocr-paddle ``` - 両方を同時にインストールしないでください。ショートカットが上書きされる可能性があります。しかし、[プラグイン](https://github.com/hiroi-sora/Umi-OCR_plugins) を追加することで、異なるOCRエンジンをいつでも切り替えることができます。
## はじめに ソフトウェアリリースパッケージは、`.7z`圧縮形式または自己解凍`.7z.exe`パッケージで利用可能です。自己解凍パッケージは、圧縮ソフトウェアがインストールされていないコンピューターでファイルを抽出するために使用できます。 このソフトウェアはインストールを必要としません。抽出後、`Umi-OCR.exe`をクリックしてプログラムを開始します。 問題が発生した場合は、[Issue](https://github.com/hiroi-sora/Umi-OCR/issues)を提出してください。最善を尽くしてサポートします。 ## インターフェース言語 Umi-OCR は、インターフェースの複数の言語をサポートしています。ソフトウェアを初めて開くと、コンピューターのシステム設定に基づいて自動的に言語が切り替わります。 言語を手動で切り替える必要がある場合は、以下の図を参照してください。`全局设置`→`语言/Language`。

1-タイトル-1.png

### 翻訳を手伝ってください Weblate オンラインで翻訳作業に参加できます: https://hosted.weblate.org/engage/umi-ocr/ ## タブインターフェース Umi-OCR v2 は、一連の柔軟で使いやすい**タブインターフェース**で構成されています。好みに応じて必要なタブインターフェースを開くことができます。 タブバーの左上隅を使用して**ウィンドウ常に最前面**を切り替えることができます。右上隅は、日常使用中の偶発的な閉鎖を防ぐために**タブインターフェースをロック**するために使用できます。 ### スクリーンショット OCR

2-スクリーンショット-1.png

**スクリーンショット OCR**: このページを開いた後、キーボードショートカットを使用してスクリーンショットをキャプチャし、画像内のテキストを認識することができます。 - 左側の画像プレビューパネルを使用して、マウスでテキストを選択してコピーすることができます。 - 右側の認識レコードパネルを使用して、テキストを編集し、複数のレコードを選択してコピーすることができます。 - 他の場所から画像をコピーして Umi-OCR に貼り付け、認識することもサポートしています。 #### 段落マージ

2-スクリーンショット-2.png

**OCR テキスト後処理 - 段落マージ**について: この機能は、OCR 結果のレイアウトと順序を整理し、テキストを読みやすく使用しやすくすることができます。プリセットスキームは以下の通りです。 - **単一行**: 同じ行上のテキストをマージします。ほとんどのシナリオに適しています。 - **複数行 - 自然な段落**: 同じ段落に属するテキストを知的に認識してマージします。ほとんどのシナリオに適しており、上記の図に示されています。 - **複数行 - コードブロック**: テキストの元のインデントとスペーシングを復元しようとします。コードスニペットやスペースを保持する必要があるシーンを認識するのに適しています。 - **縦書きレイアウト**: 縦書きレイアウトに適しています。縦書き認識もサポートするモデルライブラリと併用する必要があります。 --- ### バッチ OCR

3-バッチ-1.png

**バッチ OCR**: このページでは、ローカル画像をバッチでインポートして認識することがサポートされています。 - 認識されたコンテンツは、txt/jsonl/md/csv(Excel)などのさまざまな形式で保存できます。 - `テキスト後処理`技術をサポートし、同じ自然な段落に属するテキストを認識してマージすることができます。また、コードブロックや縦書きテキストなど、複数の処理スキームもサポートしています。 - 一度に処理できる画像の数に制限はなく、タスクを完了した後、ソフトウェアは自動的にシャットダウンまたはスリープすることができます。 #### 無視域

3-バッチ-2.png

**OCR テキスト後処理 - 無視域**について: これは、バッチ OCR の特別な機能で、画像内の望ましくないテキストを除外するために使用されます。 - 無視領域エディタは、バッチ認識ページ設定の右側の列でアクセスできます。 - 上記の例のように、画像の上部と右下隅に複数の透かし/LOGO があります。これらの画像がバッチで認識される場合、透かしは認識結果に干渉します。 - 右マウスボタンを押し続けて、複数の長方形ボックスを描画します。これらのエリア内のテキストは、タスク中に無視されます。 - 長方形ボックスをできるだけ大きく描画し、透かしのすべての可能な位置を完全に包むようにしてください。 --- ### 大量文章のocr

--- ### QR コード

4-QRコード-1.png

**スキャンコード**: - スクリーンショットをキャプチャしたり、貼り付けたり、ローカル画像をドラッグして、QR コードやバーコードを読み取ることができます。 - 1 つの画像で複数のコードをサポートします。 - 以下の 19 のプロトコルをサポートします: `Aztec`,`Codabar`,`Code128`,`Code39`,`Code93`,`DataBar`,`DataBarExpanded`,`DataMatrix`,`EAN13`,`EAN8`,`ITF`,`LinearCodes`,`MatrixCodes`,`MaxiCode`,`MicroQRCode`,`PDF417`,`QRCode`,`UPCA`,`UPCE`,

4-QRコード-2.png

**コード生成**: - テキストを入力して QR コード画像を生成します。 - **誤り訂正レベル**などのパラメータを含む 19 のプロトコルをサポートします。 --- ### グローバル設定

5-グローバル設定-1.png

**グローバル設定**: ここでは、ソフトウェアのグローバルパラメータを調整できます。一般的な機能には、以下が含まれます: - ショートカットを一度に追加するか、自動起動を設定します。 - インターフェースの**言語**を変更します。Umi は繁体字中国語、英語、日本語などの言語をサポートしています。 - インターフェースの**テーマ**を切り替えます。Umi には複数のライト/ダークテーマがあります。 - インターフェーステキストの**フォントサイズ**と**フォント**を調整します。 - OCR プラグインを切り替えます。 - **レンダラー**: ソフトウェアインターフェースは、デフォルトで GPU 加速レンダリングをサポートしています。画面のちらつきや UI の位置ずれが発生する場合は、`インターフェースと外観` → `レンダラー`に移動して、異なるレンダリングスキームに切り替えるか、ハードウェアアクセラレーションをオフにしてみてください。 --- ## API の使用: - [コマンドラインマニュアル](docs/README_CLI.md) - [HTTP API マニュアル](docs/http/README.md) ## プロジェクト構造について ### リポジトリ: - [メインリポジトリ](https://github.com/hiroi-sora/Umi-OCR) 👈 - [プラグインリポジトリ](https://github.com/hiroi-sora/Umi-OCR_plugins) - [Win ランタイムライブラリ](https://github.com/hiroi-sora/Umi-OCR_runtime_windows) ## プロジェクトのビルド ### ステップ 0: (オプション) このプロジェクトをフォークする ### ステップ 1: コードをダウンロードする 以下のいずれかを選択してください: - フォークしたリポジトリをローカルマシンにプルする - このリポジトリの zip ソースコードパッケージをダウンロードする - このリポジトリをクローンする ### 次のステップ: 対応するプラットフォームの開発/ランタイム環境デプロイメントを完了するには、以下のリポジトリに進んでください。 このプロジェクトには、非常にシンプルなワンクリックパッケージングスクリプトもあり、以下のリポジトリで見つけることができます。 - [Windows](https://github.com/hiroi-sora/Umi-OCR_runtime_windows) - クロスプラットフォームサポートは開発中です。 ## [変更ログ](CHANGE_LOG.md)