一斗缶観測日記

PCやソフトの設定、Tipsなどを時折投稿します

ObsidianでOCRを利用する時の方法をメモ

PC関係

最近Obsidianを使っていて、コミュニティプラグインを漁っていたところ検索機能を強化するプラグイン「Omnisearch」、OCRを使える「Text Extractor」を見つけたので実際に試してみました。手順や感想をメモします。

手順

Obsidianの【設定＞コミュニティプラグイン＞コミュニティプラグイン＞閲覧】でTrash Explorer、Omnisearchを検索してインストールします
インストール後、【設定＞コミュニティプラグイン】からそれぞれの機能を有効にします
. 【設定＞Omnisearch】で以下の機能をONにします
1. PDFs content indexing
2. Images OCR indexing
【設定＞Text Extractor】でOCR Languagesに「jpn」を追加します
Obsidianを再起動します
再起動後、全てのノートのOCRが作成されるため、少々時間がかかります。
左側のサイドバーに虫眼鏡ボタンが増えているのでクリックします
「Omnisearch - Vault」という検索ウィンドウが表示されるので検索して、無事ヒットすれば成功です。

余談

日本語の場合、OCRの精度が若干低かったり、単語ごとに不要なスペースが入ってます。
例）「プラグイン」→「フラクイン」（全部半角スペース入り）
検索する時に手動で半角スペースを開ければヒットします
画像を即座にOCRとして利用したい場合は、ファイル一覧から画像を右クリックして、「Text Extractor」の項目の以下オプションを使いましょう。
- Extract Text to clipboard：OCRの文字列をクリップボードにコピーする
- Extract text into a new note：OCRの文字列でObsidian内に新しいノートを作成する
- Clear cache for this file：この画像のOCRキャッシュを削除する