13 KiB
オンラインOCR
百度
百度智能云 OCR
https://ai.baidu.com/ai-doc/OCR/1k3h7y3db
百度智能云 画像翻訳
https://ai.baidu.com/ai-doc/MT/dkifdqg54
百度翻訳オープンプラットフォーム 画像翻訳
https://fanyi-api.baidu.com/product/22
腾讯
OCR 一般印刷体認識
https://cloud.tencent.com/document/product/866/33526
画像翻訳
https://cloud.tencent.com/document/product/551/17232
有道
ステップ1:開発者になる
智云プラットフォームページの右上の「登録/ログイン」ボタンをクリックし、登録して情報を完了させると、開発者になることができます。
ステップ2:コンソールにアクセスしてアプリケーションを作成する
公式サイトにログインすると、自動的に智云コンソールにリダイレクトされます。
ビジネス概要ページ / アプリケーション概要ページ / サービス詳細ページで、アプリケーション作成ボタンをクリックしてアプリケーション作成ページに入ります。
アプリケーション名を入力し、サービスと統合方法を選択し、他の重要な情報を入力して作成を完了します。
ステップ3:サービス詳細ページに入り、統合ドキュメントを表示する
コンソールの左側にあるサービス名をクリックしてサービス詳細ページに入ります。「統合方法」の下の「ドキュメント」ボタンをクリックして対応する技術ドキュメントにアクセスします。「SDKダウンロード」ボタンをクリックしてSDKをダウンロードします。「サンプル」セクションではデモを表示できます。統合プロセス中に「アプリケーションID(つまりAPPキー)」や「アプリケーションシークレットキー」などの情報が必要になる場合があります。これらの情報はアプリケーション概要で確認できます。
https://ai.youdao.com/doc.s#guide
火山
ステップ1:開発者になる
火山引擎アカウントで火山引擎コンソールにログインしてください。まだ火山引擎アカウントを持っていない場合は、今すぐ登録をクリックして火山ユーザーとして登録してください。
ステップ2:ビジュアルインテリジェンスコンソールに入る
エントリーポイント1の例
- ビジュアルインテリジェンスをクリックしてビジュアルインテリジェンスコンソールに入ります
エントリーポイント2の例
- ビジュアル関連製品のランディングページの[管理コンソール]ボタンをクリックします
エントリーポイント3の例
- AIプラットフォームのナビゲーションリストのビジュアル関連製品をクリックしてビジュアルインテリジェンスコンソールページに入ります
ステップ3:実名認証とサービスの有効化
STEP1:トップのウェルカムカードで[認証に進む]をクリックして実名認証を完了し、サービスを有効化します。実名認証が完了していない場合、認証を促すポップアップウィンドウが表示されます。
STEP2:認証が完了したら、ビジュアルインテリジェンスコンソールに入り、統合する機能を選択します。
必要な特定のサービスをページ上で直接見つけてクリックして有効化することもできます。
ステップ4:AK/SKの取得
火山引擎ビジュアルインテリジェンスコンソールのさまざまな機能を呼び出す前に、アクセスキー(AccessKey)を生成したことを確認してください。AccessKeyにはAccessKeyID(AK)とAccessKeySecret(SK)が含まれ、AccessKeyIDはユーザーを識別し、AccessKeySecretはユーザーの身元を確認するために使用されます。安全に保管してください。
取得方法:右上のアカウントをクリックし、ドロップダウンリストから[キー管理]を選択し、[新しいキーを作成]ボタンをクリックしてAK/SKを取得し、統合したアプリケーションのインターフェースを呼び出すための資格情報として使用します。
https://www.volcengine.com/docs/6790/116978
讯飞
ステップ1:開発者として登録する
讯飞オープンプラットフォームクイックログインページにアクセスし、WeChatスキャンコードまたはモバイルクイックログインでログインして讯飞オープンプラットフォームの登録開発者になります。または讯飞オープンプラットフォーム登録ページにアクセスして完全なオープンプラットフォームアカウントを登録し、讯飞オープンプラットフォームの登録開発者になります。
ステップ2:最初のアプリケーションを作成し、サービスを使用開始する
プラットフォームにログインし、右上の「コンソール」または右上のドロップダウンメニューの「マイアプリケーション」からコンソールにアクセスします。アカウントがアプリケーションを作成したことがない場合、最初のアプリケーションを作成するように案内されます。
アプリケーションに名前を付け、関連情報を入力します。送信ボタンをクリックすると、アプリケーションが作成されます。
?>注意
旧バージョンのコンソールでは、後続のSDKまたはAPI統合のためにアプリケーションのオペレーティングシステムプラットフォームタイプを指定する必要がありましたが、新バージョンの更新後、この操作は不要になり、1つのアプリケーションで全てのインターフェースを管理できます。
アプリケーションが作成されると、左側のサービスリストから使用するサービスを選択できます。サービス管理パネルでは、利用可能なクォータ、履歴使用量、サービスインターフェースの検証情報、および呼び出せるAPIとSDKを確認できます。
?>注意
すべてのサービス管理パネルが同じではありません。異なるサービスには異なる管理パネルの構成があります。また、すべてのサービスにSDKとAPIインターフェースがあるわけではありません。一部のサービスにはAPIインターフェースのみがあり、他のサービスにはSDKのみがあります。詳細は対応するサービス管理ページで確認できます。
讯飞オープンプラットフォームは1つのアカウントで複数のアプリケーションを作成することをサポートしています。アプリケーションリストページに戻ってアプリケーションを切り替えるには、ページの左上のアプリケーション名の上にある戻るボタン、または右上の個人メニューの「マイアプリケーション」をクリックします。アプリケーションリストでアプリケーションを選択し、その名前をクリックしてそのアプリケーションに対応するサービス管理ページに入ります。
同じアプリケーションAPPIDは複数のビジネスで使用できますが、複数のビジネスが1つのAPPIDを共有すると使用量を個別に追跡できないため、各ビジネスに対して個別のアプリケーションAPPIDを使用することをお勧めします。
?>注意
アカウントに複数のアプリケーションがある場合、最後に操作したアプリケーションが記録され、讯飞オープンプラットフォームに戻ったときにさまざまなサービス操作のデフォルトアプリケーションとして設定されます。
https://www.xfyun.cn/doc/platform/quickguide.html
Google Cloud Vision
https://cloud.google.com/vision/docs
docsumo
ocrspace
Gemini
翻訳と同じ
ChatGPT互換インターフェース
翻訳と同じ
オフラインOCR
manga-ocr
CPU統合パッケージ https://lunatranslator.org/Resource/IntegrationPack/manga_ocr/cpu
GPU統合パッケージ https://lunatranslator.org/Resource/IntegrationPack/manga_ocr/gpu
WeChat/QQ OCR
WeChatまたは最新バージョンのQQのインストールが必要です
WindowsOCR
WindowsOCRの追加言語サポートをインストールする方法
WindowsOCRはWindows 10およびWindows 11オペレーティングシステムのみをサポートしています。
OCR 言語パックのクエリを実行する方法
サポートされているすべての言語パックの一覧を返すには、管理者として PowerShell を開き (右クリックし、[管理者として実行] を選択します)、次のコマンドを入力します。
Get-WindowsCapability -Online | Where-Object { $_.Name -Like 'Language.OCR*' }
出力例:
Name : Language.OCR~~~el-GR~0.0.1.0
State : NotPresent
Name : Language.OCR~~~en-GB~0.0.1.0
State : NotPresent
Name : Language.OCR~~~en-US~0.0.1.0
State : Installed
Name : Language.OCR~~~es-ES~0.0.1.0
State : NotPresent
Name : Language.OCR~~~es-MX~0.0.1.0
State : NotPresent
言語と場所は省略されているため、"en-US" は "English-United States" になり、"en-GB" は "English-Great Britain" になります。 出力で使用できない言語は、OCR ではサポートされません。 State: NotPresent
言語を最初にインストールする必要があります。
OCR 言語パックをインストールする方法
次のコマンドは、"en-US" 用の OCR パックをインストールします:
$Capability = Get-WindowsCapability -Online | Where-Object { $_.Name -Like 'Language.OCR*en-US*' }
$Capability | Add-WindowsCapability -Online
OCR 言語パックを削除する方法
次のコマンドは、"en-US" の OCR パックを削除します:
$Capability = Get-WindowsCapability -Online | Where-Object { $_.Name -Like 'Language.OCR*en-US*' }
$Capability | Remove-WindowsCapability -Online
https://learn.microsoft.com/ja-jp/windows/powertoys/text-extractor#supported-languages