Power Automate DeskTop PDFの該当箇所の文字を抽出

1.はじめに

PDFの該当箇所の文字をPower Automateのテキスト分割アクションを使用し抽出する方法を記載します。

2.PDFの該当箇所の文字抽出

2-1.抽出する文字の選択

北海道の平成24年10月1日現在の面積:[83,457,06]を抽出し、メッセージに出力します。

2-2.PDFから該当文字を抽出する流れ

2-2.詳細

Action1 PDFから全ての文字を抽出

「PDFからテキストを抽出」をダブルクリックします。

PDFファイル: 該当のPDFファイルを選択。PDFの取得URLは、「都道府県別面積の順位」か ら取得しました。
抽出するページ: 「すべて」を選択。
「保存」をクリックします。

Mainフローに「PDFからテキストを抽出」アクションが作成されました。

Action2 ①テキストの分割

「テキストの分割」をダブルクリックします。

分割するテキスト: {x}をクリックし「ExtractedPDFText」を選択。
区切り記号の種類: 「標準」のままを選択。
標準の区切り記号: 「新しい行」を選択。
回数: 「1」のままを選択。
「保存」をクリックします。

TextListに格納された値になり、Index 4に該当データが格納されています。

Mainフローに「テキストの分割」が作成されました。

Action3 ②テキストの分割

「テキストの分割」をダブルクリックします。

分割するテキスト: {x}をクリックし「TextList」を選択しIndex「[4]」を追記。
区切り記号の種類: 「標準」のままを選択。
標準の区切り記号: 「新しい行」を選択。
回数: 「1」のままを選択。
「保存」をクリックします。

TextList2に格納された値になり、TextListから該当データを抽出し格納されています。

Mainフローに2つめの「テキストの分割」が作成されました。

Action4 ③テキストの分割

「テキストの分割」をダブルクリックします。

分割するテキスト: {x}をクリックし「TextList2」を選択。
区切り記号の種類: 「標準」のままを選択。
標準の区切り記号: 「スペース」のままを選択。
回数: 「1」のままを選択。
「保存」をクリックします。

TextList3に格納された値になり、TextList2から分割し該当データがIndex 3に格納されています。

Mainフローに3つめの「テキストの分割」が作成されました。

Action5 ④テキストの分割

「テキストの分割」をダブルクリックします。

分割するテキスト: {x}をクリックし「TextList3」を選択しIndex「[3]」を追記。
区切り記号の種類: 「標準」のままを選択。
標準の区切り記号: 「スペース」のままを選択。
回数: 「1」のままを選択。
「保存」をクリックします。

TextList4に格納された値になり、該当データが格納されています。

Mainフローに4つめの「テキストの分割」が作成されました。

Action6 メッセージを表示

「メッセージを表示」をダブルクリックします。

メッセージボックスのタイトル: 「面積」を入力。
表示するメッセージ: {x}をクリックし「TextList4」を選択。
メッセージボックスアイコン: 「いいえ」のままを選択。
メッセージボックスボタン: 「OK」のままを選択。
既定のボタン: 「最初のボタン」のままを選択。
「保存」をクリックします。

Mainフローに「メッセージを表示」が作成されました。

3.実行結果

「実行」をクリックします。

フローの実行結果とPDFの該当データと一致しています。

4.まとめ

今回は、テーブル形式のPDFファイルのため「PDFからテキストを抽出」、「テキストの分割」アクションを使用しPDFファイルから該当箇所の文字を抽出しました。PDFファイルがテーブル形式でない場合は、OCR機能の使用も検討をお願いします。

コメント

タイトルとURLをコピーしました