[設定]-[動作設定]-[PDFコンバーター]の設定項目
[PDFコンバーター]では、PDFファイルをインポートし、XML様式ファイルを作成するときの設定をします。
変換モード
項目 | 説明 |
---|---|
定形 | PDFファイルの帳票イメージをそのままフォームに変換するモードです。 出力データのパターン分析は行いません。 |
連写 | 宛名シールや名刺一覧のような帳票イメージから、繰り返しデータのパターンを認識し、連写機能を使ったフォームへ変換するモードです。 連写領域を特定するために、横方向、および縦方向の繰り返しデータが2つ以上で構成されている必要があります。 |
サブフォーム | 売上伝票や請求書などのような表組みを使った帳票イメージからパターン認識をして、サブフォーム機能を使ったフォームへ変換するモードです。 同一Y座標にある複数のテキストデータを行データとして、複数連続した行データをサブフォーム領域として認識します。先頭行をヘッダー領域、以降の行をレコード領域として再現します。 |
繰り返し | 固定の枠内で、複数の項目が同じレイアウトを保ったまま複数行にわたって繰り返し表示されるような帳票イメージから、繰り返し機能を使ったフォームへ変換するモードです。 テキストデータとラインデータから範囲を特定し、繰り返し領域、繰り返しの行数、ピッチ、繰り返しの方向(縦方向のみ)を設定して再現します。繰り返し領域内のデータはフィールドに変換され、先頭行以外のデータは破棄されます。 |
参考
[変換モード]で設定されたモード(定形、連写、サブフォーム、繰り返し)は、PDFファイルインポート時の初期値となります。
PDFファイルの表組、テキストデータの位置によっては、レイアウトや領域内のデータが正しく取り込まれない場合があります。
フォント設定
項目 | 説明 |
---|---|
デフォルトフォント |
|
テキスト変換方法
項目 | 説明 |
---|---|
テキスト変換方法 |
参考[すべて固定文字に変換]に設定していたとしても、連写領域、サブフォーム領域、繰り返し領域内の文字列は、すべてフィールドアイテムとして変換されます。 |