T 機能概要
本製品は、ファイルの中に含まれる無変換の文字データを抽出し、任意の場所に新規ファイルを作成して抽出したテキストデータを書き込みます。
暗号化、圧縮など変換をしていないシフトJISまたはユニコード(UTF16、UTF8)文字が含まれていることを条件に、どのようなファイル形式にも対応しています。
U 抽出可能な文字コード
1 シフトJIS
2 ユニコード(UTF16、リトルエンディアン)
MS Access のテーブルのフィールドに Unicode
圧縮を設定した場合など、ソフトによっては2バイトのユニコードのうちの1バイトを省略可能時には省略する機能を有するものがあります。
本製品ではこの機能を「ユニコード圧縮」と呼び、それを考慮して抽出するオプションを設けています。
3 ユニコード(UTF16、ビッグエンディアン)
4 ユニコード(UTF8)
V 抽出条件
本製品のオプションを選択することで以下の条件で抽出することが可能となります。
1 半角英数、半角記号のみ抽出
目的の文字が、半角英数、半角記号のみの場合は、必ず「半角英数、半角記号のみ抽出」にチェックを付けてください。付けない場合より正確な結果が得られる可能性があります。
2 Tabは無視
Tab情報を必要としない場合は、必ず「Tabは無視」にチェックを付けてください。付けない場合より正確な結果が得られる可能性があります。
3 最低連続バイト数
文字として有効なデータがこの数値以上連続して出現しない場合は無視します。
この数値を大きくすると、無意味な文字は減り、目的の文字を探し易くなる反面、目的の文字が抽出されない可能性もあります。
4 抽出文字コード
抽出元ファイルに含まれる抽出文字コードが判らない場合は、全てにチェックを付けたまま抽出し、抽出後に生成されたテキストファイルを順次開いて目的の文字を探しください。
抽出先のあるファイルの中に目的と思われる情報が見つかったとしても、他のファイルの中により正確な情報が含まれる場合がありますので、見落とさないようご注意ください。
また、最も正確な情報が部分によって複数のテキストファイルに分散することもありますのでご注意ください。
W 抽出例
下記のファイル形式は、弊社にて抽出に成功した例の一部です。
MS Word(シフトJIS、ユニコード(UTF16、リトルエンディアン))
MS Exel(ユニコード(UTF16、リトルエンディアン))
MS Access(ユニコード(UTF16、リトルエンディアン))
MS PowerPoint(ユニコード(UTF16、リトルエンディアン))
MS SQLサーバ(ユニコード(UTF16、リトルエンディアン))
JS 一太郎(UTF16、ビッグエンディアン)
オラクル(シフトJIS)
※上記の例のファイル形式でも、無変換の対応文字コードが含まれていない場合は、意味のある文字は抽出できませんのでご注意ください。例えば、オラクルでは文字コードが選択できますので、対応文字コード以外の文字コードで書き込まれている場合は無意味な文字しか抽出されません。
姉妹品「復元」のセット購入のご提案
お申込にあたっては、ゴミ箱を空にしたデータを復元させたり、反対にデータを二度と復元できないよう完全削除しようとするソフトウエア「復元」をセットでご購入されることをお勧めします。セット購入は、若干ですがお求めやすい価格としております。