E表記や指数値を正規化する方法は?

E表記や指数値を正規化する方法は?

お知らせ:当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。


ケース 1: データセット内の列に指数表記が含まれている場合


負の指数表記と正の指数表記が含まれる列のあるデータセットを例にします。これらの指数表記の値は、小数に変換する必要があります。そのためには、分割変換を使って指数表記のある列を分割し、分割した列にFormula変換を適用してください。

指数表記の値を小数に変換する手順

1. データセットをDataPrepにインポートします。必要に応じてデータ元からインポートしてください。

データセットには、Exponent列に指数表記の値が含まれています。


2. 次に、指数表記の値が含まれるExponent列に分割変換を使用します。

列を分割するには:

  • delimiter を選択し、「選択する」をクリックして、Eの文字をハイライトします。これにより列を分割できます。選択部分は黄色で表示されます。

    メモ: この選択および変換の方法は、「Text selection transforms」と呼ばれます。こちらをクリックして詳細をご覧ください。

  • DataPrep は、画面右側のパネルに候補一覧を表示します。

  • マウスを分割変換候補に重ねると、簡易プレビューが表示されます。



  • 候補をクリックすると、データグリッド上で全体のプレビューが表示されます。

  • 候補をクリックすると、編集 適用する ボタンが候補内に表示されます。

  • 適用する」をクリックして分割変換を適用します。



3. 分割変換を適用した後、分割された列に対してFormula変換を実行し、指数表記の値を小数として取得します。

E表記の数値から小数値を抽出するFormula変換:

  • Transform」メニューをクリックし、「Formula列」オプションを選択します。

  • 新規列の名前を「新規 列 名前」項目に入力します。

  • Formula」項目に、関数名を入力することで次の関数を挿入できます。

    InfoFormula :mul(`Split_Column1`,pow(10,`Split_Column2`))

  • 適用する」をクリックします。出力は新規列に作成されます。



Notes
メモ: 指数 値が負の場合、小数値は40桁の精度と15桁のスケールをサポートします。

ここで、
精度(Precision)は数値全体の桁数です。40桁中、最大25桁まで小数点の左側に配置できます。
スケール(Scale)は小数点の右側の桁数です。

指数 値が正の場合、小数値は25桁までサポートされます。
例:1.45E-17 の場合、小数値は-15までしかサポートされないため、答えは+10、-10となります。
2.34E+26 の場合、小数値は+25までしかサポートされないため、答えは23400000000000000000000000となります。

4. ここで、結果を取得するための処理中に、いくつかの列(Exponent_split_1、Exponent_split_2)を削除します。

  1. 指数値を小数に変換したクリーンなデータセットが完成しました。


ケース2: データセット内に指数値が混在する列がある場合


数字、小数、および指数表記の値を含む列を持つデータセットを考えます。DataPrep にインポートすると、この列は数値型データとして認識されますが、指数表記の値は無効としてマークされます。これを修正するには、指数表記の値を小数に変換して有効な値にする必要があります。これを実現するには、分割変換を使用して、指数表記の値を含む列を分割し、空であるセルを「+10、-10」で埋める操作を行い、その後Formula変換を分割した列に適用します。

指数表記の値を小数に変換する手順

1. データセットをDataPrepに、必須のデータ元からインポートします。

このデータセットの「値」列には、数字・小数・指数表記の値が含まれています。

2. 次に、数字・小数・指数表記の値が含まれる「値」列に対して分割変換を使用します。

列を分割する方法:

指数表記の値を含む列を分割する手順はこちらでご覧いただけます。


2.
DataPrepでは、空であるセルを埋める変換を使用して、列内の空であるセルを補完できます。以下の手順に従い、空であるセルに値「+10」「-10」を入力します。

空であるセルを埋める方法

  • 列名を右クリックし、コンテキストメニューから空であるセルを埋めるオプションを選択します。

  • カスタム値オプションを空であるセルを埋める方法セクションから選び、「+10」「-10」と入力します。

  • DataPrepは変換中に列の有効なプレビューを表示します。

  • 必要なオプションを選択した後、適用をクリックします。




3. 分割変換を適用した後、分割した列に対してFormula変換を適用し、指数値の小数表現を取得します。

Formula変換を使用してE-notation番号から小数値を抽出する方法

Formula変換の適用手順はこちらをご参照ください。

4. このプロセスで作成された一部のカラム('Value_split_1', 'Value_split_2')を削除して、結果を取得します。


5. これで、指数表記値の小数値が含まれるクリーンなデータセットが完成しました。