重複チェックルールを入力する

説明

新しいリード、仕入先要求、またはアカウントレコードを入力するときに、同じレコードがデータベース内に既に存在している可能性があります。このような状況では、新しいレコードは重複として扱われる可能性があります。重複チェックは、バックグラウンドで自動的に実行され、データベース内に存在する類似のレコードを識別する処理です。このアクティビティは、重複検索で使用するルールを追加するために使用されます。デフォルトで納入されるルールがいくつかあります。

特定のルールは、シングルヒットとして設定することも、複合ヒットとして設定することもできます。

シングルヒット:特定のレコードを重複としてマークするには、ルール内の一つの列のみが満たされる必要があります。
複合ヒット:特定のレコードを重複としてマークするには、ルール内のすべての列を満たす必要があります。

アルゴリズム:

ルール内の異なる列に対して異なるタイプのアルゴリズムを定義して、重複を検索することができます。アルゴリズムに関する詳細は次のとおりです。

正確:
これは二つの値を比較し、0 または 1 を返します。

すべての文字に正確:すべての文字を小文字にして、二つの値を比較し、0 または 1 を返します。
数字の正確:たとえば、電話番号。数字以外の文字をすべて削除し、二つの値を比較して 0 または 1 を返します。

距離:
Oracle関数 UTL_MATCH.EDIT_DISTANCE を使用します。これは二つの値を比較し、それらの間の距離を返します。距離は挿入/削除/置換の数で測定されます。一つの文字列を他の文字列に変換するために必要な工程の最小数をカウントすることによって、二つの文字列が互いにどの程度異なるかを定量化する方法。工程は挿入、削除、または置換になります。

例:
「Michael」と「Michae」を比較すると 1 になります(最後に「l」を挿入する必要がありました)
「Michael」と「Michaell」を比較すると 1 になります(末尾の「l」を削除する必要がありました)
「Michael」と「Nichael」を比較すると 1 になります(先頭の「M」を「N」に置き換える必要がありました)

すべての文字の距離:文字列をそのまま保持し(比較前に小文字にしない)、二つの値間の距離を返します。
数字の距離:数字以外の文字をすべて削除し、二つの値間の距離を返します。

あいまい:
Oracle 関数 UTL_MATCH.JARO_WINKLER_SIMILARITY を使用します。これは、二つの文字列間の契約度を計算し、0(一致なし)から 100(完全一致)までのスコアを返します。

すべての文字があいまい:すべての文字を小文字にして、二つの値を比較し、0 から 100 までの数値を返します。
数字についてはあいまい:数字以外の文字をすべて削除し、二つの値を比較して 0 から 100 までの数値を返します。

前提条件

このアクティビティには前提条件はありません。

システムへの影響

N/A

重複チェックルールを入力する

説明

前提条件

システムへの影響

ページ

アクティビティ図

重複チェック ルールを入力する

説明

前提条件

システムへの影響

ページ

アクティビティ図

重複チェックルールを入力する