新しいリード、仕入先要求、またはアカウントレコードを入力するときに、同じレコードがデータベース内に既に存在している可能性があります。このような状況では、新しいレコードは重複として扱われる可能性があります。重複チェックは、バックグラウンドで自動的に実行され、データベース内に存在する類似のレコードを識別する処理です。このアクティビティは、重複検索で使用するルールを追加するために使用されます。デフォルトで納入されるルールがいくつかあります。
特定のルールは、シングルヒットとして設定することも、複合ヒットとして設定することもできます。
アルゴリズム:
ルール内の異なる列に対して異なるタイプのアルゴリズムを定義して、重複を検索することができます。アルゴリズムに関する詳細は次のとおりです。
正確:
これは二つの値を比較し、0 または 1 を返します。
距離:
Oracle関数 UTL_MATCH.EDIT_DISTANCE を使用します。これは二つの値を比較し、それらの間の距離を返します。距離は挿入/削除/置換の数で測定されます。一つの文字列を他の文字列に変換するために必要な工程の最小数をカウントすることによって、二つの文字列が互いにどの程度異なるかを定量化する方法。工程は挿入、削除、または置換になります。
例:
「Michael」と「Michae」を比較すると 1 になります(最後に「l」を挿入する必要がありました)
「Michael」と「Michaell」を比較すると 1 になります(末尾の「l」を削除する必要がありました)
「Michael」と「Nichael」を比較すると 1 になります(先頭の「M」を「N」に置き換える必要がありました)
あいまい:
Oracle 関数 UTL_MATCH.JARO_WINKLER_SIMILARITY を使用します。これは、二つの文字列間の契約度を計算し、0(一致なし)から 100(完全一致)までのスコアを返します。
このアクティビティには前提条件はありません。
N/A