なんらかの原因によって不整合(データの重複・不要なデータの存在・データそのもの間違い)が生じてしまったデータを、整合性のある状態に戻すこと。
元々、統計学や計算機科学などにおける専門用語。
近年、ビジネスの分野において「顧客データの不整合(顧客データの重複など)がビジネス上の重要な損失を発生させる」という問題意識が発生。
これに対応するためのアプリケーション“データクリーニングソフトウェア”が注目を集めるようになっている。
このキーワード(データクリーニング)の定義・補足説明 [編集]
このキーワード(データクリーニング)の定義・補足説明を編集する
用語説明
→要点
・なんらかの原因によって不整合が生じてしまったデータを、整合性のある状態に戻すこと。
→ここで言う不整合とは、データの重複・不要なデータの存在・データそのもの間違いなどを指す。
→元々、統計学や計算機科学などにおける専門用語。
→datacleaning。
・とりわけ“企業が持つ顧客データ”の不整合が、ビジネス上の重要な損失を発生させるという観点から問題になっている。
→「ひとりの顧客に複数のダイレクトメールを発送してしまう」「誤った請求書を発送してしまう」「データの不整合が原因で、顧客データそのものを失う」などのミス。
→しかしながらデータの不整合に対して危機意識を持つ企業は、まだ少ないものと見られている。
・企業が持つ顧客データに不整合が発生する原因には、以下のようなものがある。
→顧客の変化:顧客の属性(住所や電子メールアドレスなど)が変化する場合など。
→社会の変化:郵便番号の桁が増えたり市町村が合併することによって、既存のデータが無効化する場合など。
→会社の変化:合併した会社で異なるデータ形式を統合することによって生じる不整合や、顧客データの重複など。
支店が個別に持つデータを統合する場合など。
→人間の入力ミス:住所を入れるべき場所に電話番号を誤入力してしまう場合や、そもそも不要なデータが入力されている場合など。
上記の原因が人為的にフォローできていない場合も、これに含まれる。
→事故や災害:ハードディスクが強い磁界にさらされたような場合など。
但し、このような原因は非常に些少と言われている。
・近年“データクリーニングソフトウェア”というジャンルのアプリケーションが注目を集めるようになっている。
→datacleaningsoftware。
→データの整合性を検査して、それに対する警告や修正を行うもの。
→CRM(カスタマーリレーションシップマネージメント:顧客情報を統合管理する経営手法)の一環として、データ統合などのニーズが発生した際にこれが用いられることが多い。
→記事例
・2001/09/21CNETBriefsJapan
混乱したデータを「クリーニング」
→参照URL
・EvokeSoftware(★英語)
http://www.evokesoftware.com/
・Metagenix,Inc.(★英語)
http://www.metagenix.com/home.asp
・株式会社クェーサ
http://www.iissa.co.jp/quasar/qua.htm
関連リンク
データクリーニングを検索
データクリーニングを含む記事
この用語への関連リンクは、以下URLにトラックバックしてください。
