183.17.231.* 2020-07-21 13:16:00 |
要實現對數據價值的深度發掘,數據挖掘技術無疑是**的手段之一。對于企業來說,要開展數據挖掘項目,就必須要了解數據挖掘項目是區別于傳統的軟件開發類項目,其呈現出復雜性高、周期長、不確定高等特點,特別是不確定性高,是其典型的特點,主要體現在數據的不確定性、結果的不確定性和方案的不確性等方面,這樣就導致整個數據挖掘項目管控難度高,因此一個行之**的數據挖掘方法論(明確的流程模型)是非常有必要的。
行業數據挖掘方法論都有哪些?
長期以來,隨著數據挖掘市場的發展和成熟,由不同的組織機構提出過很多的方法論,如CRISP-DM、SEMMA、*等。
1、業務理解(business understanding)
業務理解,指從業務角度來理解項目目標和要求,接著把這些理解知識轉換成數據挖掘問題的定義和實現目標的初規劃。
2、數據理解(data understanding)
數據理解,指從數據收集開始,然后接著是一系列活動,這些活動的目的是:熟悉數據,甄別數據質量問題、發現對數據的真知灼見、或者探索出令人感興趣的數據子集并形成對隱藏信息的假設。
3、數據準備(data preparation)
數據準備,指從初原始數據構建終建模數據的全部活動。數據準備很可能被執行多次并且不以任何既定的秩序進行。包括為建模工作準備數據的選擇、轉換、清洗、構造、整合及格式化等多種數據預處理工作。
4、建立模型(modeling)
建立模型,指選擇和使用各種建模技術,并對其參數進行調優。一般地,相同數據挖掘問題類型會有幾種技術手段。某些技術對于數據形式有特殊規定,這通常需要重新返回到數據準備階段。
數據挖掘有哪些主要步驟.中琛魔方大數據分析平臺(www.zcmorefun.com)表示數據挖掘是使用模式識別邏輯來識別樣本數據集中的趨勢,并根據更大的數據池推斷這些信息,而數據倉庫是提取和存儲數據以便于報告的過程。 |