隨著信息時代數(shù)據(jù)量的劇增,深化物流管理的方法是在其中引入數(shù)據(jù)挖掘技術,充分合理的利用數(shù)據(jù)挖掘技術,可以進行市場預測和分析,這必將為正確的決策奠定堅實的基礎。本文介紹數(shù)據(jù)挖掘技術的概念及方法,并結合物流企業(yè)的管理,闡述數(shù)據(jù)挖掘技術在物流企業(yè)中的具體應用。
1.引 言
物流需求的個性化、多樣化和集成化,要求物流服務企業(yè)必須不斷改進和優(yōu)化企業(yè)的運作流程,開發(fā)出具有針對性的物流服務,以適應物流市場發(fā)展的變化。數(shù)據(jù)挖掘技術,以其強大關聯(lián)、分類、預測等功能,可將物流企業(yè)運營過程中產生的信息數(shù)據(jù)進行有效整合處理,為物流企業(yè)的決策提供依據(jù)。
2.數(shù)據(jù)挖掘技術
數(shù)據(jù)挖掘又稱為基于數(shù)據(jù)庫的知識發(fā)現(xiàn),是從大量的、不完全的、模糊的、隨機的實際應用數(shù)據(jù)中,提取隱含在其中的、潛在有用的信息和知識的過程。它不僅僅局限于對數(shù)據(jù)的查詢和訪問,主要在于找出數(shù)據(jù)之間的潛在聯(lián)系。從企業(yè)角度看,數(shù)據(jù)挖掘是一種企業(yè)信息處理技術,特點是對企業(yè)數(shù)據(jù)庫中的數(shù)據(jù)進行抽取、轉換、分析等,從中提取可用于輔助企業(yè)決策的關鍵數(shù)據(jù)。數(shù)據(jù)挖掘的目標是從大量數(shù)據(jù)中,發(fā)現(xiàn)隱藏于其后的規(guī)律或數(shù)據(jù)間的關系,從而服務于決策。數(shù)據(jù)挖掘方法有很多種,其中比較典型的有關聯(lián)分析、序列模式分析、分類分析、聚類分析等。
(1)關聯(lián)分析
數(shù)據(jù)關聯(lián)是數(shù)據(jù)庫中存在的一類重要的可被發(fā)現(xiàn)的知識。若兩個或多個變量的取值之問存在某種規(guī)律性,就稱為關聯(lián)。關聯(lián)分析即利用關聯(lián)規(guī)則進行數(shù)據(jù)挖掘,而關聯(lián)規(guī)則是描述事物之間同時出現(xiàn)的規(guī)律的知識模式,關聯(lián)分析的目的是為挖掘出隱藏在數(shù)據(jù)間的相互關系。
(2)序列模式分析
序列模式分析和關聯(lián)分析相似,他把數(shù)據(jù)之問的關聯(lián)性與時間性聯(lián)系起來,為了發(fā)現(xiàn)序列模式,不僅需要知道事件是否發(fā)生,而且需要確定事件發(fā)生的時間。其目的也是為了挖掘數(shù)據(jù)之間的聯(lián)系,但序列模式分析的側重點在于分析數(shù)據(jù)問的前后或因果關系。
(3)分類分析
分類分析就是分析樣本數(shù)據(jù)庫中的數(shù)據(jù),為每個類別做出準確的描述建立分析模型或挖掘出分類規(guī)則,然后用這個分類規(guī)則對其他記錄進行分類,能夠把數(shù)據(jù)集中的數(shù)據(jù)映射到某個給定的類上,其輸入集是一組記錄集合和幾種標記。
(4)聚類分析
與分類分析不同,聚類分析法的輸入集是一組未標定的記錄,也就是說此時輸入的記錄還沒有進行任何分類。其目的是根據(jù)一定的規(guī)則,合理地劃分記錄集合,使組之間的差別盡可能大,組內的差別盡可能小。
3.數(shù)據(jù)挖掘技術在物流企業(yè)中的應用
現(xiàn)代物流信息系統(tǒng)是一個龐大復雜的系統(tǒng),特別是全程物流,包括運輸、倉儲、配送、搬運、包裝和物流再加工等諸多環(huán)節(jié),每個環(huán)節(jié)信息流量十分巨大。以往物流企業(yè)主要利用信息的有效溝通、快速傳達、物流運作調控和輔助決策的功能,而很少挖掘信息中的有用數(shù)據(jù)。但隨著市場競爭的加劇、企業(yè)精細化管理愿望的增強以及先進技術方法的開發(fā)應用,對信息中的數(shù)據(jù)進行挖掘利用已成為物流企業(yè)贏取客戶、增加利潤、提升自身競爭力的有效途徑。
3.1 數(shù)據(jù)倉庫的建立
數(shù)據(jù)倉庫作為數(shù)據(jù)挖掘的基礎,不同于傳統(tǒng)的聯(lián)機事務處理系統(tǒng),它具有面向主題的、集成的、不可更新以及隨時間變化的特性。各個聯(lián)機事務處理系統(tǒng)作為數(shù)據(jù)倉庫的原始數(shù)據(jù)源,以文件方式提供企業(yè)在日?;顒又惺占陌ǘㄘ泦?、存貨單、應付帳、交易條款、客戶情況等在內的大量數(shù)據(jù)資料和報表。同時還有大量的外部信息等數(shù)據(jù)。數(shù)據(jù)倉庫通過ETL過程(抽取、轉換和加載)處理這些接口文件,并且按不同的主題域組織、存儲和管理這些客戶數(shù)據(jù)。通過數(shù)據(jù)倉庫接口,對數(shù)據(jù)倉庫中的數(shù)據(jù)進行聯(lián)機分析和數(shù)據(jù)挖掘。在建立完成企業(yè)級的信息數(shù)據(jù)倉庫之后,可以基于這個數(shù)據(jù)倉庫平臺進行數(shù)據(jù)挖掘工作。
3.2 物流企業(yè)中的數(shù)據(jù)挖掘
一般來講,數(shù)據(jù)挖掘在物流企業(yè)中可以應用在以下幾方面:
1)市場預測
產品在進入市場后,并不會永遠保持銷量。一般來講,隨著時間的推移,產品會遵守銷量變化的模式,經歷四個階段,即導入期、增長期、成熟期和衰退期。在各個階段,產品的生產要求和實物分撥策略是不同的。如在導入期,產品逐步得到市場的認可,銷售量可能會快速的增長,這時需要提前的生產計劃、生產作業(yè)安排以及適合的庫存和運輸策略,指導企業(yè)的生產,合理地控制庫存和安排運輸。數(shù)據(jù)挖掘可以作為市場預測的手段,通過聚類和預測工具,達到上述目的。
2)物流中心的選擇
物流中心(流通中心、配送中心)選址問題即求解運輸成本、變動處理成本和固定成本等之和為最小的最小化問題。
物流中心選址,需要考慮到中心點數(shù)量和中心點如何分布等情況。針對這一問題,可以用數(shù)據(jù)挖掘中的分類樹方法來加以解決。分類樹 (classification)的目標是連續(xù)的劃分數(shù)據(jù),使依賴變量的差別。分類樹的真正的目的是將數(shù)據(jù)分類(classify)到不同組或分支中,在依賴變量的值上建立劃分。用分類樹的方法解決這個問題時,通常需要以下四個方面的數(shù)據(jù):1)中心點的位置;2)每個中心點的業(yè)務需求量;3)備選點的位置;4)在中心點和備選點之間的距離。
通過分類樹的方法,不僅確定了中心點的位置,同時也確定每年各個地址問物品的運輸量,使整個企業(yè)必要的銷售量得到保證。企業(yè)的長期折現(xiàn)的總成本也會達到最小值。
3)優(yōu)化配送路徑
配送路徑是個典型的非線性問題,它一直影響著物流企業(yè)配送效率的提高。在許多配送體系中,管理人員需要采取有效的配送策略以提高服務水平、降低貨運費用。其中要考慮車輛的路徑問題,車輛路徑問題是為一些車輛確定一些客戶的路徑,每一客戶只能被訪問一次,且每條路徑上的客戶需求量之和不能超過車輛的承載能力。其次還應考慮到車輛的利用能力,如果車輛在運輸過程中的空載率過高或整車的承載力未完全利用,這些無疑會增加企業(yè)的運輸成本;另外涉及到車輛的運輸能力,就必須考慮到貨品的規(guī)格大小和利潤價值的大小。
數(shù)據(jù)挖掘中的遺傳算法為配送路徑的優(yōu)化提供了新的工具,它可以把在局部優(yōu)化時的路線繼承下來,應用于整體,而其他剩余的部分則結合區(qū)域周圍的剩余部分 (即非遺傳的部分)進行優(yōu)化。如此下去,逐漸把其他的區(qū)域并入優(yōu)化的范疇,最后擴展到整體,模型得出的信息即可用來決策輸出,即根據(jù)每次配送顧客數(shù)量的不同、顧客位置的不同,以及相應訂貨量的不同,輸出本次送貨線路車輛調度的動態(tài)優(yōu)化方案。
4)合理安排商品的倉儲
商品的合理儲位對于倉容利用率、儲存搬運分揀效率的提高具有重要的意義。對于商品量大、出貨頻率快的物流中心來講,商品儲位就意味著工作效率和效益,要真正解決好這個問題,數(shù)據(jù)挖掘是必不可少的。
如何合理安排貨品的存儲、壓縮貨品的存儲成本正成為現(xiàn)代物流管理者不斷思考的問題,對于貨品的存放問題,哪些貨品放在一起可以提高揀貨效率?哪些貨品放在一起卻達不到這樣的效果呢?可以利用以往的商品流動數(shù)據(jù),采取數(shù)據(jù)挖掘中的關聯(lián)模式來分析解決這個問題。
關聯(lián)模式分析的目的就是為了挖掘出隱藏在數(shù)據(jù)間的相互關系,即通過量化的數(shù)字,描述A類產品的出現(xiàn)對B類產品的出現(xiàn)有多大影響,可以用四個屬性來描述關聯(lián)規(guī)則:
??尚哦龋涸诋a品集A出現(xiàn)的前提下,B出現(xiàn)的概率
。支持度:產品集A、B同時出現(xiàn)的概率
。期望可信度:產品集B出現(xiàn)的概率
。作用度可信度:對期望可信度的比值
通過上述關聯(lián)分析可以得出一個關于同時購買商品的簡單規(guī)則,從而來決定這兩種貨品在貨架上的配置,可以戰(zhàn)略性的布置貨品在倉庫中的位置,以促進交叉銷售和某類交易模式。
5)顧客價值分析
根據(jù)市場營銷的原則,對待不同類型的顧客所提供的服務水平也應該有所不同的。通過分析客戶對物流服務的應用頻率、持續(xù)性等指標來判別客戶的忠誠度,通過對交易數(shù)據(jù)的詳細分析來鑒別哪些是物流企業(yè)希望保持的客戶,通過挖掘找到流失客戶的共同特征,就可以在那些具有相似特征的客戶還未流失之前進行針對性的彌補。
6)物流需求預測
物流企業(yè)規(guī)劃和控制物流活動需要準確估計供應鏈中所處理的產品和服務的數(shù)量,這些估計主要采用預測和推算的方式。數(shù)據(jù)挖掘可以對物流活動中的產品和服務類型隨時問變化的規(guī)律和趨勢進行建模描述。時間趨勢分析可以對現(xiàn)有商品在時間上的變化找出趨勢,然后確定需要注意和開發(fā)商品的類型??臻g趨勢分析可以根據(jù)地理位置的變化找到趨勢,然后確定以往重點發(fā)展的區(qū)域,這對于物流企業(yè)長遠的發(fā)展也是至關重要的。
4.結束語
數(shù)據(jù)挖掘技術已經在商業(yè)、金融業(yè)、保險業(yè)、電信業(yè)等多個領域開始得到應用,取得了令人滿意的效果。我國物流企業(yè)在數(shù)據(jù)挖掘應用方面還處于起步階段,經驗不足,應用實踐在國內物流企業(yè)中還并不多見。但隨著數(shù)據(jù)挖掘應用研究的深入開展,以及物流企業(yè)追求運營績效愿望的增強,將會有越來越多的物流企業(yè)引入數(shù)據(jù)挖掘,為各物流企業(yè)在激烈的競爭中掌握主動,在未來的發(fā)展中提供更廣闊的空間,發(fā)揮重要的作用,數(shù)據(jù)挖掘在物流企業(yè)管理中將會有更加廣闊的前景。
1.引 言
物流需求的個性化、多樣化和集成化,要求物流服務企業(yè)必須不斷改進和優(yōu)化企業(yè)的運作流程,開發(fā)出具有針對性的物流服務,以適應物流市場發(fā)展的變化。數(shù)據(jù)挖掘技術,以其強大關聯(lián)、分類、預測等功能,可將物流企業(yè)運營過程中產生的信息數(shù)據(jù)進行有效整合處理,為物流企業(yè)的決策提供依據(jù)。
2.數(shù)據(jù)挖掘技術
數(shù)據(jù)挖掘又稱為基于數(shù)據(jù)庫的知識發(fā)現(xiàn),是從大量的、不完全的、模糊的、隨機的實際應用數(shù)據(jù)中,提取隱含在其中的、潛在有用的信息和知識的過程。它不僅僅局限于對數(shù)據(jù)的查詢和訪問,主要在于找出數(shù)據(jù)之間的潛在聯(lián)系。從企業(yè)角度看,數(shù)據(jù)挖掘是一種企業(yè)信息處理技術,特點是對企業(yè)數(shù)據(jù)庫中的數(shù)據(jù)進行抽取、轉換、分析等,從中提取可用于輔助企業(yè)決策的關鍵數(shù)據(jù)。數(shù)據(jù)挖掘的目標是從大量數(shù)據(jù)中,發(fā)現(xiàn)隱藏于其后的規(guī)律或數(shù)據(jù)間的關系,從而服務于決策。數(shù)據(jù)挖掘方法有很多種,其中比較典型的有關聯(lián)分析、序列模式分析、分類分析、聚類分析等。
(1)關聯(lián)分析
數(shù)據(jù)關聯(lián)是數(shù)據(jù)庫中存在的一類重要的可被發(fā)現(xiàn)的知識。若兩個或多個變量的取值之問存在某種規(guī)律性,就稱為關聯(lián)。關聯(lián)分析即利用關聯(lián)規(guī)則進行數(shù)據(jù)挖掘,而關聯(lián)規(guī)則是描述事物之間同時出現(xiàn)的規(guī)律的知識模式,關聯(lián)分析的目的是為挖掘出隱藏在數(shù)據(jù)間的相互關系。
(2)序列模式分析
序列模式分析和關聯(lián)分析相似,他把數(shù)據(jù)之問的關聯(lián)性與時間性聯(lián)系起來,為了發(fā)現(xiàn)序列模式,不僅需要知道事件是否發(fā)生,而且需要確定事件發(fā)生的時間。其目的也是為了挖掘數(shù)據(jù)之間的聯(lián)系,但序列模式分析的側重點在于分析數(shù)據(jù)問的前后或因果關系。
(3)分類分析
分類分析就是分析樣本數(shù)據(jù)庫中的數(shù)據(jù),為每個類別做出準確的描述建立分析模型或挖掘出分類規(guī)則,然后用這個分類規(guī)則對其他記錄進行分類,能夠把數(shù)據(jù)集中的數(shù)據(jù)映射到某個給定的類上,其輸入集是一組記錄集合和幾種標記。
(4)聚類分析
與分類分析不同,聚類分析法的輸入集是一組未標定的記錄,也就是說此時輸入的記錄還沒有進行任何分類。其目的是根據(jù)一定的規(guī)則,合理地劃分記錄集合,使組之間的差別盡可能大,組內的差別盡可能小。
3.數(shù)據(jù)挖掘技術在物流企業(yè)中的應用
現(xiàn)代物流信息系統(tǒng)是一個龐大復雜的系統(tǒng),特別是全程物流,包括運輸、倉儲、配送、搬運、包裝和物流再加工等諸多環(huán)節(jié),每個環(huán)節(jié)信息流量十分巨大。以往物流企業(yè)主要利用信息的有效溝通、快速傳達、物流運作調控和輔助決策的功能,而很少挖掘信息中的有用數(shù)據(jù)。但隨著市場競爭的加劇、企業(yè)精細化管理愿望的增強以及先進技術方法的開發(fā)應用,對信息中的數(shù)據(jù)進行挖掘利用已成為物流企業(yè)贏取客戶、增加利潤、提升自身競爭力的有效途徑。
3.1 數(shù)據(jù)倉庫的建立
數(shù)據(jù)倉庫作為數(shù)據(jù)挖掘的基礎,不同于傳統(tǒng)的聯(lián)機事務處理系統(tǒng),它具有面向主題的、集成的、不可更新以及隨時間變化的特性。各個聯(lián)機事務處理系統(tǒng)作為數(shù)據(jù)倉庫的原始數(shù)據(jù)源,以文件方式提供企業(yè)在日?;顒又惺占陌ǘㄘ泦?、存貨單、應付帳、交易條款、客戶情況等在內的大量數(shù)據(jù)資料和報表。同時還有大量的外部信息等數(shù)據(jù)。數(shù)據(jù)倉庫通過ETL過程(抽取、轉換和加載)處理這些接口文件,并且按不同的主題域組織、存儲和管理這些客戶數(shù)據(jù)。通過數(shù)據(jù)倉庫接口,對數(shù)據(jù)倉庫中的數(shù)據(jù)進行聯(lián)機分析和數(shù)據(jù)挖掘。在建立完成企業(yè)級的信息數(shù)據(jù)倉庫之后,可以基于這個數(shù)據(jù)倉庫平臺進行數(shù)據(jù)挖掘工作。
3.2 物流企業(yè)中的數(shù)據(jù)挖掘
一般來講,數(shù)據(jù)挖掘在物流企業(yè)中可以應用在以下幾方面:
1)市場預測
產品在進入市場后,并不會永遠保持銷量。一般來講,隨著時間的推移,產品會遵守銷量變化的模式,經歷四個階段,即導入期、增長期、成熟期和衰退期。在各個階段,產品的生產要求和實物分撥策略是不同的。如在導入期,產品逐步得到市場的認可,銷售量可能會快速的增長,這時需要提前的生產計劃、生產作業(yè)安排以及適合的庫存和運輸策略,指導企業(yè)的生產,合理地控制庫存和安排運輸。數(shù)據(jù)挖掘可以作為市場預測的手段,通過聚類和預測工具,達到上述目的。
2)物流中心的選擇
物流中心(流通中心、配送中心)選址問題即求解運輸成本、變動處理成本和固定成本等之和為最小的最小化問題。
物流中心選址,需要考慮到中心點數(shù)量和中心點如何分布等情況。針對這一問題,可以用數(shù)據(jù)挖掘中的分類樹方法來加以解決。分類樹 (classification)的目標是連續(xù)的劃分數(shù)據(jù),使依賴變量的差別。分類樹的真正的目的是將數(shù)據(jù)分類(classify)到不同組或分支中,在依賴變量的值上建立劃分。用分類樹的方法解決這個問題時,通常需要以下四個方面的數(shù)據(jù):1)中心點的位置;2)每個中心點的業(yè)務需求量;3)備選點的位置;4)在中心點和備選點之間的距離。
通過分類樹的方法,不僅確定了中心點的位置,同時也確定每年各個地址問物品的運輸量,使整個企業(yè)必要的銷售量得到保證。企業(yè)的長期折現(xiàn)的總成本也會達到最小值。
3)優(yōu)化配送路徑
配送路徑是個典型的非線性問題,它一直影響著物流企業(yè)配送效率的提高。在許多配送體系中,管理人員需要采取有效的配送策略以提高服務水平、降低貨運費用。其中要考慮車輛的路徑問題,車輛路徑問題是為一些車輛確定一些客戶的路徑,每一客戶只能被訪問一次,且每條路徑上的客戶需求量之和不能超過車輛的承載能力。其次還應考慮到車輛的利用能力,如果車輛在運輸過程中的空載率過高或整車的承載力未完全利用,這些無疑會增加企業(yè)的運輸成本;另外涉及到車輛的運輸能力,就必須考慮到貨品的規(guī)格大小和利潤價值的大小。
數(shù)據(jù)挖掘中的遺傳算法為配送路徑的優(yōu)化提供了新的工具,它可以把在局部優(yōu)化時的路線繼承下來,應用于整體,而其他剩余的部分則結合區(qū)域周圍的剩余部分 (即非遺傳的部分)進行優(yōu)化。如此下去,逐漸把其他的區(qū)域并入優(yōu)化的范疇,最后擴展到整體,模型得出的信息即可用來決策輸出,即根據(jù)每次配送顧客數(shù)量的不同、顧客位置的不同,以及相應訂貨量的不同,輸出本次送貨線路車輛調度的動態(tài)優(yōu)化方案。
4)合理安排商品的倉儲
商品的合理儲位對于倉容利用率、儲存搬運分揀效率的提高具有重要的意義。對于商品量大、出貨頻率快的物流中心來講,商品儲位就意味著工作效率和效益,要真正解決好這個問題,數(shù)據(jù)挖掘是必不可少的。
如何合理安排貨品的存儲、壓縮貨品的存儲成本正成為現(xiàn)代物流管理者不斷思考的問題,對于貨品的存放問題,哪些貨品放在一起可以提高揀貨效率?哪些貨品放在一起卻達不到這樣的效果呢?可以利用以往的商品流動數(shù)據(jù),采取數(shù)據(jù)挖掘中的關聯(lián)模式來分析解決這個問題。
關聯(lián)模式分析的目的就是為了挖掘出隱藏在數(shù)據(jù)間的相互關系,即通過量化的數(shù)字,描述A類產品的出現(xiàn)對B類產品的出現(xiàn)有多大影響,可以用四個屬性來描述關聯(lián)規(guī)則:
??尚哦龋涸诋a品集A出現(xiàn)的前提下,B出現(xiàn)的概率
。支持度:產品集A、B同時出現(xiàn)的概率
。期望可信度:產品集B出現(xiàn)的概率
。作用度可信度:對期望可信度的比值
通過上述關聯(lián)分析可以得出一個關于同時購買商品的簡單規(guī)則,從而來決定這兩種貨品在貨架上的配置,可以戰(zhàn)略性的布置貨品在倉庫中的位置,以促進交叉銷售和某類交易模式。
5)顧客價值分析
根據(jù)市場營銷的原則,對待不同類型的顧客所提供的服務水平也應該有所不同的。通過分析客戶對物流服務的應用頻率、持續(xù)性等指標來判別客戶的忠誠度,通過對交易數(shù)據(jù)的詳細分析來鑒別哪些是物流企業(yè)希望保持的客戶,通過挖掘找到流失客戶的共同特征,就可以在那些具有相似特征的客戶還未流失之前進行針對性的彌補。
6)物流需求預測
物流企業(yè)規(guī)劃和控制物流活動需要準確估計供應鏈中所處理的產品和服務的數(shù)量,這些估計主要采用預測和推算的方式。數(shù)據(jù)挖掘可以對物流活動中的產品和服務類型隨時問變化的規(guī)律和趨勢進行建模描述。時間趨勢分析可以對現(xiàn)有商品在時間上的變化找出趨勢,然后確定需要注意和開發(fā)商品的類型??臻g趨勢分析可以根據(jù)地理位置的變化找到趨勢,然后確定以往重點發(fā)展的區(qū)域,這對于物流企業(yè)長遠的發(fā)展也是至關重要的。
4.結束語
數(shù)據(jù)挖掘技術已經在商業(yè)、金融業(yè)、保險業(yè)、電信業(yè)等多個領域開始得到應用,取得了令人滿意的效果。我國物流企業(yè)在數(shù)據(jù)挖掘應用方面還處于起步階段,經驗不足,應用實踐在國內物流企業(yè)中還并不多見。但隨著數(shù)據(jù)挖掘應用研究的深入開展,以及物流企業(yè)追求運營績效愿望的增強,將會有越來越多的物流企業(yè)引入數(shù)據(jù)挖掘,為各物流企業(yè)在激烈的競爭中掌握主動,在未來的發(fā)展中提供更廣闊的空間,發(fā)揮重要的作用,數(shù)據(jù)挖掘在物流企業(yè)管理中將會有更加廣闊的前景。