收藏我們
Company Dynamics
從事物(wù)流系統設計,物(wù)流園區(qū)規劃,首先就要進行數據分(fēn)析,這(zhè)一觀點逐漸爲行業所接受。數據分(fēn)析分(fēn)析什(shén)麽,已經有專門的(de)教科書(shū)進行講解,不是本文的(de)重點。本文重點是談數據背後的(de)邏輯問題。
對(duì)于數據分(fēn)析,大(dà)家普遍感到困惑的(de)是分(fēn)析的(de)是否正确有用(yòng)和(hé)如何使用(yòng),哪些數據是不對(duì)的(de)和(hé)失真的(de),哪些數據需要修正,哪些數據需要補充。對(duì)這(zhè)些問題的(de)回答(dá),核心問題是探討(tǎo)數據背後的(de)邏輯,理(lǐ)清數據關系,才能正本清源,數據分(fēn)析的(de)結果才有意義。
數據失真是一種客觀存在
數據作爲反映客觀世界的(de)一種方式,有時(shí)會失真,從而使真實世界發生扭曲。失真的(de)原因很多(duō),主要有以下(xià)幾種:其一是數據記錄問題,數據記錄有記錯和(hé)數據丢失,這(zhè)一問題發生的(de)可(kě)能性非常大(dà)。數據不管是記錄在何種載體上,由于記錄手段問題,接口問題,傳感器問題,存儲媒介問題以及環境問題,錯誤和(hé)丢失在所難免;其二是人(rén)爲造假,這(zhè)個(gè)更爲普遍。造假是人(rén)類不可(kě)杜絕的(de)一個(gè)現象,每個(gè)時(shí)期,每個(gè)國家,每個(gè)地方,每個(gè)角落都存在。無論是處于何種動機,造假的(de)代價之一就是使真實世界不再真實,這(zhè)是十分(fēn)令人(rén)痛惜的(de);其三是偶發數據,雖然可(kě)能是真實反映,但又非常态,或者是經過調整後的(de)數據,并非第一手數據。
人(rén)們有時(shí)候調侃,曆史沒有真相。是指曆史上的(de)很多(duō)事件,真真假假,其真相成爲永遠(yuǎn)的(de)迷。這(zhè)裏既有曆史事件記載者的(de)故意,也(yě)有以訛傳訛的(de)原因。有的(de)真相很簡單,但如果當事人(rén)或傳播者故意誤導,可(kě)能真相真的(de)就成爲曆史之謎,再也(yě)無人(rén)知曉。
現實中的(de)實例也(yě)不勝枚舉。比如國民經濟統計,看起來(lái)很簡單的(de)一件事,但實際就很難做(zuò)到十分(fēn)真實準确,有時(shí)還(hái)相差甚遠(yuǎn)。物(wù)流行業數據統計也(yě)是如此。我們到現在也(yě)沒有一個(gè)權威的(de)統計數據,告訴人(rén)們每年的(de)堆垛機的(de)産量,輸送機的(de)産量,分(fēn)揀機的(de)産量,貨架的(de)産量等,都隻是一個(gè)大(dà)概估計。
總之,數據失真,既有技術原因,也(yě)有人(rén)爲因素,人(rén)的(de)因素又分(fēn)爲主觀故意、無心之失或能力所不能及。這(zhè)是一種客觀的(de)存在,誰也(yě)改變不了(le)。
數據之間的(de)邏輯關系
面對(duì)一個(gè)不真實數據所描述的(de)世界,人(rén)們往往難以分(fēn)辨數據真假。其實,熟悉數據分(fēn)析的(de)人(rén),一般會從數據之間的(de)邏輯關系中判斷出數據的(de)可(kě)信程度。雖然我們不知道真相的(de)具體細節,但通(tōng)過邏輯分(fēn)析和(hé)比對(duì),會基本還(hái)原真實世界大(dà)緻的(de)情況。
一句謊話(huà),往往要10句謊話(huà)去掩蓋。這(zhè)句俗語說明(míng)了(le)一個(gè)基本事實,就是事物(wù)之間是有千絲萬縷的(de)聯系的(de)。反映到數據,就是數據之間是具有邏輯關聯性的(de)。這(zhè)一事實爲人(rén)們甄别數據的(de)真僞提供了(le)參考和(hé)方法,但有時(shí)也(yě)不是萬能的(de)。
對(duì)物(wù)流數據分(fēn)析來(lái)說,年銷售額、箱單價、日收貨量、日發貨量、庫存量、退貨量、庫存周轉天數等這(zhè)幾個(gè)數據是互相影(yǐng)響的(de),所以我們可(kě)以從彼此的(de)關系中,發現問題所在,可(kě)以判斷數據是否真實可(kě)靠。
特别是在大(dà)數據時(shí)代,對(duì)事物(wù)的(de)真相判斷會更加準确。因爲大(dà)數據會從多(duō)個(gè)角度去描述同一件事情。比如一家企業的(de)運營狀況,可(kě)以從員(yuán)工人(rén)數、營業額、收入、納稅額、工資、獎金、辦公開銷、投資、研發經費、宣傳費、差旅費、按月(yuè)度計算(suàn)的(de)流水(shuǐ)等多(duō)個(gè)維度進行分(fēn)析,還(hái)可(kě)以從行業平均利潤分(fēn)析其利潤額合理(lǐ)性等。一旦某些數據出現大(dà)的(de)偏差,則可(kě)以判斷其數據真實性值得(de)懷疑。
對(duì)一個(gè)物(wù)流中心來(lái)說,很多(duō)數據之間具有強相關的(de)邏輯性。比如銷售額與發貨量的(de)匹配,輸送線的(de)輸送能力與系統産能的(de)匹配,庫存與銷售的(de)匹配,發貨區(qū)、發貨月(yuè)台與發貨量的(de)匹配等,其中的(de)邏輯關系其實并不複雜(zá)。然而,對(duì)一些用(yòng)戶來(lái)說,并不完全知曉這(zhè)些關系,從而對(duì)系統的(de)能力産生認知上的(de)錯誤。
有了(le)數據間的(de)邏輯,就爲我們處理(lǐ)數據提供了(le)參考。有些數據需要删除,有些需要修正,有些則需要補充。
數據的(de)偶然性與必然性
數學證明(míng)上有一個(gè)非常重要的(de)證明(míng)方法-反證法。即要證明(míng)一個(gè)命題是否正确,隻要證明(míng)其反命題不正确即可(kě)。而要證明(míng)一個(gè)命題不正确,則隻需舉例一個(gè)反例即可(kě)。比如要證明(míng)是無理(lǐ)數,隻要證明(míng)其反命題,即是有理(lǐ)數這(zhè)個(gè)命題是錯誤的(de)即可(kě)。這(zhè)一方法對(duì)于數據分(fēn)析也(yě)是非常有用(yòng)的(de)。
大(dà)千世界,變幻萬千。對(duì)數據分(fēn)析者而言,識别數據的(de)真僞是一方面,而如何正确的(de)分(fēn)析,則是更爲重要的(de)方面。數據分(fēn)析爲我們描述了(le)一個(gè)曆史現狀作爲前提。因此,不要站在一個(gè)錯誤的(de)前提下(xià),對(duì)未來(lái)進行預測,那樣會毫無意義,且非常危險。
如何去僞存真,不是一件容易的(de)事情,尤其對(duì)于初學者而言。比如要如何篩選和(hé)修正一些曆史的(de)數據,就是一項複雜(zá)且繁瑣的(de)工作。有些數據是客觀存在的(de),也(yě)是真實的(de)反映,但卻不具有普遍性,是一種偶然,一種異常。對(duì)這(zhè)些數據的(de)處理(lǐ),即要求對(duì)偶然和(hé)必然的(de)事件要有一個(gè)分(fēn)析和(hé)判斷。
我們常常看到,某一天的(de)物(wù)流數據非常異常,但卻是客觀存在。比如某一商品銷量很大(dà),或某一天的(de)發貨量很大(dà)等,就可(kě)能是因爲某一偶然事件所引起。而這(zhè)一事件有時(shí)并不具備普遍性。有點類似于電信号中的(de)幹擾信号。對(duì)這(zhè)一類數據的(de)過濾和(hé)修正是必要的(de)。不要一葉障目,不見泰山。
另一方面,也(yě)不要輕易放過偶發事件背後的(de)邏輯分(fēn)析,有時(shí)甚至會有意外的(de)發現和(hé)作用(yòng)。如對(duì)“雙十一”數據的(de)分(fēn)析,或對(duì)某一網紅帶貨事件的(de)分(fēn)析等,就會指導物(wù)流設計在面對(duì)此類現象時(shí),如何有效處理(lǐ)。
在數據分(fēn)析時(shí),一旦遇到特殊的(de)數據,既不能視而不見,也(yě)不能簡單的(de)删除。而是要做(zuò)進一步的(de)甄别。這(zhè)一點考驗著(zhe)分(fēn)析師的(de)敏銳和(hé)耐心。
有很多(duō)數學方法可(kě)以用(yòng)于辨别偶然性和(hé)必然性,過濾一些幹擾數據。比如,爲了(le)避免算(suàn)術平均值法給人(rén)的(de)一種假象,可(kě)以用(yòng)階梯算(suàn)術平均來(lái)修正,或采用(yòng)均方差來(lái)評估數據分(fēn)布的(de)偏離程度。我們在統計個(gè)人(rén)收入時(shí),經常看到平均數有時(shí)沒有多(duō)大(dà)意義,而階梯分(fēn)析的(de)數據更加容易看清楚數據的(de)真相,如分(fēn)析1%的(de)高(gāo)收入人(rén)群,其對(duì)财富的(de)占比等。階梯算(suàn)術平均法在分(fēn)析物(wù)流數據時(shí),很容易得(de)到庫存和(hé)發貨的(de)ABC分(fēn)布結果。更加深入細緻的(de)分(fēn)析,還(hái)可(kě)以進一步對(duì)标準差進行分(fēn)析,從而有助于确定設計指标。例如在一個(gè)物(wù)流中心的(de)設計中,人(rén)們常常需要一個(gè)較合适的(de)設計目标。這(zhè)一目标的(de)确定就跟标準差有關。最簡單的(de)做(zuò)法是,約70%天數的(de)作業在常規時(shí)間完成,其它30%天數的(de)作業通(tōng)過加班完成,這(zhè)可(kě)能是一個(gè)比較合理(lǐ)的(de)尺度。
物(wù)流數據背後的(de)邏輯
在實際應用(yòng)中,抽樣統計在統計中有非常大(dà)的(de)作用(yòng)。比如市場(chǎng)調查和(hé)輿情調查,目前還(hái)基本采用(yòng)這(zhè)一方法。我們在物(wù)流作業中,往往也(yě)采用(yòng)随機抽樣的(de)方法,對(duì)産品質量進行評估。爲什(shén)麽1%甚至更低的(de)随機抽樣會大(dà)緻反映真實情況呢(ne)?這(zhè)就是概率論給我們帶來(lái)的(de)啓示。其實,我們在做(zuò)物(wù)流數據分(fēn)析時(shí),随機抽樣仍然不失爲一種有效的(de)方法。
對(duì)很多(duō)系統來(lái)說,數據反映的(de)往往隻是表象。比如,人(rén)們對(duì)于一個(gè)物(wù)流中心的(de)評估,每年的(de)發貨量反映的(de)其實隻是一個(gè)非常粗略的(de)總數,背後隐藏的(de)真相往往大(dà)相徑庭,兩個(gè)具有同樣發貨能力的(de)物(wù)流中心,往往不具有可(kě)比性。因爲差異是多(duō)方面的(de)。
1)工作時(shí)間
從大(dà)的(de)方面講,工作時(shí)間可(kě)能是單班、雙班和(hé)三班,其差異已經是非常大(dà)的(de)了(le)。而進一步分(fēn)析,每個(gè)班次有的(de)隻有4~5小時(shí),有的(de)會有9~10小時(shí),差異也(yě)很大(dà)。有的(de)年工作360天,有的(de)隻有200多(duō)天。這(zhè)些差異,會導緻分(fēn)析的(de)結果出入很大(dà)。
2)單元貨物(wù)的(de)價值
單箱價格也(yě)是影(yǐng)響非常大(dà)的(de)因素。物(wù)流系統能夠比較的(de)是物(wù)流量而非銷售額。但往往被人(rén)們忽視。就如同錯把物(wù)流費用(yòng)與GDP做(zuò)比較,不考慮産業結構、地域、道路收費、工資等差異,從而得(de)出我國物(wù)流技術水(shuǐ)平低的(de)結論一樣,其實是不真實的(de)。一個(gè)以日用(yòng)、食品配送爲主的(de)配送中心,其單件價格隻有幾十元,而一件藥品會高(gāo)達上千元甚至幾千元,即使是同類商品,因爲構成品質不一緻,産地不一樣,價格也(yě)會相差很大(dà)。比如進口産品和(hé)國産的(de)比較。
3)業務的(de)均衡性
有的(de)配送中心,其業務波動性大(dà),随季節變化(huà)幅度非常大(dà),而有的(de)會比較均勻。這(zhè)在數據分(fēn)析時(shí)容易被忽視。但其影(yǐng)響巨大(dà),比如圖書(shū)與醫藥。圖書(shū),尤其是教材教輔類圖書(shū)表現出明(míng)顯的(de)季節性,而藥品的(de)季節性影(yǐng)響就要低很多(duō)。如果再細分(fēn)到每一天,每一周,每一個(gè)月(yuè)和(hé)每一季度的(de)話(huà),會得(de)到非常驚人(rén)的(de)結果。如何均衡業務,其實對(duì)于提升物(wù)流系統的(de)處理(lǐ)能力有非常大(dà)的(de)作用(yòng)。這(zhè)就是物(wù)流反過來(lái)促進管理(lǐ),促進市場(chǎng)的(de)典型例子。與此類似的(de)還(hái)有庫存周期和(hé)庫存量,這(zhè)兩個(gè)指标其實決定了(le)物(wù)流中心處理(lǐ)能力的(de)天花闆,但又不是物(wù)流系統本身所能解決的(de)問題,必須要與采購(gòu)策略進行聯動。總體來(lái)說,我國很多(duō)行業的(de)物(wù)流管理(lǐ)還(hái)是粗放的(de),可(kě)以優化(huà)的(de)方面很多(duō),而業務均衡性則是一個(gè)有很大(dà)潛力的(de)優化(huà)目标。
4)拆零比
随著(zhe)電子商務的(de)興起,拆零作業在物(wù)流配送中心的(de)比重越來(lái)越大(dà),也(yě)嚴重影(yǐng)響了(le)物(wù)流作業的(de)效率。一方面,人(rén)們看到定制化(huà)帶來(lái)的(de)服務提升,另一方面,配送成本也(yě)随之大(dà)幅度提升。特别是最近幾年,圍繞拆零揀選的(de)技術投入大(dà)幅度提升。面對(duì)這(zhè)一現狀,對(duì)于toB業務,是否可(kě)以從提高(gāo)整件配送比例出發,降低物(wù)流成本,成爲一個(gè)新的(de)課題。即使對(duì)于拆零揀選,如何采用(yòng)單元化(huà)技術,使揀選更高(gāo)效,其意義是多(duō)方面的(de),未來(lái)肯定會成爲企業關注的(de)方向。
除此之外,可(kě)比較的(de)方面還(hái)有很多(duō),如作業人(rén)員(yuán)的(de)數量,設備的(de)投入,自動化(huà)水(shuǐ)平等,均影(yǐng)響物(wù)流配送中心的(de)作業和(hé)業績,有些還(hái)互相關聯和(hé)影(yǐng)響。而這(zhè)些都是表面數據看不到的(de),或表現不出來(lái)的(de)。
總之,數據分(fēn)析不是簡單的(de)數據堆砌和(hé)結果呈現,而是要挖掘其背後隐藏的(de)真相。數據分(fēn)析的(de)價值在于發現數據背後的(de)邏輯和(hé)特征,找出普遍性和(hé)規律性的(de)東西,找出導緻問題發生的(de)根本原因和(hé)改進方向,從而指導未來(lái)進行的(de)科學預測和(hé)規劃。
部分(fēn)圖片來(lái)源于網絡
下(xià)一篇:伍強精品課堂:“綠色物(wù)流”是物(wù)流先進性的(de)關鍵指标