昆山(shān)杜克大(dà)學李昕:工(gōng)業4.0時代,大(dà)數據賦能智能制造的4大(dà)應用

從(cóng)最早公元前2000年(nián)文字誕生(shēng)起人(rén)類就(jiù)開始采集數據,到1998年(nián)正式提出大(dà)數據這一概念,實際上數據的發展已經橫跨了上下4000多年(nián)的時間。在這一漫長的曆史演變中,人(rén)類共經曆了四次工(gōng)業革命,從(cóng)最早以蒸汽技術(shù)爲代表的工(gōng)業1.0,到如(rú)今以智能和互聯網爲代表的工(gōng)業4.0,制造業也迎來(lái)了其全面蛻變的時刻——智能工(gōng)廠(chǎng)時代的強勢來(lái)襲。

畢業于美國(guó)卡内基梅隆大(dà)學、專注于制造業大(dà)數據研究的昆山(shān)杜克大(dà)學教授李昕認爲,在人(rén)工(gōng)智能和大(dà)數據愈發滲透的今天,如(rú)何更好地收集數據、分(fēn)析數據、利用數據才是企業根本。尤其是制造業,作(zuò)爲立國(guó)之本,量級更是驚人(rén),如(rú)何用數據助力智能制造,點“數”成金?

在李昕看(kàn)來(lái),數據分(fēn)析在制造業應用有兩大(dà)技術(shù)難點:第一個是數據變異性,第二個是工(gōng)藝的變化。對于未來(lái)大(dà)數據的發展,李昕也表示,最大(dà)痛點在于“懂(dǒng)數據又懂(dǒng)行業”的雙料人(rén)才的匮乏。在這點上,不管是學校(xiào),還(hái)是企業,都(dōu)任重道遠(yuǎn)。

以下是李昕教授在2017IT 價值峰會暨中國(guó)企業級技術(shù)峰會上的演講,經ITValue編輯整理(lǐ):

我本人(rén)主要從(cóng)事(shì)制造業大(dà)數據的研究,是台灣富士康集團總裁郭台銘先生(shēng)的大(dà)數據顧問(wèn),同時也是香港兩家公司的董事(shì)。

互聯網時代,數據暴增。目前每兩天創造的信息幾乎相(xiàng)當于人(rén)類有史以來(lái)到2003年(nián)所創造的信息總和。這是什麽概念?在美國(guó),每分(fēn)鍾就(jiù)會産生(shēng)2.04億封郵件(jiàn),Facebook上會有180萬次的點贊、20萬張照(zhào)片的上傳。而且這個量級還(hái)會随着時間不斷上升,大(dà)概每1.2年(nián)就(jiù)會翻一番。

如(rú)此龐大(dà)的數據量怎麽才能很好利用?我們先來(lái)看(kàn)一下大(dà)數據應用的現狀。過去(qù)5-10年(nián),大(dà)數據的發展主要集中在三個方向:圖像、視頻、語音。國(guó)内外很多IT公司在這三個方向上都(dōu)取得(de)了非常成功的發展。今年(nián)3月,李克強總理(lǐ)在政府工(gōng)作(zuò)報告上強調,要把人(rén)工(gōng)智能、大(dà)數據推廣到各行各業中,包括商業、醫療、制造、教育、城(chéng)市等。這意味着,未來(lái)大(dà)數據将會滲透到我們生(shēng)活的每個環節中,發揮越來(lái)越重要的作(zuò)用。

要利用數據就(jiù)要先分(fēn)析數據。大(dà)數據分(fēn)析需要兩類人(rén):數據分(fēn)析專家和行業專家,二者缺一不可(kě)。谷歌過去(qù)十年(nián)一直在推自(zì)動駕駛技術(shù),但(dàn)是兩年(nián)前意識到,自(zì)動駕駛并不是一個IT公司的數據專家就(jiù)能單獨完成的事(shì),還(hái)必須和各個整車廠(chǎng)包括本田、福特等的行業專家合作(zuò),共同研發産品。

智能工(gōng)廠(chǎng)時代全面來(lái)臨

就(jiù)制造業來(lái)說(shuō),數據量的龐大(dà)難以想象。中國(guó)具有強盛的制造業,如(rú)果利用大(dà)數據把制造業的效率提高10%,那麽創造的利潤非同小可(kě)。在美國(guó),奧巴馬時期就(jiù)提出了智能制造的戰略,歐洲老牌制造強國(guó)德國(guó)一直在提倡工(gōng)業4.0,新加坡也有明确的規定國(guó)家GDP必須有15%-20%的貢獻是來(lái)自(zì)于制造業。

沒有制造業,一個國(guó)家就(jiù)喪失了生(shēng)存之本。

回顧起來(lái),制造業的發展大(dà)概經曆了四次工(gōng)業革命。第一次工(gōng)業革命發生(shēng)于18世紀60年(nián)代,主要以蒸汽技術(shù)爲代表的工(gōng)業1.0時代;第二次工(gōng)業革命是在19世紀50年(nián)代,以電力爲主要能源的工(gōng)業2.0時代;第三次是20世紀50年(nián)代,以計(jì)算機(jī)技術(shù)爲代表,把計(jì)算機(jī)技術(shù)應用到工(gōng)業控制中的工(gōng)業3.0時代;最後一次就(jiù)是當今以智能和互聯網爲代表的第四次工(gōng)業革命即工(gōng)業4.0時代。

這次工(gōng)業革命對制造業來(lái)說(shuō)非比尋常,它意味着智能工(gōng)廠(chǎng)時代的全面來(lái)臨。什麽是智能工(gōng)廠(chǎng)?在每個工(gōng)廠(chǎng)的每個車間的每個機(jī)台上都(dōu)安裝有很多傳感器,不斷地采集數據,并對數據進行分(fēn)析,從(cóng)而優化生(shēng)産線,降低成本。這個數據量有多大(dà)?制造業有一項技術(shù)叫自(zì)動光(guāng)學檢測(AOI),每個零部件(jiàn)生(shēng)産出來(lái)後都(dōu)會被拍(pāi)照(zhào)檢驗質量的好壞。倘若按每分(fēn)鍾收集一張1M像素的圖片來(lái)估算,一台機(jī)器一天産生(shēng)的數據就(jiù)是1.5G。每個工(gōng)廠(chǎng)有N多個機(jī)台,N多個傳感器,總的數據量可(kě)想而知。

大(dà)數據提升制造流程的4大(dà)應用

這麽多數據能拿來(lái)做什麽?第一個應用就(jiù)是調度優化。

在智能車間裡(lǐ),機(jī)台與機(jī)台之間的産品傳遞主要靠機(jī)械手臂來(lái)完成,而車間與車間之間的産品傳遞則是通過傳動帶來(lái)完成。所謂調度優化就(jiù)是通過數據分(fēn)析,了解每個産品在每個機(jī)台上需要處理(lǐ)的時間,然後決定出把某個産品送到哪個機(jī)台去(qù)處理(lǐ)的最優解決方案。這個事(shì)情看(kàn)起來(lái)容易,操作(zuò)起來(lái)卻很難,正如(rú)車輛(liàng)在路(lù)上突然抛錨造成交通擁堵一樣,如(rú)果一個機(jī)台出了問(wèn)題,就(jiù)會擾亂整個調度的優化方案,更糟的是如(rú)果發現某個産品不合格,就(jiù)需要被重新發配到某個機(jī)台重新處理(lǐ),那麽就(jiù)會導緻整個調度非常複雜,處理(lǐ)不好就(jiù)會造成“擁堵”,甚至停工(gōng)。

大(dà)數據的另外一個重要應用就(jiù)是設備監控。産品制造分(fēn)許多步驟,如(rú)果第一道工(gōng)序出了故障沒有立刻發現,等生(shēng)産出來(lái)之後經檢測時才發現,那就(jiù)意味着這段時間裡(lǐ)生(shēng)産的全部産品都(dōu)要報廢。這是個很嚴重的問(wèn)題。設備監控就(jiù)是在每個機(jī)台上都(dōu)安置多個傳感器來(lái)監測設備是否有故障。美國(guó)有個大(dà)型制造企業,曾經成品率總是提不上去(qù),經多方查找後才發現,原來(lái)是一個機(jī)台在清理(lǐ)時出了問(wèn)題,早班清潔工(gōng)是從(cóng)上往下清理(lǐ),晚班清潔工(gōng)是從(cóng)下往上清理(lǐ),就(jiù)是這樣一個個小小的瑕疵就(jiù)會對整個生(shēng)産線造成幾百萬甚至幾千萬美金的損失。

第三個應用就(jiù)是虛拟測試。在制造業中,測試占整個制造成本的25%-50%,怎麽用大(dà)數據降低測試成本?最根本的一點就(jiù)是利用數據的相(xiàng)關性,也就(jiù)是用數據去(qù)分(fēn)析不同的數據量之間是否相(xiàng)關,如(rú)果存在相(xiàng)關就(jiù)可(kě)以用一個數據量去(qù)估計(jì)另一個數據量。

這裡(lǐ)有兩個例子,一個是空間的相(xiàng)關性。在集成電路(lù)制造中,一塊矽片包含很多芯片,傳統的方法是每個芯片都(dōu)要去(qù)測試,如(rú)果我們把整塊矽片看(kàn)作(zuò)是一幅圖像,那麽不同的像素對應不同的芯片,像素點之間是有相(xiàng)關性的,我們可(kě)以通過測試少數幾個像素點的值,利用統計(jì)方法來(lái)估值另外的像素點,從(cóng)而大(dà)大(dà)減少測試量。

另一個例子是給金屬塊鑽孔。鑽孔是否平整?是不是圓形?在制造業上是一個非常昂貴的測試過程。我們通過在鑽孔機(jī)上安裝各種非常廉價的傳感器,包括震動傳感器、聲音傳感器、壓力傳感器等,用這些傳感器的測試值去(qù)創建一個模型,然後預估鑽孔的平整度和質量狀況,從(cóng)而節省很大(dà)一筆成本。

第四個應用是故障追蹤。監控生(shēng)産線中産品的制造過程,發現故障的根源。故障可(kě)能是某一個機(jī)台,可(kě)能是某一種原材料,也可(kě)能是某一位操作(zuò)員(yuán)。

大(dà)數據分(fēn)析在制造業應用有兩大(dà)技術(shù)難點:第一個就(jiù)是數據變異性,不同機(jī)台,在不同時間、不同環境下的數據具有不同的統計(jì)特性,也就(jiù)是說(shuō),在這個機(jī)台上采集的數據不可(kě)能直接拿來(lái)去(qù)用于另一個機(jī)台的建模。當你(nǐ)把采集到的數據分(fēn)配到每個機(jī)台、每個時間點、每個不同的環境條件(jiàn)下去(qù)做分(fēn)析的時候,你(nǐ)會發現數據量其實并不大(dà),甚至很小。另外一個難點是工(gōng)藝的變化。制造工(gōng)藝随時間在不斷演變,同樣一個産品,今年(nián)制造出來(lái)的測試結果和明年(nián)制造出來(lái)的測試結果完全不同,因爲産線在不斷變化,這是大(dà)數據分(fēn)析的一個軟肋。我們分(fēn)析的數據都(dōu)是曆史數據,所以大(dà)數據分(fēn)析實際上就(jiù)是兩步,第一步記錄曆史數據,第二步根據這些曆史數據去(qù)預測未來(lái)。如(rú)果由于工(gōng)藝變化導緻未來(lái)和曆史是不一緻的,那麽大(dà)數據分(fēn)析的最根本假設就(jiù)已經不成立了。這也是大(dà)數據分(fēn)析的一個痛點所在。

怎麽去(qù)解決這一問(wèn)題?從(cóng)我來(lái)看(kàn),大(dà)數據未來(lái)發展的一個最大(dà)難點就(jiù)是缺乏複合型的人(rén)才。要找到一個既懂(dǒng)數據又懂(dǒng)專業領域的雙料人(rén)才非常困難,所以培養跨學科(kē)的人(rén)才是我們昆山(shān)杜克學校(xiào)的一個重要任務。

昆山(shān)杜克大(dà)學剛剛成立了一個大(dà)數據中心,裡(lǐ)面有很多昆山(shān)杜克大(dà)學的教授,以及美國(guó)杜克大(dà)學的教授,我們一起合作(zuò)緻力于中國(guó)大(dà)數據人(rén)才的培養,也希望與中國(guó)的企業合作(zuò)共同貢獻一份力量。(本文首發钛媒體(tǐ),整理(lǐ)/胡江路(lù))