市場學上曾經有這樣的一個經典案例──「啤酒與尿片」。雜貨零售店通過數據挖掘,發現逢星期五晚,尿片和啤酒的銷量具有關聯性。後來,發現這種關聯性,源於男士下班後,往往會被要求順路購買尿片回家,而男士又會順便為自己採購啤酒,於是令兩者出現關連性。
儘管這只是一個市場學的舊故事,但其啟發性和影響力,仍常出現於很多數據密集型行業的應用程式設計上。例如,今時今日的屋宇工程系統,為我們提供了大量關於裝置、設備和設施日常運作的數據。收集適當的數據後,進行分析,就可識別出屋宇系統的運作模式,例如耗電、人流、承重、熱舒適度水平和裝備的維修保養等。
要為屋宇工程作出明智決策,必先了解每個工程部分,均非由孤立的系統集合而成,而是一個相互聯繫的生態系統,當中每個部分,都以獨特的方式進行互動。行業專家們會根據每個案例,累積自己的一套經驗;然而,要了解一個更為龐大的生態系統中,每個子部分間極為巨大的互連關係,對於人類而言,即使並非近乎不可能,但必然耗力極巨。
電梯電纜出現異常,就是一個有趣的例子。從行業專家的角度來看,如果電梯電纜突然跳動,顯示問題與電梯本身有關,例如是發動機或制動器故障。但是,如果在同一個地區,所有電梯電纜都同時出現同一事故,就表明可能發生了一個連行業專家都沒有經驗過的問題。透過數據查核,可能會發現問題源於區內電力故障;但這類問題已非屋宇本身可以自行解決,更絕非行業專家能力所及。只有通過數據主導的方法,找出並解釋各種數據之間的關聯性,才能及時發現問題並予以即時處理。
數據主導的方法,不僅適用於屋宇維修保養,更可用於許多其他方面,例如評估節能功效、提升用戶體驗,以及開拓超出行業專家經驗以外的機會。
然而,即使這種方法明顯易於執行,但從不同系統收集的數據,卻很少能完全解讀及應用;意思非指我們在培訓上或行業內,數據科學家的數量不足,而是在現實中,理解和解讀屋宇系統數據的技術,其障礙非常高。關於數據及其彼此間關係的定義,尚未有被廣泛執行的統一標準;而業內所常用的專門術語,亦非廣為數據科學家所熟悉。數據的質量低,加上缺乏解讀特定行業大數據集的有效方法,就成為了兩個普遍存在的問題。
為解決這些問題,應該開發一種通用的語義模式,能表述出屋宇設備系統及其子系統、組件和零件間如何彼此互動。
現時已有一些大學的屋宇工程學系和業內組織,正積極研究此一主題,希望不久之後,我們將能看到類似市場學中,解讀「啤酒和尿片」相互關係的經典案例,在屋宇工程行業的數據解讀中出現。
戴劍寒
香港電腦學會人工智能專家小組執行委員會成員
Click here to read the full article on 星島日報 (Chinese only).