科技領(lǐng)域近年來有這樣一個趨勢:移動互聯(lián)紅利正在消退,而數(shù)據(jù)紅利才剛剛開始。據(jù)預(yù)測:“數(shù)據(jù)”+“人工智能”將成為未來5-10年的科技投資主線,在過去的十年中,全球每年產(chǎn)生的數(shù)據(jù)量以50%以上的CARG增長,2015年全球產(chǎn)生數(shù)據(jù)8ZB(1ZB = 1012GB)。
據(jù)IDC預(yù)測,2020年全球產(chǎn)生數(shù)據(jù)量將超過40ZB,相當(dāng)于地球上每個人產(chǎn)生5200GB的數(shù)據(jù)。基于海量數(shù)據(jù)深度學(xué)習(xí)的人工智能第三次浪潮可能走的更遠(yuǎn)。
一些領(lǐng)域數(shù)據(jù)存儲量非常大,例如視頻、安全、情報等。據(jù)說世界上每生產(chǎn)兩塊硬盤,就有一塊用于存儲安防監(jiān)控的視頻數(shù)據(jù)。例如在北京,用于安全監(jiān)控的攝像頭數(shù)量超過了200萬個,每一個攝像頭24小時不停地錄制圖像。這就意味著,每一天這些攝像頭都會錄制兩百多萬天的圖像,折合起來,總時長將超過五千年。
這樣龐大的數(shù)據(jù)量,需要耗費巨大的存儲成本。因此,一般情況下,每隔30天(或者更短時間),就需要將之前存儲的視頻循環(huán)覆蓋。這樣做的結(jié)果就是,不僅白白浪費了存儲資源,而且還會丟失大量的有效線索。
如何從海量數(shù)據(jù)中提取有價值的數(shù)據(jù)并轉(zhuǎn)化成有意義的情報呢?專注于安防行業(yè)的AI企業(yè)格靈深瞳創(chuàng)始人趙勇認(rèn)為單純依靠大數(shù)據(jù)做安防行業(yè)的情報挖掘工作效率非常低,而結(jié)合AI將大大提升海量數(shù)據(jù)向有意義的情報的轉(zhuǎn)化率。
趙勇認(rèn)為實現(xiàn)這一轉(zhuǎn)化率的提高主要在于三個方面:第一是人臉識別、第二是汽車的識別與跟蹤、第三是機(jī)器識別結(jié)果與地理信息的融合。
首先通過高清攝像頭采集到路面車輛、行人等數(shù)據(jù),通過人臉識別技術(shù)識別人物,并保留人物屬性信息存入公安系統(tǒng)。那么假設(shè)一個人被綁架后,標(biāo)準(zhǔn)流程是先查看過去一個受害人的車輛軌跡,需找跟蹤他的車輛,他們的活動范圍等活動特性,以此快速聚焦嫌疑人的生活或者經(jīng)常活動的地點,判斷可能把受害人藏到什么地方。
以前警方要去做非常多的人力工作,而通過AI ,將所有的原始數(shù)據(jù)變成結(jié)構(gòu)化的信息,把這些信息放在一個功能很全的平臺里面去,用戶只要通過一個網(wǎng)頁,就可以完成這個過程。
在整個數(shù)據(jù)挖掘過程,要做到全面、深度、多模態(tài)的挖掘工作。所謂全面是要實現(xiàn)對每個看到的人進(jìn)行挖掘而不僅僅是嫌疑人,所謂深度是對每一個被觀察物體的各種信息進(jìn)行挖掘,而不簡單是人與物的對比,所謂多模態(tài)是要綜合一個人的各項信息挖掘他的行為特點,例如消費記錄、車輛的信息、社保的資料等等。
對于安防行業(yè)現(xiàn)狀,趙勇認(rèn)為,目前公安領(lǐng)域?qū)τ贏I已經(jīng)是剛需,而現(xiàn)在的瓶頸在于AI企業(yè)本身能否將這一的系統(tǒng)快速落地,如何實現(xiàn)快速建立穩(wěn)定、可靠小型的數(shù)據(jù)中心。
利用AI將海量數(shù)據(jù)轉(zhuǎn)換成有意義的情報
發(fā)布時間:2017.04.01