說起人工智能,大部分人不只是耳熟,更能一一列舉出身邊人工智能應(yīng)用的例子:人臉識別,智能家電,語音識別??扇绻麊柕绞裁词菙?shù)據(jù)采集和標注,相信除了人工智能技術(shù)從業(yè)者外,了解這一領(lǐng)域的人真是寥寥無幾,但這阻擋不了數(shù)據(jù)采集標注在人工智能行業(yè)所扮演的關(guān)鍵作用,說數(shù)據(jù)采集標注是人工智能行業(yè)的發(fā)展基石,一點也不為過。
按照目前采用的主流技術(shù)模式,人工智能技術(shù)的關(guān)鍵在于能夠模進行深度學(xué)習,而深度學(xué)習的基礎(chǔ),是以輸入為導(dǎo)向的數(shù)據(jù)算法——神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)結(jié)果的準確性則取決于接近于“無窮”量級的大數(shù)據(jù)。所以,進行大量精準的數(shù)據(jù)訓(xùn)練,采集海量數(shù)據(jù)進行標注,是人工智能進行深度學(xué)習極其關(guān)鍵的一環(huán)。
業(yè)內(nèi)人士介紹,大數(shù)據(jù)時代的科技分工更加細化,準確高效地對多種類型的數(shù)據(jù)進行采集、標注、篩選、分類,滿足客戶在機器識別領(lǐng)域進行科研、測試和產(chǎn)品開發(fā)等方面的不同需求,就能摒棄復(fù)雜的中間環(huán)節(jié),大大提升人工智能深度學(xué)習的效率,這也成為人工智能時代最關(guān)鍵的一環(huán)。比如在數(shù)據(jù)標注方面,無論是人物表情標注、人臉多點標注、車輛標注、行進軌跡標注,還是特定符號標注、特殊場景標注、地圖位置標注,完美算法功能的實現(xiàn)完全取決于數(shù)據(jù)的精準標注。
那么,數(shù)據(jù)標注行業(yè)在整個人工智能領(lǐng)域處于什么樣的地位,未來又著怎樣的發(fā)展前景?龍貓數(shù)據(jù)的銷售總監(jiān)謝林波和商務(wù)總監(jiān)羅微波先生在接受媒體訪問時,對上述問題進行了專業(yè)的解答。
謝林波認為,數(shù)據(jù)采集標注和人工智能之間有著極強的協(xié)同增效關(guān)系,這個特點已經(jīng)得到業(yè)界的足夠重視,幾乎是業(yè)內(nèi)共識。如何將兩者之間的結(jié)界徹底打通?數(shù)據(jù)采集標注的質(zhì)量是一個重要的紐帶和基石。人工智能本身不會識別物體,而要依靠海量的數(shù)據(jù)訓(xùn)練。
以人臉識別技術(shù)為例,當人臉關(guān)鍵點被一一標注之后,計算機才能建立起對人臉的認知。而人臉關(guān)鍵點的數(shù)目并不固定,不同數(shù)目的背后連接的是不同的算法。數(shù)據(jù)標注就是把這些數(shù)據(jù)進行分類、甄別、標注,最終實現(xiàn)更為精準的識別。
謝林波表示,隨著人工智能產(chǎn)業(yè)的發(fā)展,數(shù)據(jù)采集樣本需求量越來越大、樣本分布越來越廣泛,標注要求越來越嚴格,這對于數(shù)據(jù)服務(wù)商——特別是龍貓數(shù)據(jù)這種全領(lǐng)域大型服務(wù)商,是一個很大的挑戰(zhàn)。依靠自主開發(fā)的智能采集標注平臺,龍貓把數(shù)據(jù)采集標注需求分發(fā)給平臺上百萬量級的眾包用戶,依靠他們閑暇的時間進行數(shù)據(jù)采集標注,可以快速搜集大量的數(shù)據(jù)樣本;數(shù)據(jù)標注有多重質(zhì)量把關(guān),保證了數(shù)據(jù)采集、標注、分類精確無誤。
之前說過,數(shù)據(jù)標注的質(zhì)量會直接影響人工智能訓(xùn)練的效果,龍貓的數(shù)據(jù)標注平臺有標注員培訓(xùn)—標注員考核—標注—審核——抽審等多重環(huán)節(jié),多重把關(guān)機制能夠確保最終產(chǎn)出高質(zhì)量數(shù)據(jù);對于復(fù)雜的數(shù)據(jù)需求,龍貓還會通過自己管理的線下團隊進行采集標注。
對于產(chǎn)業(yè)的未來發(fā)展,龍貓數(shù)據(jù)的商務(wù)總監(jiān)羅微波表示,人工智能產(chǎn)業(yè)戰(zhàn)略地位不斷提升,無論從國家戰(zhàn)略層面還是行業(yè)本身來講,數(shù)據(jù)服務(wù)都是非常重要的一環(huán),從目前的市場規(guī)模來看,數(shù)據(jù)服務(wù)行業(yè)處于高速增長期,發(fā)展?jié)摿薮螅瑪?shù)據(jù)服務(wù)市場概念持續(xù)升溫,資本市場也非常關(guān)注。
謝林波表示,隨著數(shù)據(jù)服務(wù)行業(yè)市場的不斷成熟,公司業(yè)務(wù)也不斷拓展,服務(wù)能力不斷提升,龍貓數(shù)據(jù)目前仍在集中精力研發(fā)數(shù)據(jù)的開發(fā)采集和標注技術(shù),打造高效穩(wěn)定的團隊,下一步將持續(xù)規(guī)范人工智能數(shù)據(jù)服務(wù)市場,在目前合作的企業(yè)領(lǐng)域內(nèi)拓展更多的跨行業(yè)客戶。
據(jù)介紹,龍貓數(shù)據(jù)目前在產(chǎn)品和服務(wù)的橫向發(fā)展和縱向延伸都做了升級,不僅開放了很多免費數(shù)據(jù)集服務(wù)社會,更創(chuàng)造性搭建出國內(nèi)首個基于數(shù)據(jù)的人工智能綜合服務(wù)平臺,可以更大限度的滿足人工智能企業(yè)甚至是傳統(tǒng)行業(yè)企業(yè)日益增長的定制化數(shù)據(jù)需求。龍貓數(shù)據(jù)將持續(xù)踐行行業(yè)責任和使命,未來會進一步加大在人工智能數(shù)據(jù)質(zhì)量和安全性方面的投入,爭取用最高的性價比,為更多客戶提供精準、安全、迅速的優(yōu)質(zhì)數(shù)據(jù)服務(wù)。
“用龍貓的專業(yè),助推中國人工智能產(chǎn)業(yè)的騰飛。”謝林波信心滿滿地說。
【來源:搜狐科技】