中商情報(bào)網(wǎng)訊:在 AI 產(chǎn)業(yè)鏈中,算法、算力和數(shù)據(jù)共同構(gòu)成技術(shù)發(fā)展的三大核心要素。算法模型從技術(shù)理論到應(yīng)用實(shí)踐的落地過(guò)程依賴于大量的訓(xùn)練數(shù)據(jù)。訓(xùn)練數(shù)據(jù)越多、越完整、質(zhì)量越高,模型推斷的結(jié)論越可靠。
近年來(lái),深度學(xué)習(xí)加速了人工智能技術(shù)的商業(yè)化落地,同時(shí)也帶來(lái)了大量Al算法訓(xùn)練需求,推動(dòng)基礎(chǔ)數(shù)據(jù)服務(wù)市場(chǎng)的快速增長(zhǎng)。根據(jù)德勤數(shù)據(jù)統(tǒng)計(jì),2017-2022年中國(guó)人工智能基礎(chǔ)數(shù)據(jù)服務(wù)市場(chǎng)規(guī)模從8.2億元增長(zhǎng)至45.0億元,年均復(fù)合增長(zhǎng)率達(dá)41%。未來(lái)智能制造、元宇宙、生成式AI等復(fù)雜智能場(chǎng)景的實(shí)現(xiàn),將對(duì)人工智能基礎(chǔ)數(shù)據(jù)服務(wù)提出了更高的要求。預(yù)計(jì)2023年其市場(chǎng)規(guī)模將達(dá)到63.5億元。
數(shù)據(jù)來(lái)源:IDC、德勤、中商產(chǎn)業(yè)研究院整理
行業(yè)發(fā)展趨勢(shì)
1.人工智能技術(shù)加速向產(chǎn)業(yè)滲透融合,催生更多垂向領(lǐng)域數(shù)據(jù)需求
隨著深度學(xué)習(xí)技術(shù)的不斷突破,人工智能發(fā)展已經(jīng)進(jìn)入 2.0 時(shí)代,相關(guān)訓(xùn)練需求正逐漸從通用基礎(chǔ)能力建設(shè),向更為專業(yè)的垂向場(chǎng)景/行業(yè)拓展。一方面,以大模型為代表的 AI 基礎(chǔ)技術(shù)不斷取得重大突破,AI 模擬人類(lèi)認(rèn)知的能力飛速提升,因此從技術(shù)能力維度看,AI 已具備與垂直產(chǎn)業(yè)融合并規(guī)?;瘧?yīng)用的前提條件;另一方面,受?chē)?guó)家數(shù)字經(jīng)濟(jì)發(fā)展戰(zhàn)略推動(dòng),產(chǎn)業(yè)數(shù)字化和智能化將進(jìn)一步席卷各行各業(yè),智能化技術(shù)與傳統(tǒng)產(chǎn)業(yè)的融合將成為數(shù)字經(jīng)濟(jì)時(shí)代的新發(fā)展趨勢(shì),并創(chuàng)造出巨大的藍(lán)??臻g。
當(dāng)前 AI 技術(shù)正在加速與各類(lèi)產(chǎn)業(yè)融合,在汽車(chē)、金融、醫(yī)療、工業(yè)等傳統(tǒng)行業(yè)的滲透率和應(yīng)用場(chǎng)景不斷提升,展現(xiàn)出可觀的商業(yè)價(jià)值和巨大的發(fā)展?jié)摿?,而?shù)據(jù)作為打通算法技術(shù)與行業(yè)需求的核心橋梁,作用更加凸顯,可以說(shuō)數(shù)據(jù)能力一定程度上決定了算法模型在對(duì)應(yīng)產(chǎn)業(yè)的適用性以及實(shí)用性,成為加速 AI 產(chǎn)業(yè)化落地的關(guān)鍵要素。
在各類(lèi)垂向場(chǎng)景中,智能駕駛受益于其產(chǎn)業(yè)本身的高速發(fā)展,以及以智能化為核心驅(qū)動(dòng)的底層邏輯,相關(guān)數(shù)據(jù)需求呈現(xiàn)出快速增長(zhǎng)趨勢(shì),因此成為數(shù)據(jù)服務(wù)行業(yè)首個(gè)產(chǎn)生規(guī)?;枨蟮拇瓜蝾I(lǐng)域。未來(lái),隨著智能駕駛級(jí)別的不斷提升、以及滲透率的不斷提高,產(chǎn)業(yè)對(duì)智能駕駛的算法的精度要求會(huì)更高,一方面在硬件配置上,傳感器的種類(lèi)和數(shù)量會(huì)不斷變化,另一方面,算法需要持續(xù)不斷地學(xué)習(xí)更多場(chǎng)景的數(shù)據(jù)來(lái)提高罕見(jiàn)場(chǎng)景的識(shí)別能力,因此,未來(lái)智能駕駛的數(shù)據(jù)需求將向覆蓋更多數(shù)據(jù)類(lèi)型、更廣泛應(yīng)用場(chǎng)景以及更高質(zhì)量的方向發(fā)展,數(shù)據(jù)需求也將從原來(lái)單一的 2D 需求(主要集中在 L2 級(jí)別)向 3D、以及 2D-3D 融合需求拓展(L3 及以上級(jí)別)。
2.人工智能企業(yè)全球化布局加速,多語(yǔ)種能力成為拓展核心支撐
2013 年,共建“一帶一路”的倡議正式面世,十年來(lái),隨著國(guó)家“一帶一路”戰(zhàn)略的深入推進(jìn),國(guó)內(nèi)一批具有較強(qiáng)創(chuàng)新能力和過(guò)硬技術(shù)實(shí)力的企業(yè),紛紛踏出國(guó)門(mén),積極拓展海外市場(chǎng),通過(guò)不斷擴(kuò)大企業(yè)出海戰(zhàn)略版圖,獲得高速發(fā)展機(jī)會(huì)。另一方面,境外頭部企業(yè)也繼續(xù)踐行“全球化”戰(zhàn)略,搭乘全球出海的快車(chē)。隨著境內(nèi)、外企業(yè)的全球化擴(kuò)張成為確定性趨勢(shì),多語(yǔ)種能力作為支撐企業(yè)順利出海的核心要素之一,重要意義更加凸顯。未來(lái),多語(yǔ)種訓(xùn)練數(shù)據(jù)將對(duì)客戶側(cè)在語(yǔ)音助手、智能汽車(chē)、智能家居、智能客服、機(jī)器人、多語(yǔ)種 OCR 等各領(lǐng)域產(chǎn)品/應(yīng)用的全球化推廣起到積極作用。因此,隨著各類(lèi)客戶群體擴(kuò)張步伐加速,多語(yǔ)種需求也將快速增長(zhǎng),具有強(qiáng)大語(yǔ)言研究能力的數(shù)據(jù)服務(wù)企業(yè)將獲得更多商業(yè)機(jī)會(huì)。
3.多模態(tài)數(shù)據(jù)受 AIGC、元宇宙發(fā)展驅(qū)動(dòng),將呈現(xiàn)快速增長(zhǎng)趨勢(shì)
隨著 AI 虛擬主播、虛擬學(xué)生、虛擬員工輪番上崗,虛擬數(shù)字人這個(gè)新興概念逐漸走入大眾視野,成為元宇宙與人工智能兩大領(lǐng)域的熱門(mén)技術(shù)賽道之一。想要讓虛擬數(shù)字人實(shí)現(xiàn)與人類(lèi)的自然交互,不僅需要發(fā)音標(biāo)準(zhǔn)自然、身體動(dòng)作流暢,其表情、口型與聲音也要實(shí)現(xiàn)細(xì)節(jié)的精準(zhǔn)匹配,而多模態(tài)技術(shù)就是打破傳統(tǒng)人工智能單一感官局限、讓各類(lèi) AI 能力協(xié)同使用的重要技術(shù)。通過(guò)對(duì)高質(zhì)量多模態(tài)訓(xùn)練數(shù)據(jù)集的持續(xù)學(xué)習(xí),AI 可實(shí)現(xiàn)圖像、視頻、音頻、語(yǔ)義文本等多維度能力的融合,使得虛擬人在行為上更接近人類(lèi)。
此外,隨著 AIGC 技術(shù)的發(fā)展,AI 將在更多維度上輔助人類(lèi)創(chuàng)作,例如人類(lèi)輸入一段文字指令,AI 通過(guò)理解輸入的文字內(nèi)容,按照人類(lèi)描述生成一幅畫(huà)或一段語(yǔ)音,以此幫助人類(lèi)完成內(nèi)容生產(chǎn)。想要實(shí)現(xiàn)上述功能,即需要通過(guò)對(duì)多模態(tài)數(shù)據(jù)進(jìn)行學(xué)習(xí),使文字與圖畫(huà)或語(yǔ)音形成一一映射,通過(guò)對(duì)齊兩種獨(dú)立模態(tài)關(guān)鍵特征的方式,實(shí)現(xiàn)按指令的創(chuàng)作。因此,隨著以虛擬人、AIGC 為代表的 AI 技術(shù)的不斷發(fā)展和應(yīng)用,數(shù)據(jù)服務(wù)領(lǐng)域多模態(tài)需求將呈現(xiàn)加速增長(zhǎng)趨勢(shì)。
4.大模型技術(shù)的突破和躍升,將驅(qū)動(dòng)新型數(shù)據(jù)需求持續(xù)增長(zhǎng)
隨著 ChatGPT 成為全球范圍內(nèi)的現(xiàn)象級(jí)應(yīng)用,人工智能迎來(lái)了新的發(fā)展機(jī)遇,其背后的大模型技術(shù)也將進(jìn)一步引導(dǎo)人工智能產(chǎn)業(yè)變革并帶來(lái)相關(guān)數(shù)據(jù)需求的變化和增長(zhǎng)。具體來(lái)說(shuō),為更好完成預(yù)訓(xùn)練階段的通用模型訓(xùn)練,大量數(shù)據(jù)的質(zhì)量要求將更高,高質(zhì)量數(shù)據(jù)清洗的規(guī)則建立以及工程化能力將成為重點(diǎn)。此外,強(qiáng)化學(xué)習(xí)階段的高階數(shù)據(jù)需求將不斷增加,基于人類(lèi)認(rèn)知的高質(zhì)量的數(shù)據(jù)輸入將更大程度決定模型效果。
5.隨著國(guó)家法律法規(guī)更快更密集落地,對(duì)數(shù)據(jù)安全及合規(guī)會(huì)提出更高要求
近年來(lái),數(shù)字經(jīng)濟(jì)規(guī)模的快速擴(kuò)張,數(shù)據(jù)作為數(shù)字經(jīng)濟(jì)時(shí)代最核心、最具價(jià)值的生產(chǎn)要素,重要性更加凸顯,但數(shù)據(jù)不同于傳統(tǒng)生產(chǎn)要素,其承載涵蓋了大量涉及個(gè)人隱私以及國(guó)家安全的重要信息,因此,為更好保障數(shù)字經(jīng)濟(jì)長(zhǎng)期穩(wěn)定的可持續(xù)發(fā)展,建設(shè)規(guī)范、安全、合規(guī)、高質(zhì)量的數(shù)據(jù)安全體系已成為迫切需求。近年,國(guó)家陸續(xù)出臺(tái)包括《數(shù)據(jù)安全法》、《個(gè)人信息保護(hù)法》、《汽車(chē)數(shù)據(jù)安全管理若干規(guī)定(試行)》、《數(shù)據(jù)出境安全評(píng)估辦法》、《自然資源部關(guān)于促進(jìn)智能網(wǎng)聯(lián)汽車(chē)發(fā)展維護(hù)測(cè)繪地理信息安全的通知》等主流法律法規(guī),為解決數(shù)據(jù)安全問(wèn)題、凈化行業(yè)快速發(fā)展中的不良亂象提供了切實(shí)可行的法律依據(jù)。
更多資料請(qǐng)參考中商產(chǎn)業(yè)研究院發(fā)布的《中國(guó)人工智能市場(chǎng)前景及投資機(jī)會(huì)研究報(bào)告》,同時(shí)中商產(chǎn)業(yè)研究院還提供產(chǎn)業(yè)大數(shù)據(jù)、產(chǎn)業(yè)情報(bào)、行業(yè)研究報(bào)告、行業(yè)白皮書(shū)、商業(yè)計(jì)劃書(shū)、可行性研究報(bào)告、園區(qū)產(chǎn)業(yè)規(guī)劃、產(chǎn)業(yè)鏈招商圖譜、產(chǎn)業(yè)招商指引、產(chǎn)業(yè)鏈招商考察&推介會(huì)等服務(wù)。