前言:隨著中國數(shù)字經(jīng)濟(jì)的深入發(fā)展,產(chǎn)業(yè)數(shù)字化進(jìn)程不斷加速,大數(shù)據(jù)在產(chǎn)業(yè)決策中的比重越來越高。天眼查數(shù)據(jù)研究院特此推出“天眼新知”專欄,以天眼查大數(shù)據(jù)為依托,梳理產(chǎn)業(yè)格局及發(fā)展脈絡(luò),解讀產(chǎn)業(yè)領(lǐng)域最新動(dòng)態(tài)和投融資風(fēng)向,為各方?jīng)Q策提供參考。
本文為天眼新知·產(chǎn)業(yè)分析系列,第三十四篇。
人工智能,源于一篇繞口令式的科技論文《神經(jīng)活動(dòng)中內(nèi)在思想的邏輯演算》、源于赫赫有名的“圖靈測試”、源于20世紀(jì)50年代具備長遠(yuǎn)眼光的科技先賢們一次“不經(jīng)意”的討論。
(資料圖)
人工智能,起始于對人類自身理解的深入挖掘,對人的意識、思維的信息過程的模擬。今時(shí)今日,人工智能不再是科幻電影中無法觸及的概念,它已成為家喻戶曉的“現(xiàn)實(shí)”,在減輕人類的體力負(fù)擔(dān)和腦力負(fù)擔(dān)方面已漸漸顯示出優(yōu)勢,比如在極端天氣預(yù)測等層面顯露頭角。
隨著深度學(xué)習(xí),大模型等關(guān)鍵技術(shù)的深入發(fā)展,以Chat-GPT爆發(fā)為新起點(diǎn),人工智能將快速邁入下一個(gè)“未知”的階段。
一、人工智能:工具屬性與思維能力的深度融合
人工智能從標(biāo)準(zhǔn)的定義來講,可參考《人工智能標(biāo)準(zhǔn)化白皮書(2018)》中所提。人工智能是利用數(shù)字計(jì)算機(jī)或者數(shù)字計(jì)算機(jī)控制的機(jī)器模擬、延伸和擴(kuò)展人的智能,感知環(huán)境、獲取知識并使用知識獲得最佳結(jié)果的理論、方法、技術(shù)及應(yīng)用系統(tǒng)。
在大多人的眼中,人工智能是一位非常給力的助手,工具,可以實(shí)現(xiàn)處理工作過程的自動(dòng)化,提升工作效率,比如執(zhí)行與人類智能有關(guān)的智能行為,如判斷、推理、證明、識別、感知、理解、通信、設(shè)計(jì)、思考、規(guī)劃、學(xué)習(xí)和問題求解等思維活動(dòng)。
但與之其工具屬性,能力屬性相比,人工智能更為重要的是一種思維,是用來描述模仿人類與其他人類思維相關(guān)聯(lián)的“認(rèn)知”功能的機(jī)器,如“學(xué)習(xí)”和“解決問題”。
人工智能產(chǎn)業(yè)在20世紀(jì)50年代提出后,限于當(dāng)時(shí)的技術(shù)能力,多限于理論知識的討論,而真正開始爆發(fā)還是自2012年的AlexNet模型問世。
1.人工智能1.0時(shí)代(2012年-2018年)
人工智能概念于1956年被提出,AI產(chǎn)業(yè)的第一輪爆發(fā)源自2012年,2012年AlexNet模型問世開啟了CNN在圖像識別的應(yīng)用,2015年機(jī)器識別圖像的準(zhǔn)確率首次超過人(錯(cuò)誤率低于4%),開啟了計(jì)算機(jī)視覺技術(shù)在各行各業(yè)的應(yīng)用,帶動(dòng)了人工智能1.0時(shí)代的創(chuàng)新周期,AI+開始賦能各行各業(yè),帶動(dòng)效率提升。但是,人工智能1.0時(shí)代面臨著模型碎片化,AI泛化能力不足等問題。
2.人工智能2.0時(shí)代(2017年-至今)
2017年Google Brain團(tuán)隊(duì)提出Transformer架構(gòu),奠定了大模型領(lǐng)域的主流算法基礎(chǔ),從2018年開始大模型迅速流行,2018年谷歌團(tuán)隊(duì)的模型參數(shù)首次過億,到2022年模型參數(shù)達(dá)到5400億,模型參數(shù)呈現(xiàn)指數(shù)級增長,“預(yù)訓(xùn)練+微調(diào)”的大模型有效解決了1.0時(shí)代AI泛化能力不足的問題。新一代AI技術(shù)有望開始全新一輪的技術(shù)創(chuàng)新周期。
天眼查數(shù)據(jù)顯示,截至目前,人工智能相關(guān)企業(yè)近267.4萬余家,其中,2023年一季度新增注冊企業(yè)17萬余家,與2022年同期相比,上漲6.8%;
從地域分布來看,廣東以39.9萬余家位列區(qū)域首位;江蘇、北京分列二、三位,分別擁有22.4萬余家以及21.8萬余家;
從成立時(shí)間來看,53.6%的相關(guān)企業(yè)成立于1-5年內(nèi),成立于1年以內(nèi)的相關(guān)企業(yè)占比27.7%;
另據(jù)天眼查不完全統(tǒng)計(jì),人工智能產(chǎn)業(yè)自2023年1月以來,融資事件合計(jì)發(fā)生143起,融資金額超800億元。
二、數(shù)據(jù)、算法、算力:人工智能的“三駕馬車”
1.數(shù)據(jù):“巧婦難為無米之炊”
人工智能的快速發(fā)展推動(dòng)數(shù)據(jù)規(guī)模不斷提升。據(jù)IDC測算,2025年全球數(shù)據(jù)規(guī)模將達(dá)到 163ZB,其中80%-90%是非結(jié)構(gòu)化數(shù)據(jù)。數(shù)據(jù)服務(wù)進(jìn)入深度定制化的階段,百度、阿里巴巴、京東等公司根據(jù)不同場景和需求推出數(shù)據(jù)定制的服務(wù);企業(yè)需求的數(shù)據(jù)集從通用簡單場景向個(gè)性化復(fù)雜場景過渡,例如語音識別數(shù)據(jù)集從普通話向小語種、方言等場景發(fā)展,智能對話數(shù)據(jù)集從簡答問答、控制等場景向應(yīng)用場景、業(yè)務(wù)問答等方向發(fā)展。
各方積極探索建立高質(zhì)量知識集,推動(dòng)知識驅(qū)動(dòng)的未來人工智能應(yīng)用發(fā)展。知識集中包含語音、圖像、文本等傳統(tǒng)數(shù)據(jù)和定義、規(guī)則、邏輯關(guān)系等,是知識的數(shù)據(jù)化呈現(xiàn),業(yè)界著名知識集有Wordnet、Hownet等。例如阿里巴巴聯(lián)合香港理工大學(xué)基于服裝設(shè)計(jì)知識開發(fā)FashionAI知識集,加速了AI在服裝設(shè)計(jì)產(chǎn)業(yè)落地應(yīng)用。
2.算法(模型、軟件):“困難”總比方法多
根據(jù)中國信通院《人工智能白皮書(2022年)》,超大規(guī)模預(yù)訓(xùn)練模型持續(xù)推動(dòng)技術(shù)升級,繼續(xù)朝著大規(guī)模、多模態(tài)方向發(fā)展。自2020年OpenAI推出GPT-3后,谷歌、華為、智源研究院、中科院、阿里巴巴等企業(yè)和研究機(jī)構(gòu)也相繼發(fā)力,陸續(xù)推出超大規(guī)模預(yù)訓(xùn)練模型,包括Switch Transformer、DALL·EMT-NLG、盤古、悟道2.0、紫東太初和M6等。當(dāng)前,預(yù)訓(xùn)練模型參數(shù)數(shù)量、訓(xùn)練數(shù)據(jù)規(guī)模按照300倍/年的趨勢增長,增大模型和增加訓(xùn)練數(shù)據(jù)仍是短期內(nèi)演進(jìn)方向;跨模態(tài)預(yù)訓(xùn)練大模型逐漸普遍,如今已經(jīng)能夠處理文本、圖像、語音三種模態(tài)數(shù)據(jù),未來能夠使用更多類型數(shù)據(jù)的預(yù)訓(xùn)練模型將會(huì)涌現(xiàn)。
輕量化深度學(xué)習(xí)技術(shù)顯著提升計(jì)算效率。復(fù)雜的深度學(xué)習(xí)模型需要耗費(fèi)大量的存儲(chǔ)空間和計(jì)算資源,在端邊等資源受限的情況下難以應(yīng)用。輕量化深度學(xué)習(xí)成為解決這一難題的重要技術(shù),具備低內(nèi)存和低計(jì)算量優(yōu)勢,技術(shù)包括設(shè)計(jì)更加緊湊和高效的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)、對大模型“裁剪”掉部分模型結(jié)構(gòu),以及對網(wǎng)絡(luò)參數(shù)進(jìn)行量化從而減少計(jì)算量等。例如,緊湊模型的典型代表有谷歌提出的MobileNet和曠視提出ShufleNet等,百度推出的輕量化PaddleOCR模型規(guī)模減小至2.8Mb,在GitHub上開源后受到熱捧“生成式人工智能”技術(shù)不斷成熟,未來聽、說、讀、寫等能力將有機(jī)結(jié)合。目前,“生成式人工智能”技術(shù)被廣泛應(yīng)用于智能寫作、語音導(dǎo)航、代碼生成、新聞播報(bào)、有聲閱讀、影像修復(fù)等領(lǐng)域,通過機(jī)器自動(dòng)合成文本、視頻、圖像、語音等推動(dòng)互聯(lián)網(wǎng)數(shù)字內(nèi)容生產(chǎn)的變革。聽、說、讀、寫等能力的有機(jī)結(jié)合成為未來發(fā)展趨勢。例如央視、新華社、光明網(wǎng)等均推出了數(shù)字人主播。
據(jù)天眼查知識產(chǎn)權(quán)不完全統(tǒng)計(jì),人工智能相關(guān)的專利申請自2023年1月以來,已有1610余項(xiàng),其中,發(fā)明專利占比超過7成。
3.算力(硬件):日行千里 事半功倍
人工智能算力應(yīng)需求驅(qū)動(dòng)不斷突破,訓(xùn)練用和推斷用的芯片仍在加速發(fā)展。一方面在模型訓(xùn)練階段,根據(jù)Open AI數(shù)據(jù),模型計(jì)算量增長速度遠(yuǎn)超人工智能硬件算力增長速度,存在萬倍差距。另一方面,由于推斷的泛在性,推斷用算力需求持續(xù)增長。與此同時(shí),新的算力架構(gòu)也在不斷探索中,類腦芯片、存內(nèi)計(jì)算、量子計(jì)算等備受關(guān)注。
訓(xùn)練芯片創(chuàng)新加速,推斷芯片朝著專用定制化發(fā)展?;贕PU的訓(xùn)練芯片持續(xù)增多,面向GPU創(chuàng)新的企業(yè)開始發(fā)力,出現(xiàn)了摩爾線程、天數(shù)智芯、壁仞科技等一批專注GPU賽道的初創(chuàng)公司。基于ASIC等架構(gòu)云端訓(xùn)練芯片能力提升顯著,寒武紀(jì)的思元370、原科技的“邃思 2.0”以及百度的昆侖2等相對上一代產(chǎn)品均有3-4倍以上的算力提升。
專用定制的端側(cè)推理芯片百花齊放,面向手機(jī)應(yīng)用的智能芯片成為亮點(diǎn)。2021年1月,聯(lián)發(fā)科推出了高端手機(jī)芯片 Dimensity 1200,可邊緣處理5G、AI和圖像數(shù)據(jù)等。8月,谷歌為其Pixel系列手機(jī)專門推出了首款智能手機(jī)芯片Tensor。類腦芯片、存內(nèi)計(jì)算、量子計(jì)算等依舊是重點(diǎn)探索方向。類腦芯片、存內(nèi)計(jì)算、量子計(jì)算等技術(shù)在理論層面可實(shí)現(xiàn)高算力、低功耗等優(yōu)點(diǎn),雖然取得了一些進(jìn)展,但總體而言目前技術(shù)成熟度相對較低。
據(jù)天眼查投融資數(shù)據(jù)不完全統(tǒng)計(jì),與GPU相關(guān)的融資事件合計(jì)發(fā)生98起,融資金額超280億元;其中,2023年融資事件合計(jì)發(fā)生3起,融資金額超4億元。
4.數(shù)據(jù)標(biāo)注:人工智能背后“人工”的力量
人工智能,其實(shí)是部分替代人的認(rèn)知功能。人工智能算法是數(shù)據(jù)驅(qū)動(dòng)型算法,也就是說,如果想實(shí)現(xiàn)人工智能,首先需要把人類理解和判斷事物的能力教給計(jì)算機(jī),讓計(jì)算機(jī)學(xué)習(xí)到這種識別能力。
類比機(jī)器學(xué)習(xí),我們要教它認(rèn)識一只貓,直接給它一張貓的圖片,它是完全不知道這是什么。我們得先有貓的圖片,上面標(biāo)注著“貓”這個(gè)字,然后機(jī)器通過學(xué)習(xí)了大量的圖片中的特征,這時(shí)候再給機(jī)器任意一張貓的圖片,它就能認(rèn)出來這是貓了。
所以目前人工智能需要標(biāo)注大量數(shù)據(jù),即對原始信息進(jìn)行數(shù)據(jù)標(biāo)注。數(shù)據(jù)標(biāo)注是大部分人工智能算法得以有效運(yùn)行的關(guān)鍵環(huán)節(jié)。數(shù)據(jù)標(biāo)注是把需要機(jī)器識別和分辨的數(shù)據(jù)貼上標(biāo)簽,然后讓計(jì)算機(jī)不斷地學(xué)習(xí)這些數(shù)據(jù)的特征,最終實(shí)現(xiàn)計(jì)算機(jī)能夠自主識別。這類工作量極大、過程極其枯燥且耗時(shí)的手動(dòng)數(shù)據(jù)標(biāo)記過程,已經(jīng)成為AI經(jīng)濟(jì)體系中的重要組成部分。
據(jù)天眼查知識產(chǎn)權(quán)不完全統(tǒng)計(jì),與數(shù)據(jù)標(biāo)注有關(guān)的專利申請,自2023年1月以來,已有34項(xiàng),均屬于發(fā)明專利。
三、應(yīng)用領(lǐng)域:從知識學(xué)習(xí)、到交通出行改變你我的生活
1.大模型
3月14日,Open AI正式發(fā)布多模態(tài)大模型GPT-4,迭代速度較快。創(chuàng)始人 Sam Altman 表示,GPT-4是迄今為止功能最強(qiáng)大、最一致的大型多模態(tài)模型,能夠接受圖像和文本輸入,在各種專業(yè)和學(xué)術(shù)基準(zhǔn)上均表現(xiàn)出了人類水平。人工智能的發(fā)展已經(jīng)進(jìn)入了認(rèn)知智能領(lǐng)域,文本智能、圖像智能、音頻智能、視頻智能以及多模態(tài)認(rèn)知智能,將會(huì)逐步誕生,未來為了應(yīng)對復(fù)雜和多變的應(yīng)用場景,多模態(tài)智能的發(fā)展方向?qū)⒊蔀楸厝弧?/p>
2.自動(dòng)駕駛
自動(dòng)駕駛技術(shù)是一個(gè)涉及多個(gè)領(lǐng)域的復(fù)雜技術(shù),人工智能技術(shù)是其中重要的一環(huán)。在自動(dòng)駕駛中,人工智能主要負(fù)責(zé)實(shí)現(xiàn)自主決策和智能感知。其中,自主決策涉及到在各種不同的駕駛情境下,根據(jù)各種因素做出最佳的決策。這些因素包括道路情況、交通情況、天氣情況、行人和其他車輛的行動(dòng),以及其他各種因素。而智能感知?jiǎng)t主要負(fù)責(zé)實(shí)現(xiàn)對周圍環(huán)境的感知,包括車輛和行人的位置、速度、方向等信息的獲取和分析,這些信息將為自動(dòng)駕駛汽車用來做出最佳的決策和行動(dòng)提供支持。
3.生命科學(xué)
人工智能不止在工程領(lǐng)域取得了了不起的建樹,在生命科學(xué)領(lǐng)域也有著不俗的戰(zhàn)績,比如:Alphafold。2022年,DeepMind公司與歐洲生物信息研究所的合作團(tuán)隊(duì)公布了生物學(xué)領(lǐng)域的一項(xiàng)重大飛躍。他們利用人工智能(AI)系統(tǒng)AlphaFold預(yù)測出超過100萬個(gè)物種的2.14億個(gè)蛋白質(zhì)結(jié)構(gòu),幾乎涵蓋了地球上所有已知蛋白質(zhì)。這一突破將加速新藥開發(fā),并為基礎(chǔ)科學(xué)帶來全新革命。預(yù)測蛋白質(zhì)形狀的能力對科學(xué)家很有用,因?yàn)樗鼘τ诹私馄湓隗w內(nèi)的作用以及診斷和治療被認(rèn)為由錯(cuò)誤折疊的蛋白質(zhì)引起的疾病至關(guān)重要,例如阿爾茨海默氏癥,帕金森氏癥,亨廷頓氏癥和囊性纖維化。
四、前景預(yù)測
1.政策層面:鼎力支持
人工智能是引領(lǐng)未來的新興戰(zhàn)略性技術(shù),是驅(qū)動(dòng)新一輪科技革命和產(chǎn)業(yè)變革的重要力量。
近年來,中國人工智能行業(yè)受到國家的高度重視和重點(diǎn)支持,國家推出多項(xiàng)政策,保障我國人工智能產(chǎn)業(yè)長期發(fā)展。
從數(shù)據(jù)要素層面來看,十四屆全國人大會(huì)議提出成立國家數(shù)據(jù)局、重組科學(xué)技術(shù)部等有力舉措。國家數(shù)據(jù)局的成立有望加速數(shù)據(jù)要素市場化。
從自主創(chuàng)新層面來看,重組科學(xué)技術(shù)部、健全新型舉國體制有利于推動(dòng)我國科技自主創(chuàng)新發(fā)展。
2.應(yīng)用層面:前景廣闊
AIGC領(lǐng)域目前呈現(xiàn)出的內(nèi)容類型不斷豐富、內(nèi)容質(zhì)量不斷提升、技術(shù)的通用性和工業(yè)化水平越來越強(qiáng)等趨勢,這使得AIGC在消費(fèi)互聯(lián)網(wǎng)領(lǐng)域日趨主流化,涌現(xiàn)了寫作助手、AI繪畫、對話機(jī)器人、數(shù)字人等爆款級應(yīng)用,支撐著傳媒、電商、娛樂、影視等領(lǐng)域的內(nèi)容需求。目前AIGC也正在向產(chǎn)業(yè)互聯(lián)網(wǎng)、社會(huì)價(jià)值領(lǐng)域擴(kuò)張應(yīng)用。
天眼查研究院認(rèn)為,未來,人工智能是否會(huì)真正替代人的討論仍將持續(xù)。人工智能,是一場關(guān)于知識學(xué)習(xí)的革命,機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、大模型等讓人望而卻步的概念不過是機(jī)器理解世界的范式。與其杞人憂天,擔(dān)心自己被機(jī)器所替代,不如與“機(jī)器”同行,學(xué)習(xí)它,掌握它,用好它,成為為我所用的工具。
來源:金融界資訊
責(zé)任編輯:
人工智能概念于1956年被提出,AI產(chǎn)業(yè)的第一輪爆發(fā)源自2012年,2012年AlexNet模型問世開啟了CNN在圖像識別的
科創(chuàng)50指數(shù)開盤報(bào)1116 67點(diǎn),跌0 01%
據(jù)江蘇省紀(jì)委監(jiān)委網(wǎng)站報(bào)道,宿遷市衛(wèi)健委原主任、黨委書記、市二級巡視員劉仰剛涉嫌嚴(yán)重違紀(jì)違法,目前正在
1、宅女的意思就是一個(gè)人經(jīng)常待在家里,很少于別人接觸,沒什么朋友,有些人還特別迷戀漫畫之類的東西,這就叫
記者日前從多家信托公司了解到,監(jiān)管部門為落實(shí)《關(guān)于加強(qiáng)商業(yè)銀行互聯(lián)網(wǎng)貸款業(yè)務(wù)管理提升金融服務(wù)質(zhì)效的通
中工網(wǎng)訊(工人日報(bào)-中工網(wǎng)記者毛濃曦通訊員祝盼)近日,“中國夢·勞動(dòng)美——凝心鑄魂跟黨走團(tuán)結(jié)奮斗新征
【環(huán)球時(shí)報(bào)駐埃及特派記者黃培昭】埃及一年一度的齋月剛剛結(jié)束。齋月期間,埃及的電視臺總會(huì)播出齋月連續(xù)劇
現(xiàn)代中學(xué)化學(xué)實(shí)驗(yàn)教學(xué)方法論,關(guān)于現(xiàn)代中學(xué)化學(xué)實(shí)驗(yàn)教學(xué)方法論介紹這個(gè)很多人還不知道,我們一起來看看!1、
同花順數(shù)據(jù)中心顯示,新風(fēng)光4月21日獲融資買入355 47萬元,占當(dāng)日買入金額的6 65%,當(dāng)前融資余額1 75億元,
今天來聊聊關(guān)于什么是聲母和韻母的表示方法,什么是聲母和韻母的文章,現(xiàn)在就為大家來簡單介紹下什么是聲母
X 關(guān)閉
X 關(guān)閉