人工智能，從深度學(xué)習(xí)到全面賦能（科技前沿）

2025年02月26日 05:48 來源：人民日報(bào) 關(guān)燈

《諷刺與幽默》供圖

近10年來，以深度學(xué)習(xí)為主要技術(shù)路線的人工智能（AI），從判別（如圖像、文字、語音識(shí)別等）到生成（如文本、圖像、視頻、程序等）接連取得突破，DeepSeek、ChatGPT、Sora等應(yīng)用展示多種技術(shù)可能。作為革命性通用技術(shù)，人工智能正加速融入人們的日常生活、生產(chǎn)工作和學(xué)習(xí)研究之中，推動(dòng)人類經(jīng)濟(jì)社會(huì)信息化進(jìn)程邁向智能化的新階段。

發(fā)展新階段：從判別到生成，從單模態(tài)到多模態(tài)，從專用到通用

人工智能作為近年來科技領(lǐng)域最熱門的話題之一，其實(shí)并不是一項(xiàng)新技術(shù)。早在1956年，人工智能的概念就在美國達(dá)特茅斯學(xué)院召開的夏季研討會(huì)上被提出。此后經(jīng)歷半個(gè)多世紀(jì)發(fā)展，都未能實(shí)現(xiàn)真正的實(shí)用化。2012年，加拿大多倫多大學(xué)教授杰弗里·欣頓和他的學(xué)生基于機(jī)器學(xué)習(xí)提出的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型，在圖像識(shí)別挑戰(zhàn)賽上取得重大突破，激發(fā)AI領(lǐng)域的又一次發(fā)展熱潮，推動(dòng)語音識(shí)別、圖像識(shí)別以及自然語言處理等多個(gè)領(lǐng)域快速進(jìn)步。

AI技術(shù)不斷迭代升級。特別是2022年前后，生成式人工智能迎來全面爆發(fā)。2022年11月，美國OpenAI公司推出ChatGPT，以更大規(guī)模的模型實(shí)現(xiàn)了更強(qiáng)的內(nèi)容生成（AIGC）功能。2024年2月，OpenAI公司推出的文生視頻大模型Sora，推動(dòng)生成式人工智能從只能理解單一形式信息（比如文字、圖片、音頻等）的單模態(tài)，邁向可以同時(shí)理解多種形式信息（比如圖片和文字）的多模態(tài)。與此同時(shí)，全球的AI大模型競相超越又各有特長，國外谷歌的雙子座（Gemini）、安索皮克（Anthropic）的克勞德（Claude）、元公司（Meta）的Llama，中國的文心一言、智譜清言、豆包、書生·浦語、星火認(rèn)知、360智腦、通義千問、混元、Kimi、零一萬物等，形成百花競放的局面。

2025年1月，我國人工智能企業(yè)深度求索（DeepSeek）推出新模型DeepSeek—R1，憑借技術(shù)創(chuàng)新和商業(yè)化潛力引發(fā)全球矚目。這不僅是因?yàn)樵撃Ｐ驮谧匀徽Z言處理方面表現(xiàn)卓越，更為重要的是其在訓(xùn)練方法上實(shí)現(xiàn)了創(chuàng)新，成功降低了同類產(chǎn)品對算力資源的大量需求，顯著降低了使用成本。得益于此，用戶可將R1部署在個(gè)人本地設(shè)備，實(shí)現(xiàn)更為安全且個(gè)性化的服務(wù)。尤為重要的是，DeepSeek的開源模式為全球創(chuàng)新發(fā)展帶來新機(jī)遇，并有可能帶動(dòng)全行業(yè)在未來形成以開源為主流的發(fā)展路線。

從判別到生成，從單模態(tài)到多模態(tài)，從專用到通用，是智能化發(fā)展新階段的重要標(biāo)志。人工智能以自然語言為基礎(chǔ)的表達(dá)方式，正從方方面面滲透進(jìn)大眾生活。從手機(jī)應(yīng)用、智能音箱等智能助手，到智能網(wǎng)聯(lián)車和智能機(jī)器人等具身智能，再到能提供個(gè)性化服務(wù)的智能體以及更多的AI原生產(chǎn)品和服務(wù)，正加速向我們走來。

核心驅(qū)動(dòng)力：計(jì)算機(jī)能夠從數(shù)據(jù)中學(xué)習(xí)規(guī)律并做出預(yù)測或決策

機(jī)器學(xué)習(xí)是指通過數(shù)據(jù)訓(xùn)練模型，使計(jì)算機(jī)能夠從數(shù)據(jù)中學(xué)習(xí)規(guī)律并做出預(yù)測或決策。作為當(dāng)下AI發(fā)展的主流技術(shù)路線，這條路線讓機(jī)器通過學(xué)習(xí)而不是靠預(yù)設(shè)規(guī)則來獲得智能，體現(xiàn)了學(xué)習(xí)是智能形成和發(fā)展的本質(zhì)?？梢哉f，生物智能也好、機(jī)器智能也好，都離不開學(xué)習(xí)，所有的成功和突破都源自學(xué)習(xí)。“生而知之”畢竟是極少數(shù)天才的特質(zhì)，“學(xué)而知之”才適用于大多數(shù)人。人類在發(fā)展人工智能時(shí)也采用了學(xué)習(xí)的路線。

機(jī)器學(xué)習(xí)主要通過神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)。神經(jīng)網(wǎng)絡(luò)作為機(jī)器學(xué)習(xí)的一種具體模型，就是通過模擬人腦的結(jié)構(gòu)和功能來處理數(shù)據(jù)。人類大腦是由神經(jīng)元和突觸構(gòu)成，神經(jīng)元通過突觸傳遞信號，實(shí)現(xiàn)信息處理、學(xué)習(xí)和記憶等功能。人工神經(jīng)網(wǎng)絡(luò)模擬這一結(jié)構(gòu)，利用集成電路芯片組成的電子計(jì)算系統(tǒng)，采用人工神經(jīng)元和連接（即模型參數(shù)）代替生物神經(jīng)元和突觸，通過輸入數(shù)據(jù)、調(diào)整權(quán)重來學(xué)習(xí)和預(yù)測，構(gòu)成了AI的物質(zhì)底座。

正如人腦層數(shù)越多，處理復(fù)雜信息的能力就越強(qiáng)，神經(jīng)網(wǎng)絡(luò)也同樣需要更多的層數(shù)，這就需要借助深度神經(jīng)網(wǎng)絡(luò)。以深度神經(jīng)網(wǎng)絡(luò)構(gòu)建的深度學(xué)習(xí)系統(tǒng)即為AI“模型”，這類模型的參數(shù)越多，就意味著模型越大，性能越強(qiáng)。例如，GPT—3模型實(shí)現(xiàn)了千億量級參數(shù)，GPT—4模型參數(shù)甚至達(dá)萬億量級。

簡而言之，機(jī)器學(xué)習(xí)是人工智能的核心驅(qū)動(dòng)力，它通過從海量數(shù)據(jù)中提取有價(jià)值的信息，幫助人類做出預(yù)測、判斷和生成所需的內(nèi)容，從而提升任務(wù)處理效率，將人力從繁重、重復(fù)、低級和危險(xiǎn)的勞動(dòng)中解放出來。2024年的諾貝爾物理學(xué)獎(jiǎng)?lì)C給了約翰·霍普菲爾德和杰弗里·欣頓，以表彰他們通過人工神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)機(jī)器學(xué)習(xí)的基礎(chǔ)性發(fā)現(xiàn)和發(fā)明。展望未來，機(jī)器學(xué)習(xí)通過不斷發(fā)展，必將為人類社會(huì)帶來更大驚喜。

更廣泛運(yùn)用：AI智能體可望成為今年發(fā)展應(yīng)用亮點(diǎn)

2025年將是AI走向更廣和更深應(yīng)用的關(guān)鍵之年，AI智能體（或稱AI代理）可望成為今年AI發(fā)展應(yīng)用的亮點(diǎn)。AI智能體可以說是人工智能技術(shù)的集大成者，具備自主性、感知能力、決策能力和行動(dòng)能力等顯著優(yōu)勢。它能夠通過理解交辦的任務(wù)、感知相應(yīng)的執(zhí)行環(huán)境，進(jìn)而自主調(diào)用相應(yīng)的智能模型功能、采取相應(yīng)的行動(dòng)，可以廣泛應(yīng)用于工業(yè)、醫(yī)療、交通、金融和家庭等領(lǐng)域。每個(gè)用戶可能有多個(gè)AI智能體幫助解決各種需求，它們有的像是秘書，有的像是工匠，有的像是醫(yī)護(hù)，有的像是采購員，有的像是清潔工。

例如，某公司計(jì)劃設(shè)計(jì)一個(gè)活動(dòng)邀請系統(tǒng)，在將活動(dòng)時(shí)間、地點(diǎn)和主題等信息準(zhǔn)確傳達(dá)后，AI可自動(dòng)生成一個(gè)智能體“小組長”，負(fù)責(zé)整體規(guī)劃和調(diào)度。小組長可以召喚多個(gè)執(zhí)行不同具體任務(wù)的智能體，1號智能體負(fù)責(zé)活動(dòng)邀請函的策劃，2號智能體負(fù)責(zé)設(shè)計(jì)邀請函中的圖像及文字，3號智能體負(fù)責(zé)代碼制作和部署網(wǎng)頁，4號智能體負(fù)責(zé)檢驗(yàn)差錯(cuò)，他們就像是一個(gè)“工作專班”，成為完成個(gè)性化工作的“群體智能”。

通過AI智能體，各種AI技術(shù)將會(huì)被更方便、更廣泛、更有效地應(yīng)用起來，將在多個(gè)領(lǐng)域引發(fā)根本性變革。同時(shí)，快速發(fā)展的“科研智能”正在形成科學(xué)發(fā)展的新范式，為科技這一第一生產(chǎn)力的發(fā)展賦能，意義深刻而長遠(yuǎn)。在這個(gè)日新月異的智能時(shí)代，學(xué)會(huì)應(yīng)用AI技術(shù)也將成為多數(shù)人的必備技能，人們需要學(xué)會(huì)以有效而適當(dāng)?shù)姆绞竭\(yùn)用AI助益工作和生活。

“兩岸猿聲啼不住，輕舟已過萬重山?！彪S著AI在生命科學(xué)、物質(zhì)科學(xué)、數(shù)學(xué)、工程技術(shù)等領(lǐng)域的應(yīng)用日益廣泛和深入，可以預(yù)見，正如歷史上機(jī)械動(dòng)力和電氣技術(shù)極大拓展了人類的體力勞動(dòng)能力一樣，AI正在加速拓展人類的腦力勞動(dòng)能力，推動(dòng)生產(chǎn)力實(shí)現(xiàn)又一次質(zhì)的飛躍，并對人類社會(huì)的發(fā)展進(jìn)步產(chǎn)生全面而深遠(yuǎn)的影響。

在AI先進(jìn)生產(chǎn)力驅(qū)動(dòng)的社會(huì)智能化歷史進(jìn)程面前，人類要把握和主導(dǎo)自身的命運(yùn)，就必須提升自身的智能化能力，學(xué)會(huì)駕馭AI。各方應(yīng)努力讓AI行駛在促進(jìn)經(jīng)濟(jì)繁榮和環(huán)境保護(hù)、保護(hù)公共利益和個(gè)人隱私、遵守法律法規(guī)和倫理良俗、促進(jìn)公平正義與包容和諧的軌道上，確保AI造福全人類的可持續(xù)發(fā)展。

（作者為中國新一代人工智能發(fā)展戰(zhàn)略研究院執(zhí)行院長）

鏈接

AI同學(xué)，請回答

網(wǎng)友問：什么是深度神經(jīng)網(wǎng)絡(luò)？可以通俗易懂地介紹一下嗎？

DeepSeek：

深度神經(jīng)網(wǎng)絡(luò)（DNN）是一種模仿人腦神經(jīng)結(jié)構(gòu)的機(jī)器學(xué)習(xí)技術(shù)，專門處理復(fù)雜數(shù)據(jù)。你可以把它想象成一個(gè)“多層級加工廠”：比如識(shí)別貓的照片，第一層先看像素點(diǎn)，第二層組合成線條，第三層拼出貓耳、胡須等特征，最后一層綜合判斷這是貓。每層由大量“神經(jīng)元”（數(shù)學(xué)計(jì)算單元）組成，層與層之間通過可調(diào)節(jié)的“連接強(qiáng)度”傳遞信息。

它的核心能力在于自動(dòng)學(xué)習(xí)特征。傳統(tǒng)算法需要人工設(shè)計(jì)規(guī)則（比如，先找邊緣、再識(shí)別形狀），而DNN能通過海量數(shù)據(jù)自己發(fā)現(xiàn)規(guī)律。訓(xùn)練時(shí)就像教小孩認(rèn)字：先猜結(jié)果，對比正確答案，再反向調(diào)整各層神經(jīng)元的計(jì)算參數(shù)，經(jīng)過數(shù)萬次迭代后越來越精準(zhǔn)。

這種結(jié)構(gòu)讓它在圖像識(shí)別、語音翻譯、自動(dòng)駕駛等領(lǐng)域表現(xiàn)突出，尤其在處理非結(jié)構(gòu)化數(shù)據(jù)（圖片、文字）時(shí)遠(yuǎn)超傳統(tǒng)編程。但前提條件是需要大量算力和數(shù)據(jù)，模型內(nèi)部決策過程也像“黑箱”一樣，難以完全解釋。

專家點(diǎn)評：

深度神經(jīng)網(wǎng)絡(luò)的強(qiáng)大特征提取能力，與其網(wǎng)絡(luò)結(jié)構(gòu)與規(guī)模分不開。根據(jù)通用逼近定理，只要神經(jīng)元及其連接的數(shù)量足夠大，就可以逼近任意復(fù)雜的連續(xù)函數(shù)。而這些數(shù)量巨大的“參數(shù)”，是通過訓(xùn)練（學(xué)習(xí)）來確定的。相信隨著網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練方法的持續(xù)創(chuàng)新，深度神經(jīng)網(wǎng)絡(luò)的能力還可繼續(xù)提升。

網(wǎng)友問：我們應(yīng)該如何理解大語言模型這個(gè)概念？別太復(fù)雜。

通義千問：

大語言模型可以理解為一個(gè)“超級聰明的文字助手”，它通過學(xué)習(xí)海量的文本數(shù)據(jù)，掌握人類語言的規(guī)律和知識(shí)。你可以把它想象成一個(gè)讀過無數(shù)書籍、文章、網(wǎng)頁的“大腦”，它知道怎么回答問題、寫文章、講故事，甚至還能編程、翻譯、聊天。

它的核心能力是預(yù)測下一個(gè)詞。比如你輸入一句話的開頭，它會(huì)根據(jù)上下文猜測接下來最可能說什么。通過這種方式，它能生成連貫、自然的文字。而且，因?yàn)樗鼘W(xué)了很多知識(shí)，所以不僅能回答簡單問題，還能處理復(fù)雜的任務(wù)，比如分析邏輯、總結(jié)長文或者模仿某種寫作風(fēng)格。

不過，大語言模型并不是真正“理解”文字，它更像是在模仿人類的語言模式。它沒有感情，也不會(huì)主動(dòng)思考，只是根據(jù)輸入的內(nèi)容給出最合適的回應(yīng)。所以，有時(shí)候它的答案可能看起來很合理，但其實(shí)是錯(cuò)的，這就需要我們?nèi)ヅ袛嗪秃藢?shí)。

專家點(diǎn)評：

大語言模型不僅網(wǎng)絡(luò)規(guī)模龐大，還采用一個(gè)重要的技術(shù)即“詞嵌入”技術(shù)。該技術(shù)將自然語言的“詞”嵌入到多維的語義空間，表達(dá)為“語義矢量”，從而可以對“詞”進(jìn)行計(jì)算，由此可以跨越語言的形式（如英語、漢語，文本、圖像等），生成各方面內(nèi)容。大語言模型的突破推動(dòng)了人工智能幾乎所有（應(yīng)用語言）領(lǐng)域的應(yīng)用，但也面臨生成偏差、算力消耗、倫理風(fēng)險(xiǎn)等挑戰(zhàn)，需結(jié)合人類監(jiān)督與技術(shù)優(yōu)化以實(shí)現(xiàn)安全可控的發(fā)展。

（專家為中國新一代人工智能發(fā)展戰(zhàn)略研究院執(zhí)行院長龔克）

《人民日報(bào) 》（ 2025年02月26日 16 版）

北疆新聞 | 內(nèi)蒙古自治區(qū)重點(diǎn)新媒體平臺(tái)，內(nèi)蒙古出版集團(tuán)?內(nèi)蒙古新華報(bào)業(yè)中心主管主辦的國家互聯(lián)網(wǎng)新聞信息采編發(fā)布服務(wù)一類資質(zhì)平臺(tái)。

編輯：方琳

5959

安裝北疆新聞，免費(fèi)瀏覽更多精彩新聞資訊

北疆新聞版權(quán)與免責(zé)聲明：

一、凡本站中注明“來源：北疆新聞”的所有文字、圖片和音視頻，版權(quán)均屬北疆新聞所有，轉(zhuǎn)載時(shí)必須注明“來源：北疆新聞”，并附上原文鏈接。

二、凡來源非北疆新聞的新聞（作品）只代表本網(wǎng)傳播該消息，并不代表贊同其觀點(diǎn)。

如因作品內(nèi)容、版權(quán)和其它問題需要同本網(wǎng)聯(lián)系的，請?jiān)谝娋W(wǎng)后30日內(nèi)進(jìn)行，聯(lián)系郵箱：bjwmaster@163.com。

為你推薦

【大美邊疆·飛閱內(nèi)蒙古】蒼茫云海間俯瞰馬鞍山

熱點(diǎn)排榜

國家能源局答人民網(wǎng)記者問：多措并舉推動(dòng)煤層氣增儲(chǔ)上產(chǎn) 人民網(wǎng)北京1月25日電（王紹紹）1月25日，國家能源局舉行......

色综合天天干,日韩人妻无码一区av免费,国产成人综合日韩精品婷婷九月,国产98色在线,欧美一级a在线作爱免费观看,亚洲精品美女网站在线观看,99久久亚洲综合精品网站

為你推薦

熱點(diǎn)排榜