《諷刺與幽默》供圖
近10年來,以深度學(xué)習(xí)為主要技術(shù)路線的人工智能(AI),從判別(如圖像、文字、語音識(shí)別等)到生成(如文本、圖像、視頻、程序等)接連取得突破,DeepSeek、ChatGPT、Sora等應(yīng)用展示多種技術(shù)可能。作為革命性通用技術(shù),人工智能正加速融入人們的日常生活、生產(chǎn)工作和學(xué)習(xí)研究之中,推動(dòng)人類經(jīng)濟(jì)社會(huì)信息化進(jìn)程邁向智能化的新階段。
發(fā)展新階段:從判別到生成,從單模態(tài)到多模態(tài),從專用到通用
人工智能作為近年來科技領(lǐng)域最熱門的話題之一,其實(shí)并不是一項(xiàng)新技術(shù)。早在1956年,人工智能的概念就在美國達(dá)特茅斯學(xué)院召開的夏季研討會(huì)上被提出。此后經(jīng)歷半個(gè)多世紀(jì)發(fā)展,都未能實(shí)現(xiàn)真正的實(shí)用化。2012年,加拿大多倫多大學(xué)教授杰弗里·欣頓和他的學(xué)生基于機(jī)器學(xué)習(xí)提出的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型,在圖像識(shí)別挑戰(zhàn)賽上取得重大突破,激發(fā)AI領(lǐng)域的又一次發(fā)展熱潮,推動(dòng)語音識(shí)別、圖像識(shí)別以及自然語言處理等多個(gè)領(lǐng)域快速進(jìn)步。
AI技術(shù)不斷迭代升級。特別是2022年前后,生成式人工智能迎來全面爆發(fā)。2022年11月,美國OpenAI公司推出ChatGPT,以更大規(guī)模的模型實(shí)現(xiàn)了更強(qiáng)的內(nèi)容生成(AIGC)功能。2024年2月,OpenAI公司推出的文生視頻大模型Sora,推動(dòng)生成式人工智能從只能理解單一形式信息(比如文字、圖片、音頻等)的單模態(tài),邁向可以同時(shí)理解多種形式信息(比如圖片和文字)的多模態(tài)。與此同時(shí),全球的AI大模型競相超越又各有特長,國外谷歌的雙子座(Gemini)、安索皮克(Anthropic)的克勞德(Claude)、元公司(Meta)的Llama,中國的文心一言、智譜清言、豆包、書生·浦語、星火認(rèn)知、360智腦、通義千問、混元、Kimi、零一萬物等,形成百花競放的局面。
2025年1月,我國人工智能企業(yè)深度求索(DeepSeek)推出新模型DeepSeek—R1,憑借技術(shù)創(chuàng)新和商業(yè)化潛力引發(fā)全球矚目。這不僅是因?yàn)樵撃P驮谧匀徽Z言處理方面表現(xiàn)卓越,更為重要的是其在訓(xùn)練方法上實(shí)現(xiàn)了創(chuàng)新,成功降低了同類產(chǎn)品對算力資源的大量需求,顯著降低了使用成本。得益于此,用戶可將R1部署在個(gè)人本地設(shè)備,實(shí)現(xiàn)更為安全且個(gè)性化的服務(wù)。尤為重要的是,DeepSeek的開源模式為全球創(chuàng)新發(fā)展帶來新機(jī)遇,并有可能帶動(dòng)全行業(yè)在未來形成以開源為主流的發(fā)展路線。
從判別到生成,從單模態(tài)到多模態(tài),從專用到通用,是智能化發(fā)展新階段的重要標(biāo)志。人工智能以自然語言為基礎(chǔ)的表達(dá)方式,正從方方面面滲透進(jìn)大眾生活。從手機(jī)應(yīng)用、智能音箱等智能助手,到智能網(wǎng)聯(lián)車和智能機(jī)器人等具身智能,再到能提供個(gè)性化服務(wù)的智能體以及更多的AI原生產(chǎn)品和服務(wù),正加速向我們走來。
核心驅(qū)動(dòng)力:計(jì)算機(jī)能夠從數(shù)據(jù)中學(xué)習(xí)規(guī)律并做出預(yù)測或決策
機(jī)器學(xué)習(xí)是指通過數(shù)據(jù)訓(xùn)練模型,使計(jì)算機(jī)能夠從數(shù)據(jù)中學(xué)習(xí)規(guī)律并做出預(yù)測或決策。作為當(dāng)下AI發(fā)展的主流技術(shù)路線,這條路線讓機(jī)器通過學(xué)習(xí)而不是靠預(yù)設(shè)規(guī)則來獲得智能,體現(xiàn)了學(xué)習(xí)是智能形成和發(fā)展的本質(zhì)??梢哉f,生物智能也好、機(jī)器智能也好,都離不開學(xué)習(xí),所有的成功和突破都源自學(xué)習(xí)。“生而知之”畢竟是極少數(shù)天才的特質(zhì),“學(xué)而知之”才適用于大多數(shù)人。人類在發(fā)展人工智能時(shí)也采用了學(xué)習(xí)的路線。
機(jī)器學(xué)習(xí)主要通過神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)。神經(jīng)網(wǎng)絡(luò)作為機(jī)器學(xué)習(xí)的一種具體模型,就是通過模擬人腦的結(jié)構(gòu)和功能來處理數(shù)據(jù)。人類大腦是由神經(jīng)元和突觸構(gòu)成,神經(jīng)元通過突觸傳遞信號,實(shí)現(xiàn)信息處理、學(xué)習(xí)和記憶等功能。人工神經(jīng)網(wǎng)絡(luò)模擬這一結(jié)構(gòu),利用集成電路芯片組成的電子計(jì)算系統(tǒng),采用人工神經(jīng)元和連接(即模型參數(shù))代替生物神經(jīng)元和突觸,通過輸入數(shù)據(jù)、調(diào)整權(quán)重來學(xué)習(xí)和預(yù)測,構(gòu)成了AI的物質(zhì)底座。
正如人腦層數(shù)越多,處理復(fù)雜信息的能力就越強(qiáng),神經(jīng)網(wǎng)絡(luò)也同樣需要更多的層數(shù),這就需要借助深度神經(jīng)網(wǎng)絡(luò)。以深度神經(jīng)網(wǎng)絡(luò)構(gòu)建的深度學(xué)習(xí)系統(tǒng)即為AI“模型”,這類模型的參數(shù)越多,就意味著模型越大,性能越強(qiáng)。例如,GPT—3模型實(shí)現(xiàn)了千億量級參數(shù),GPT—4模型參數(shù)甚至達(dá)萬億量級。
簡而言之,機(jī)器學(xué)習(xí)是人工智能的核心驅(qū)動(dòng)力,它通過從海量數(shù)據(jù)中提取有價(jià)值的信息,幫助人類做出預(yù)測、判斷和生成所需的內(nèi)容,從而提升任務(wù)處理效率,將人力從繁重、重復(fù)、低級和危險(xiǎn)的勞動(dòng)中解放出來。2024年的諾貝爾物理學(xué)獎(jiǎng)?lì)C給了約翰·霍普菲爾德和杰弗里·欣頓,以表彰他們通過人工神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)機(jī)器學(xué)習(xí)的基礎(chǔ)性發(fā)現(xiàn)和發(fā)明。展望未來,機(jī)器學(xué)習(xí)通過不斷發(fā)展,必將為人類社會(huì)帶來更大驚喜。
更廣泛運(yùn)用:AI智能體可望成為今年發(fā)展應(yīng)用亮點(diǎn)
2025年將是AI走向更廣和更深應(yīng)用的關(guān)鍵之年,AI智能體(或稱AI代理)可望成為今年AI發(fā)展應(yīng)用的亮點(diǎn)。AI智能體可以說是人工智能技術(shù)的集大成者,具備自主性、感知能力、決策能力和行動(dòng)能力等顯著優(yōu)勢。它能夠通過理解交辦的任務(wù)、感知相應(yīng)的執(zhí)行環(huán)境,進(jìn)而自主調(diào)用相應(yīng)的智能模型功能、采取相應(yīng)的行動(dòng),可以廣泛應(yīng)用于工業(yè)、醫(yī)療、交通、金融和家庭等領(lǐng)域。每個(gè)用戶可能有多個(gè)AI智能體幫助解決各種需求,它們有的像是秘書,有的像是工匠,有的像是醫(yī)護(hù),有的像是采購員,有的像是清潔工。
例如,某公司計(jì)劃設(shè)計(jì)一個(gè)活動(dòng)邀請系統(tǒng),在將活動(dòng)時(shí)間、地點(diǎn)和主題等信息準(zhǔn)確傳達(dá)后,AI可自動(dòng)生成一個(gè)智能體“小組長”,負(fù)責(zé)整體規(guī)劃和調(diào)度。小組長可以召喚多個(gè)執(zhí)行不同具體任務(wù)的智能體,1號智能體負(fù)責(zé)活動(dòng)邀請函的策劃,2號智能體負(fù)責(zé)設(shè)計(jì)邀請函中的圖像及文字,3號智能體負(fù)責(zé)代碼制作和部署網(wǎng)頁,4號智能體負(fù)責(zé)檢驗(yàn)差錯(cuò),他們就像是一個(gè)“工作專班”,成為完成個(gè)性化工作的“群體智能”。
通過AI智能體,各種AI技術(shù)將會(huì)被更方便、更廣泛、更有效地應(yīng)用起來,將在多個(gè)領(lǐng)域引發(fā)根本性變革。同時(shí),快速發(fā)展的“科研智能”正在形成科學(xué)發(fā)展的新范式,為科技這一第一生產(chǎn)力的發(fā)展賦能,意義深刻而長遠(yuǎn)。在這個(gè)日新月異的智能時(shí)代,學(xué)會(huì)應(yīng)用AI技術(shù)也將成為多數(shù)人的必備技能,人們需要學(xué)會(huì)以有效而適當(dāng)?shù)姆绞竭\(yùn)用AI助益工作和生活。
“兩岸猿聲啼不住,輕舟已過萬重山?!彪S著AI在生命科學(xué)、物質(zhì)科學(xué)、數(shù)學(xué)、工程技術(shù)等領(lǐng)域的應(yīng)用日益廣泛和深入,可以預(yù)見,正如歷史上機(jī)械動(dòng)力和電氣技術(shù)極大拓展了人類的體力勞動(dòng)能力一樣,AI正在加速拓展人類的腦力勞動(dòng)能力,推動(dòng)生產(chǎn)力實(shí)現(xiàn)又一次質(zhì)的飛躍,并對人類社會(huì)的發(fā)展進(jìn)步產(chǎn)生全面而深遠(yuǎn)的影響。
在AI先進(jìn)生產(chǎn)力驅(qū)動(dòng)的社會(huì)智能化歷史進(jìn)程面前,人類要把握和主導(dǎo)自身的命運(yùn),就必須提升自身的智能化能力,學(xué)會(huì)駕馭AI。各方應(yīng)努力讓AI行駛在促進(jìn)經(jīng)濟(jì)繁榮和環(huán)境保護(hù)、保護(hù)公共利益和個(gè)人隱私、遵守法律法規(guī)和倫理良俗、促進(jìn)公平正義與包容和諧的軌道上,確保AI造福全人類的可持續(xù)發(fā)展。
(作者為中國新一代人工智能發(fā)展戰(zhàn)略研究院執(zhí)行院長)
鏈接
AI同學(xué),請回答
網(wǎng)友問:什么是深度神經(jīng)網(wǎng)絡(luò)?可以通俗易懂地介紹一下嗎?
DeepSeek:
深度神經(jīng)網(wǎng)絡(luò)(DNN)是一種模仿人腦神經(jīng)結(jié)構(gòu)的機(jī)器學(xué)習(xí)技術(shù),專門處理復(fù)雜數(shù)據(jù)。你可以把它想象成一個(gè)“多層級加工廠”:比如識(shí)別貓的照片,第一層先看像素點(diǎn),第二層組合成線條,第三層拼出貓耳、胡須等特征,最后一層綜合判斷這是貓。每層由大量“神經(jīng)元”(數(shù)學(xué)計(jì)算單元)組成,層與層之間通過可調(diào)節(jié)的“連接強(qiáng)度”傳遞信息。
它的核心能力在于自動(dòng)學(xué)習(xí)特征。傳統(tǒng)算法需要人工設(shè)計(jì)規(guī)則(比如,先找邊緣、再識(shí)別形狀),而DNN能通過海量數(shù)據(jù)自己發(fā)現(xiàn)規(guī)律。訓(xùn)練時(shí)就像教小孩認(rèn)字:先猜結(jié)果,對比正確答案,再反向調(diào)整各層神經(jīng)元的計(jì)算參數(shù),經(jīng)過數(shù)萬次迭代后越來越精準(zhǔn)。
這種結(jié)構(gòu)讓它在圖像識(shí)別、語音翻譯、自動(dòng)駕駛等領(lǐng)域表現(xiàn)突出,尤其在處理非結(jié)構(gòu)化數(shù)據(jù)(圖片、文字)時(shí)遠(yuǎn)超傳統(tǒng)編程。但前提條件是需要大量算力和數(shù)據(jù),模型內(nèi)部決策過程也像“黑箱”一樣,難以完全解釋。
專家點(diǎn)評:
深度神經(jīng)網(wǎng)絡(luò)的強(qiáng)大特征提取能力,與其網(wǎng)絡(luò)結(jié)構(gòu)與規(guī)模分不開。根據(jù)通用逼近定理,只要神經(jīng)元及其連接的數(shù)量足夠大,就可以逼近任意復(fù)雜的連續(xù)函數(shù)。而這些數(shù)量巨大的“參數(shù)”,是通過訓(xùn)練(學(xué)習(xí))來確定的。相信隨著網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練方法的持續(xù)創(chuàng)新,深度神經(jīng)網(wǎng)絡(luò)的能力還可繼續(xù)提升。
網(wǎng)友問:我們應(yīng)該如何理解大語言模型這個(gè)概念?別太復(fù)雜。
通義千問:
大語言模型可以理解為一個(gè)“超級聰明的文字助手”,它通過學(xué)習(xí)海量的文本數(shù)據(jù),掌握人類語言的規(guī)律和知識(shí)。你可以把它想象成一個(gè)讀過無數(shù)書籍、文章、網(wǎng)頁的“大腦”,它知道怎么回答問題、寫文章、講故事,甚至還能編程、翻譯、聊天。
它的核心能力是預(yù)測下一個(gè)詞。比如你輸入一句話的開頭,它會(huì)根據(jù)上下文猜測接下來最可能說什么。通過這種方式,它能生成連貫、自然的文字。而且,因?yàn)樗鼘W(xué)了很多知識(shí),所以不僅能回答簡單問題,還能處理復(fù)雜的任務(wù),比如分析邏輯、總結(jié)長文或者模仿某種寫作風(fēng)格。
不過,大語言模型并不是真正“理解”文字,它更像是在模仿人類的語言模式。它沒有感情,也不會(huì)主動(dòng)思考,只是根據(jù)輸入的內(nèi)容給出最合適的回應(yīng)。所以,有時(shí)候它的答案可能看起來很合理,但其實(shí)是錯(cuò)的,這就需要我們?nèi)ヅ袛嗪秃藢?shí)。
專家點(diǎn)評:
大語言模型不僅網(wǎng)絡(luò)規(guī)模龐大,還采用一個(gè)重要的技術(shù)即“詞嵌入”技術(shù)。該技術(shù)將自然語言的“詞”嵌入到多維的語義空間,表達(dá)為“語義矢量”,從而可以對“詞”進(jìn)行計(jì)算,由此可以跨越語言的形式(如英語、漢語,文本、圖像等),生成各方面內(nèi)容。大語言模型的突破推動(dòng)了人工智能幾乎所有(應(yīng)用語言)領(lǐng)域的應(yīng)用,但也面臨生成偏差、算力消耗、倫理風(fēng)險(xiǎn)等挑戰(zhàn),需結(jié)合人類監(jiān)督與技術(shù)優(yōu)化以實(shí)現(xiàn)安全可控的發(fā)展。
(專家為中國新一代人工智能發(fā)展戰(zhàn)略研究院執(zhí)行院長龔克)
《 人民日報(bào) 》( 2025年02月26日 16 版)
北疆新聞 | 內(nèi)蒙古自治區(qū)重點(diǎn)新媒體平臺(tái),內(nèi)蒙古出版集團(tuán)?內(nèi)蒙古新華報(bào)業(yè)中心主管主辦的國家互聯(lián)網(wǎng)新聞信息采編發(fā)布服務(wù)一類資質(zhì)平臺(tái)。
北疆新聞版權(quán)與免責(zé)聲明:
一、凡本站中注明“來源:北疆新聞”的所有文字、圖片和音視頻,版權(quán)均屬北疆新聞所有,轉(zhuǎn)載時(shí)必須注明“來源:北疆新聞”,并附上原文鏈接。
二、凡來源非北疆新聞的新聞(作品)只代表本網(wǎng)傳播該消息,并不代表贊同其觀點(diǎn)。
如因作品內(nèi)容、版權(quán)和其它問題需要同本網(wǎng)聯(lián)系的,請?jiān)谝娋W(wǎng)后30日內(nèi)進(jìn)行,聯(lián)系郵箱:bjwmaster@163.com。
版權(quán)聲明:北疆新聞版權(quán)所有,未經(jīng)書面授權(quán),不得轉(zhuǎn)載或建立鏡像,違者依法必究。 本站違法和不良信息舉報(bào)電話:15648148811蒙ICP備16001043號-1
Copyright © 2016- 北疆新聞 All Rights Reserved互聯(lián)網(wǎng)新聞信息服務(wù)許可證:15120200009-1蒙公網(wǎng)安備:15010502001245