“AI科學(xué)家”登場，科研自動化時代來了？

北疆新聞 > 經(jīng)濟 > 正文

2024年09月12日 09:14 來源：科技日報關(guān)燈

科研過程可以完全自動化嗎？一個研究機器學(xué)習(xí)的國際團隊正在勇闖“無人區(qū)”。

據(jù)《自然》網(wǎng)站近日報道，日本Sakana AI公司和加拿大、英國科學(xué)家攜手，創(chuàng)建了一種基于大語言模型的“人工智能（AI）科學(xué)家”。從閱讀文獻到提出新假設(shè)，再到嘗試各種解決方案并撰寫論文，整個研究周期，“AI科學(xué)家”能一氣呵成。

Sakana公司在其官網(wǎng)表示，這位科研“新星”是首個用于自動化科研和開放式發(fā)現(xiàn)的綜合AI系統(tǒng)，標(biāo)志著科學(xué)發(fā)現(xiàn)新時代的開始。盡管它展現(xiàn)出非凡的潛力，但目前并不完美，應(yīng)警惕“AI科學(xué)家”被濫用的風(fēng)險。

推進流程行云流水

AI技術(shù)不斷進步，讓科學(xué)家能借助一些模型來集思廣益或編寫代碼。然而，這些模型仍然需要大量人工監(jiān)督，或僅囿于執(zhí)行特定任務(wù)。

那么，能否利用基礎(chǔ)模型將整個科研過程自動化呢？包括加拿大不列顛哥倫比亞大學(xué)機器學(xué)習(xí)專家在內(nèi)的團隊，成功創(chuàng)建出首位“AI科學(xué)家”。

在想法生成階段，該“AI科學(xué)家”基于一個起始模板，先進行“頭腦風(fēng)暴”，提出多個不同研究方向，并進行廣泛搜索，以確保某些想法是新穎且有趣的；在實驗迭代階段，對于第一階段提出的某個想法，“AI科學(xué)家”會先開展實驗，然后生成圖表可視化結(jié)果，并給每個圖表添加注釋；在論文寫作階段，它會模仿標(biāo)準(zhǔn)機器學(xué)習(xí)會議的風(fēng)格，撰寫出一份文字簡練、內(nèi)容豐富的論文，并自主查找相關(guān)論文進行引用；在自動化同行評審階段，研究團隊開發(fā)出一個自動化的“AI審稿人”，其評估生成論文的準(zhǔn)確性堪與人類相媲美。評估結(jié)果和建議可用于改進該項目，實現(xiàn)持續(xù)的反饋循環(huán)，使“AI科學(xué)家”能夠迭代改進其研究成果。

在最初的演示中，該“AI科學(xué)家”針對擴散模型、Transformer模型（一種用于處理語言數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)模型），以及AI“領(lǐng)悟”（grokking）等機器學(xué)習(xí)子領(lǐng)域進行了深入研究，總共生成了10篇論文，每篇論文的成本約15美元。

美國華盛頓大學(xué)計算社會科學(xué)家杰文·韋斯特表示，該“AI科學(xué)家”行云流水般完成了整個科研流程，令人印象深刻，有望加速科學(xué)發(fā)現(xiàn)的步伐。

功能遠非盡善盡美

盡管這位“AI科學(xué)家”潛能巨大，但它遠非盡善盡美。

Sakana AI公司指出，“AI科學(xué)家”目前還不具備視覺功能，因此無法修復(fù)論文中出現(xiàn)的圖表問題。例如，它生成的圖表有時無法讀取，表格有時會超出頁面范圍，頁面布局也并不美觀。

此外，該“AI科學(xué)家”有時會出現(xiàn)想法正確但執(zhí)行錯誤的情況，也會因比較不當(dāng)而生成誤導(dǎo)性的結(jié)果。在撰寫論文和評估結(jié)論時，它還可能會犯嚴(yán)重錯誤。例如，它很難比較兩個數(shù)字的大小，這是大語言模型的“通病”。為了部分解決這個問題，研究團隊確保所有實驗結(jié)果都可以重復(fù)，并存儲了所有執(zhí)行文件。

研究人員預(yù)計，未來多模態(tài)模型“加入戰(zhàn)局”，將助該“AI科學(xué)家”一臂之力。

另外，該“AI科學(xué)家”只能開展機器學(xué)習(xí)領(lǐng)域的研究，且缺乏科研過程的關(guān)鍵部分：動手進行實驗的能力。

艾倫人工智能研究所計算機科學(xué)家湯姆·霍普表示，目前該大語言模型“仍無法提出并制定新穎有用的科學(xué)方向”。勞倫斯伯克利國家實驗室材料科學(xué)家赫布蘭德·希德則認(rèn)為，即使該系統(tǒng)在短期內(nèi)無法完成更具創(chuàng)造性的工作，仍可將科研過程中一些重復(fù)性內(nèi)容自動化。

Sakana AI也強調(diào)，此類系統(tǒng)能否提出真正的變革型想法仍未有定論。未來的“AI科學(xué)家”能否發(fā)明出像人工神經(jīng)網(wǎng)絡(luò)或信息論一樣的概念也還是個未知數(shù)。

能力越強越需慎用

研究人員表示，為擴大該“AI科學(xué)家”的能力，讓其能夠研究更抽象的領(lǐng)域，如純數(shù)學(xué)領(lǐng)域，可能需要調(diào)遣語言模型之外的其他技術(shù)。

例如，解決數(shù)學(xué)問題需要邏輯推理，而目前大多數(shù)AI模型都不擅長邏輯推理。鑒于此，谷歌深度思維公司開發(fā)出AlphaGeometr，將語言模型與符號引擎（使用符號和邏輯規(guī)則進行推理）相結(jié)合，構(gòu)建出一種神經(jīng)—符號混合系統(tǒng)。在今年的奧林匹克數(shù)學(xué)競賽中，升級后的AlphaGeometry2在19秒內(nèi)就解答出一道題，令人類選手望塵莫及。

研究人員堅信，目前的迭代只是個開始?！癆I科學(xué)家”就像AI科研自動化領(lǐng)域的GPT-1。隨著不斷迭代，它將如目前的GPT-4一樣，引發(fā)新的科研革命。

不過，與許多新技術(shù)一樣，“AI科學(xué)家”也打開了“潘多拉魔盒”，甚至可能被濫用。

譬如，“AI 科學(xué)家”能自動創(chuàng)建論文并提交，這將顯著增加審稿人的工作量，可能阻礙科學(xué)質(zhì)量控制，并給學(xué)術(shù)進步帶來壓力。而且，“AI科學(xué)家”還可能被用來制造危險的病毒，給人類社會帶來潛在危害。

北疆新聞：內(nèi)蒙古自治區(qū)重點新聞網(wǎng)站（客戶端），內(nèi)蒙古出版集團新華報業(yè)中心旗下國家互聯(lián)網(wǎng)新聞信息采編發(fā)布服務(wù)一類資質(zhì)網(wǎng)站（客戶端）。

編輯：方琳

97

安裝北疆新聞，免費瀏覽更多精彩新聞資訊

北疆新聞版權(quán)與免責(zé)聲明：

一、凡本站中注明“來源：北疆新聞”的所有文字、圖片和音視頻，版權(quán)均屬北疆新聞所有，轉(zhuǎn)載時必須注明“來源：北疆新聞”，并附上原文鏈接。

二、凡來源非北疆新聞的新聞（作品）只代表本網(wǎng)傳播該消息，并不代表贊同其觀點。

如因作品內(nèi)容、版權(quán)和其它問題需要同本網(wǎng)聯(lián)系的，請在見網(wǎng)后30日內(nèi)進行，聯(lián)系郵箱：bjwmaster@163.com。

為你推薦

美國舊金山灣區(qū)民眾集會抗議針對亞裔的歧視行為和仇恨犯罪

熱點排榜

第八屆“創(chuàng)青春”內(nèi)蒙古青年創(chuàng)新創(chuàng)業(yè)大賽圓滿收官 “創(chuàng)青春”內(nèi)蒙古青年創(chuàng)新創(chuàng)業(yè)大賽自2014年舉辦以來，......

色综合天天干,日韩人妻无码一区av免费,国产成人综合日韩精品婷婷九月,国产98色在线,欧美一级a在线作爱免费观看,亚洲精品美女网站在线观看,99久久亚洲综合精品网站

為你推薦

熱點排榜