亚洲国产婷婷_手机在线观看国产精品_日本一区二区三区在线视频_亚洲精品成人久久

首頁 > 汽車測評 > 汽車測評 > 谷歌推出兩大數(shù)學(xué)模型,19秒解開IMO2024幾何問題

谷歌推出兩大數(shù)學(xué)模型,19秒解開IMO2024幾何問題

發(fā)布時間:2024-07-26 22:54:23

六道題每題可得7分,總分最高42分。谷歌DeepMind的人工智能系統(tǒng)在今年國際數(shù)學(xué)奧林匹克競賽中最終得分28分。今年金牌的門檻是29分,在正式比賽的609名選手中,58名達(dá)到了這一門檻。

DeepMind人工智能系統(tǒng)在IMO 2024上相對于人類競爭者的表現(xiàn)。在42分的總分中,人工智能系統(tǒng)獲得了28分。

谷歌DeepMind的AI模型解決了今年國際數(shù)學(xué)奧林匹克競賽(IMO)六個問題中的四個問題,人工智能首次達(dá)到了銀牌標(biāo)準(zhǔn)。

當(dāng)?shù)貢r間7月25日,谷歌DeepMind公布專用于數(shù)學(xué)推理的模型AlphaProof,以及專注于幾何的模型更新版本AlphaGeometry 2。DeepMind表示,AlphaProof和AlphaGeometry 2解決了數(shù)學(xué)中的高級推理問題,具有先進(jìn)數(shù)學(xué)推理能力的通用人工智能或開啟科學(xué)和技術(shù)的新領(lǐng)域。

IMO是歷史最悠久、規(guī)模最大、最負(fù)盛名的青年數(shù)學(xué)家競賽,自1959年以來每年舉辦一次。選手要解決代數(shù)、組合學(xué)、幾何和數(shù)論方面六個異常困難的問題。菲爾茲獎是數(shù)學(xué)家的最高榮譽(yù)之一,菲爾茲獎獲得者也會代表他們的國家參加IMO。

近年來,IMO競賽被認(rèn)為是機(jī)器學(xué)習(xí)領(lǐng)域的重大挑戰(zhàn),也是衡量人工智能系統(tǒng)高級數(shù)學(xué)推理能力的理想基準(zhǔn)。

谷歌DeepMind表示,IMO的數(shù)學(xué)問題被人工翻譯成數(shù)學(xué)語言,供系統(tǒng)理解。在正式比賽中,學(xué)生們分兩次提交答案,每次4.5小時。而人工智能系統(tǒng)在幾分鐘內(nèi)解決了一個問題,花了三天時間來解決其他問題。基于強(qiáng)化學(xué)習(xí)的推理系統(tǒng)AlphaProof解決了兩個代數(shù)問題和一個數(shù)論問題并被證明答案正確,這些問題包括今年IMO比賽中只有5名選手解決的最難的問題。AlphaGeometry 2證明了幾何問題,但兩個組合問題仍未解決。

六道題每題可得7分,總分最高可達(dá)42分。DeepMind的人工智能系統(tǒng)最終得分28分。DeepMind表示,今年金牌的門檻從29分開始,在正式比賽的609名選手中,有58名達(dá)到了這個門檻。

“事實上,這個程序能想出這樣一個不明顯的結(jié)構(gòu)是非常令人印象深刻的,遠(yuǎn)遠(yuǎn)超出了我認(rèn)為的最先進(jìn)的水平。”IMO金牌得主和菲爾茲獎牌得主蒂莫西·高爾斯(Timothy Gowers)表示。

在大量書面文本上訓(xùn)練的人工智能模型歷來在數(shù)學(xué)推理方面很困難,往往傾向于語言智能而非數(shù)學(xué)智能,解決數(shù)學(xué)問題需要更復(fù)雜的推理技能。AlphaProof將預(yù)先訓(xùn)練好的語言模型與AlphaZero強(qiáng)化學(xué)習(xí)算法結(jié)合在一起,AlphaZero此前自學(xué)了如何掌握國際象棋、將棋和圍棋。

大語言模型容易產(chǎn)生幻覺,或以令人信服的方式傳遞錯誤信息。DeepMind表示,盡管基于自然語言的方法可以訪問更多數(shù)據(jù),但會產(chǎn)生看似合理但不正確的中間推理步驟和解決方案。而形式語言提供了一個重要優(yōu)勢,即涉及數(shù)學(xué)推理的證明可以被形式化地驗證其正確性。“我們通過微調(diào)Gemini模型,在這兩個互補(bǔ)的領(lǐng)域之間建立了一座橋梁,自動將自然語言問題語句轉(zhuǎn)換為形式語句,創(chuàng)建了一個不同難度的龐大形式問題庫。”

當(dāng)遇到一個數(shù)學(xué)問題時,AlphaProof會生成候選解決方案,然后搜索可能的證明步驟來證明或反駁它們。每一個被發(fā)現(xiàn)和驗證的證明都被用來強(qiáng)化AlphaProof的語言模型,增強(qiáng)其解決后續(xù)更具挑戰(zhàn)性問題的能力。

汽車測評更多>>

從《大師與瑪格麗特》看經(jīng)典作品當(dāng)代復(fù)現(xiàn)的創(chuàng)作困境 傅繼英工筆畫三十三觀音之馬郎婦觀音:至誠合作,事業(yè)騰達(dá) 粵港青年音樂家在深圳展演四場室內(nèi)樂音樂會,奏響大灣區(qū)青春樂章 若羌縣舉辦“棗花開了”系列活動之移風(fēng)易俗、書畫攝影作品、臨書臨印展 第十四屆全國美術(shù)作品展覽部分進(jìn)京作品巡展至河南 2024年南寧市體育局局屬事業(yè)單位免筆試招聘工作人員公告(5人) 2024年中國人民政治協(xié)商會議廣州市海珠區(qū)委員會辦公室關(guān)于招聘雇員的公告(1人) 2024年中山職業(yè)技術(shù)學(xué)院第三期招聘事業(yè)單位人員公告(16人) 2024年下半年揭陽市市直事業(yè)單位專項招聘博(碩)士研究生公告(45人) 安徽大眾第二款SUV要來了,依舊轎跑風(fēng)格,定位更高 阿維塔又要推新車了,定位中型轎車,明年推出 9.98萬元起售,搭載2C快充,五菱星光純電版算是真香之選嗎? 阿維塔12增程版要來了,明天開啟預(yù)售,純電續(xù)航201km MG ES5要來了,10月15日首發(fā),主打大空間 嵐圖知音正式上市,19.69萬起,全新純電平臺打造,還配曲面屏 別錯過!這四款華為手機(jī)超高性價比,最低1199元! 解讀卡羅拉銳放,定位緊湊型SUV,配2.0L+CVT,實力表現(xiàn)如何? 外觀運動時尚的艾瑞澤8,1.6T爆發(fā)197馬力,實力表現(xiàn)到底如何? 小鵬P7i:6.4秒破百,配XNGP+AI天璣系統(tǒng),產(chǎn)品實力值得一看 長安啟源A07全新真香版即將上市,產(chǎn)品力依舊保持較高水準(zhǔn) 定位緊湊型SUV,車身軸距2770mm的哪吒X,其實力表現(xiàn)是否值得一看 9月銷量破萬,豐田亞洲龍2024款,2.0L+CVT,值得入手嗎 10小時訂單量破5000臺,全新智己LS6比極氪7X更值得考慮? 純電中大型轎車之爭,極越07、領(lǐng)克Z10,誰更具“性價比”? 塊頭都不小呀!比亞迪騰勢N9、全新“夏”MPV現(xiàn)身目錄 蘋果推出新款iPad mini 現(xiàn)在即可訂購 10月23日在實體店開售 一汽紅旗:交付 EH7 榮耀版,助力體育強(qiáng)國 中國車企正在“顛覆”歐洲老牌制造商?小鵬、廣汽紛紛“安撫” 第100萬輛汽車下線 理想汽車成國內(nèi)首個“百萬輛新勢力車企” AION V 打頭陣,廣汽開始籌謀歐洲市場
主站蜘蛛池模板: 武隆县| 九龙城区| 泊头市| 怀安县| 宿松县| 九龙县| 双江| 乐业县| 周至县| 江津市| 江阴市| 阜平县| 沾益县| 宜都市| 运城市| 兴文县| 扎赉特旗| 遵义市| 丰县| 勃利县| 龙川县| 康马县| 德化县| 华容县| 工布江达县| 永寿县| 阳新县| 金塔县| 连山| 家居| 游戏| 福安市| 阿瓦提县| 深州市| 区。| 长兴县| 新源县| 甘泉县| 黎城县| 淮阳县| 迁西县|