国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

第四屆人工智能與產業鏈創新高層論壇暨2025寧波智能產品創新大賽圓滿落幕達到金牌分數線:字節跳動推出新一代數學推理專用模型Seed Prover 1.5小鵬X9超級增程全球首發冰雪穩行系統:100km/h剎停不跑偏光帆科技全球首款具備視覺感知能力的主動式AI耳機正式發布拼多多入選2025年《中國優秀品牌發展案例》以創新赴約,為未來賦能!鯤鵬昇騰創新大賽2025全國總決賽即將開賽聯想ThinkCentre X AIO Aura Edition 一體機曝光:27.6 英寸 16:18 屏幕阿福和靈光,能承載螞蟻的TO C野心嗎?啟信慧眼AI驅動智能商業決策,推動商業大數據B端市場革新TCL冠軍中國行,奧運冠軍趙蕊蕊見證小藍翼新一代AI健康空調發布冠軍見證,TCL空調雙新品亮相:定義年輕人“冠軍級”舒適生活中國第一具身大模型獲21億元融資,銀河通用機器人估值突破200億機構:生成式AI與自主AI代理推動電信客戶體驗框架轉型國產替代加速!900次場景落地,天數智芯釋放 AI 算力高成長潛力卡薩帝廚電感恩月推出烤餃子、蒸餃子活動-25℃冰雪大世界人群涌向海爾“溫暖方舟”2025未來產業系列對接活動(陜西行) 成功舉辦仰望U9專屬紀念色“極境森林”上市 售價188萬元!本田放大招!2026全球4款新車曝光 純電0系列量產在即6K 3D、首款1040Hz顯示器降臨!三星Odyssey 2026系列炸場
  • 首頁 > 云計算頻道 > 大模型

    對標GPT-4代碼解釋器!港中大讓模型寫代碼解決數學難題,得分超越GPT-4

    2023年10月08日 15:21:09 來源:微信公眾號 量子位

      本文來自于微信公眾號 量子位 (ID:QbitAI),作者:豐色。

      對標GPT-4代碼解釋器,港中大最新研究放了個“大招”:

      他們開發了一個叫做MathCoder的大模型,數學能力直接在競賽級“題庫”Math上超過GPT-4。

      做到這一點靠的就是無縫集成代碼的能力——

      在遇到數學問題時,它不僅能用自然語言推理,還能自動編寫和執行代碼來建模、推導公式與方程。

      這樣的工作方式無疑和強大的GPT-4代碼解釋器一樣。

      在實際評測中,MathCoder除了超過GPT-4,還順利在MATH和GSM8K兩大數據集上取得了開源LLM中的SOTA(打敗了8月份才誕生的WizardMath)

      這個“新王”究竟是如何誕生的?對標GPT-4代碼解釋器

      總的來看,港大這項研究為了提高大模型的數學推理能力,學習了GPT-4代碼解釋器的優點和工作原理,提出了一種微調開源語言模型的方法。

      該方法最終使大模型無縫集成代碼,利用代碼來解決數學問題。

      具體而言,他們首先提出了一個可以生成高質量數學題的數據集:MathCodeInstruct。

      該數據集由兩部分組成:

      種子數據(D0):主要基于GSM8K和MATH,并利用GPT-4收集答案。

      插值數據(D1):讓GPT-4基于他們提出的一種叫做“問題插值提示”的方法生成。

      如下圖所示:

      示例1和2分別來自于GSM8K和MATH,1簡單,2難一些,GPT-4要做的“插值”就是生成比1難但比2更簡單的新問題。

      基于以上兩類問題,最終MathCodeInstruct數據集一共收集了8萬道數學題。

      如下表所示,這比業內其他數據集規模稍小一些:

      而與其他數據集相比,它的特點之一是同時彌補了GSM8K和MATH這兩大重要數據集中不足的部分,給出了一些難度范圍更廣的問題,增強了數據集的泛化能力。

      特點之二是數據集中的每道題目同時包含基于自然語言推理的部分+基于代碼解決的部分(包括執行代碼和代碼輸出結果)。

      如下圖所示,這是對上面GPT-4生成的“插值”問題的解決思路:

      在數據集準備好以后,團隊便提出了一種定制的監督微調和推理方法,最終在Llama-2和Code Llama上微調出了MathCoder。

      具體而言,該方法使用特殊的token(<|text|>、<|code|>、<|execution|>)來識別訓練數據集中哪一部分是自然語言、代碼還是結果,讓模型學習生成由這些特殊標記劃分的自然語言和代碼。

      在推理期間,該方法還會將動態執行的結果附加到模型的先前預測中。

      然后,繼續基于這個新版本的輸入自回歸預測下一個token,以及最后的執行結果。

      作者表示,通過這種方式,模型將能夠“看到”執行結果,并不斷地繼續推理。

      最終,該方法使微調模型MathCoder以類似GPT-4代碼解釋器的方式運行。

      在評測中,MathCoder憑此直接在MATH和GSM8K這倆數據集上取得了45.2%和83.9%的好成績。

      該成績證明:

      其一,它超過了ChatGPT-3.5和PaLM-2等9個閉源模型,并在以數學競賽題為主的MATH集上超過GPT-4。

      其二,它打敗了此前數學領域里最強的開源模型WizardMath,成為新的開源之最。

      不過其三,模仿但還未超越,在這倆數據集上,MathCoder還是與GPT-4代碼解釋器(69.7%和97%高分)存在著一定的性能差距。 作者介紹

      本研究一共10位作者,除了兩位來自香港城市大學以外,其余均來自香港中文大學。

      共同一作一共有6位,分別是:Ke Wang、Houxing Ren、Aojun Zhou、Zimu Lu、Sichun Luo和Weikang Shi。

      通訊作者為李鴻升,為港中大電子工程系副教授,同時也就職于上海人工智能研究室。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    亚洲黄网站黄| 国产婷婷成人久久av免费高清| 午夜精品三级视频福利| 欧美 日韩 国产一区二区在线视频| 国产精品久久久久久久久久久久久久| 日本国产欧美一区二区三区| 999国内精品视频在线| 亚洲同性gay激情无套| 欧美色偷偷大香| 午夜精品久久久久久久99黑人| 欧美另类高清zo欧美| 9191在线播放| 久国产精品韩国三级视频| 日韩影片在线播放| 国产精品区一区二区三在线播放| 蜜桃av噜噜一区二区三区| 日韩精品一区二区三区中文精品| 国产精品人成电影| 亚洲综合视频在线| 久久综合av免费| 欧美日韩一级片在线观看| 精品久久久久久国产91| 91亚洲国产| 亚洲精品美女视频| 国产一区999| 色综合久久88色综合天天| 国产51人人成人人人人爽色哟哟| 日本美女一区| 亚洲精品高清在线| 视频一区欧美| 久久www免费人成看片高清| 国产高清自拍视频在线观看| 欧美精品xxxxbbbb| 国产91精品青草社区| 一区二区三区四区五区视频在线观看| 精品亚洲夜色av98在线观看| 国产精品第一视频| 亚洲午夜成aⅴ人片| 久久激情视频久久| 久久艳片www.17c.com| 亚洲国产中文字幕久久网| 国产一区啦啦啦在线观看| 91性高湖久久久久久久久_久久99| 欧美片网站免费| 色综合天天综合色综合av| 亚洲成av人片一区二区密柚| 91麻豆精品激情在线观看最新| 91国拍精品国产粉嫩亚洲一区| 久久成人综合视频| 亚洲视频一区二区| 久久精品国产精品青草色艺| 国产精品国产三级国产aⅴ浪潮| 海角国产乱辈乱精品视频| 欧美日韩在线一二三| 国产乱色国产精品免费视频| 538在线一区二区精品国产| 草草在线视频| 三区四区电影在线观看| 国产一区二区三区丝袜| 97在线观看免费观看高清| 九色成人国产蝌蚪91| 亚洲成人a**址| 成人激情免费电影网址| av网站一区二区三区| 成人h动漫精品一区二| 精品一区二区三区蜜桃| 成人福利片在线| 精品999网站| 日本欧美视频| 岛国大片在线观看| 久久久成人精品视频| 亚洲欧洲偷拍精品| 一区二区三区国产视频| 亚洲国产精品v| 久久综合久久综合亚洲| 国产精品进线69影院| 亚洲 国产 欧美一区| 蜜桃av噜噜一区二区三区| 国产精品一站二站| 精品国产乱码久久久久久郑州公司| 粉嫩91精品久久久久久久99蜜桃| 久久色在线播放| 亚洲人亚洲人色久| 欧美风情在线观看| 欧美另类极品| 久久九九久精品国产免费直播| 国产精品素人视频| 亚洲人成毛片在线播放| 99精品视频一区| jazzjazz国产精品久久| 成人国产视频在线观看| 91网页在线观看| 国色天香2019中文字幕在线观看| 国产高清在线a视频大全| 国产传媒在线播放| 欧美自拍视频在线观看| 在线成人小视频| 麻豆免费在线| 97精品一区| a天堂中文在线官网在线| 91国语精品自产拍在线观看性色| 欧美日韩亚洲激情| 亚洲丝袜在线视频| 久久99这里只有精品| 亚洲精品日韩av| 成人做爰视频www| 成人在线观看av| 亚洲精品欧美日韩| 久久精品欧美日韩| 午夜日韩电影| 欧美福利视频在线| 日韩av三级在线观看| 久久久久久高潮国产精品视| 88xx成人网| 亚洲成人网av| 精品国产aⅴ麻豆| 不卡av电影院| 日韩电影免费在线看| 浪潮色综合久久天堂| 老牛影视精品| 欧美日本韩国一区二区三区视频| 久做在线视频免费观看| 婷婷夜色潮精品综合在线| 亚洲自拍偷拍福利| 日本欧美韩国国产| 91精品国产色综合久久不卡98| 深夜福利亚洲| 亚洲成人自拍| 亚洲一区二区欧美激情| 欧美日韩国产一中文字不卡| 国产97在线观看| 久久久久久亚洲精品杨幂换脸| 蜜臀国产一区二区三区在线播放| 91视频免费看| 黄色在线免费看| 国产精品丝袜高跟| 亚洲精品一区二区久| 中文字幕亚洲一区二区va在线| 午夜亚洲国产au精品一区二区| 国产偷久久久精品专区| 亚洲六月丁香色婷婷综合久久| 在线免费三级电影网站| 国内精品伊人| 99精品欧美一区二区三区小说| 你微笑时很美电视剧整集高清不卡| √天堂8资源中文在线| 久久99深爱久久99精品| 99久久综合99久久综合网站| 久久大综合网| 91高潮精品免费porn| 日韩精品免费一区二区三区竹菊| 天堂成人av| 国产成+人+综合+亚洲欧美| 国产精品久久久久久久久久白浆| 免费成人动漫| 日韩久久久久久久久久久久久| 欧美日韩久久| 蜜桃av噜噜一区二区三| 国产成人jvid在线播放| 国产乱码精品一区二区三区亚洲人| 男人资源在线播放| 91免费精品国偷自产在线在线| 红桃成人av在线播放| 国产精品久久久久久吹潮|