国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

  • 首頁 > 云計算頻道 > 大模型

    大模型PK高考數學:DeepSeek文心豆包皆滿分,差生意外

    2025年06月11日 10:32:28 來源:雷科技

      為了防止高考生使用AI作弊,今年高考期間,騰訊混元、通義千問、Kimi、豆包等國內知名AI大模型的圖片識別問答功能均暫停服務。對于這些企業的做法,小雷卻有一些質疑,之前小雷測試AI大模型做高考題,大多表現不佳,暫停圖片識別問答服務似乎過于高看自家AI大模型的能力。

      到截稿時,2025年高考全國一卷僅有語文、英語和數學三套試卷公布,其中語文高考題目曝光后,已有多家媒體實測AI大模型撰寫作文。不過作文寫得如何,每個人的觀點可能不同,小雷看到的幾篇評測基本是截取AI大模型撰寫的文章,沒有給出點評,文章質量需要讀者評判。

    QQ截圖20250610175928.png

      (圖源:百度搜索截圖)

      慎重起見,小雷選擇了有標準答案的數學科目,測試AI大模型的能力,所選的AI大模型分別為DeepSeek、豆包、訊飛星火、文心一言、Kimi、通義千問,它們能考上985、211嗎?

      六款大模型PK,誰才是AI界的高考狀元?

      首先說一下測試環境和題目,考慮到部分AI大模型不支持手動開關聯網模式,因而所有AI大模型啟用聯網搜索,深度思考功能也全部打開。

      所選的數學題,包含一道單選題、一道多選題、一道填空題、一道簡答題,最終會按照題目的分數進行打分。

      第一題(5分):

      若雙曲線C虛軸長是實軸長的√7倍,則C離心率為(正確答案:D)

      A:√6   B:2   C:√7   D:2√2

      第一道題屬于開胃小菜,難度不算大,參與測試的六款AI大模型也沒有令小雷失望,全部計算出了正確答案,而且給出了詳細推理過程。本題測試中,所有AI大模型均獲得滿分5分。(圖片從左往右以此為:DeepSeek、訊飛星火、豆包、Kimi、文心一言、通義千問,下圖同)

    第一題.png

      (圖源:App截圖)

      盡管這道題難度不算高,但這六款AI大模型的表現令小雷眼前一亮。此前測試AI大模型的數學計算能力時,面對稍微復雜一些的問題,AI大模型很難計算出正確答案。

      僅一輪測試,DeepSeek、訊飛星火、豆包、文心一言、Kimi、通義千問六款AI大模型就證明了它們的能力,存在被高考生用于的作弊的可能性,暫停圖片識別問答功能絕非為了蹭高考的熱度。

      第二題(6分):

      若cos 2A+cos 2B+2sin C=2,SΔABC=1/4,cos Acos Bsin C=1/4,則(正確答案:ACD)

      A:sin C=sin²A+sin²B   B:AC²+BC²=3   C:AB=√2

      D:sin A+sin B=(√6)/2

      這道題難度相當高,僅有豆包在兩分鐘內計算出正確答案,訊飛星火和通義千問耗時略長一些,其他幾款AI大模型用時更長,尤其是DeepSeek,耗時足足572秒,接近10分鐘。

    第二題.png

      (圖源:App截圖)

      若是AI大模型像考生一樣每次只做一道題,推理較慢的三款AI大模型,存在兩小時時間做不完題的可能性。

      盡管本輪測試中所有AI大模型均正確回答出了問題,但結合推理所需時長來看,豆包、訊飛星火、通義千問表現較好。

      第三題(5分):

      若一個等比數列的前4項和為4,前8項和為68,則該等比數列的公比為(正確答案:±2)

      與上一題相比,這一題的難度有所下降,訊飛星火、文心一言、Kimi、通義千問、DeepSeek五款大模型均迅速計算出了正確答案,文心一言幾乎是秒算。豆包雖計算出了正確答案,但在輸出答案時卻犯了迷糊,排除了-2。因此,小雷不得不扣掉豆包的三分,該題豆包只能得2分。

    第三題.png

      (圖源:App截圖)

      在本輪測試中,DeepSeek服務器繁忙的問題頻繁發生,小雷不得不借助第三方應用。好在,現階段許多AI應用已接入DeepSeek,小雷使用的騰訊元寶App,無論是推理速度,還是穩定性,都遠高于DeepSeek網頁版或App。

      第四題(17分):

      設數列{an}滿足a₁=3,(an+1)/n=(an/(n+1))+(1/(n(n+1)))

      (1)證明:{n an}是等差數列;(正確答案:n an是an=3,公差為1的等差數列)

      (2)設f(x)=a₁X+a₂X²+a₃X³+...+amX^m,求f′(-2)。(正確答案:f′(-2)=(7/9)-((3m+7)/9)·(-2^m))

      前三道題,幾款AI應用僅在體驗上存在一定的差異,能力基本沒有表現出區別,第四道題不同,它的復雜度遠超前面三道題,也是檢驗AI大模型能力最重要的一項挑戰。

      在本輪測試中,豆包、訊飛星火、Kimi、文心一言、DeepSeek依然表現出色,正確計算出了兩道題的答案。通義千問解答這道題時,能夠推理出第一道小題的答案,但第二道小題卻給出了錯誤答案,表現稍遜一籌。

    第四題.png

      (圖源:App截圖)

      豆包、訊飛星火、文心一言、Kimi、DeepSeek可以在本輪測試中拿到滿分17分,通義千問因答錯了第二道小題,只能獲得7分。

      依靠公式和邏輯推理的數學題,似乎更符合AI的特性,但往年的評測中,AI大模型通常做閱讀理解和寫作文效果較好,面對復雜的數學題找不到答題方法。

      光明網在去年6月的報道中提到,復旦大學NLP實驗結果顯示,AI大模型在做2024年高考題時,在語文領域的表現遠強于數學,部分數學題AI大模型甚至全軍覆沒,沒有一個能夠正確計算出答案,遇到多選題時也是錯誤頻出。究其原因,數學失之毫厘差之千里,不能出一丁點錯誤,文史類內容則可以允許出現部分錯誤和較為模糊的答案。

      一年時間過去,AI大模型進步神速,深度思考模式的加入、針對數學題的專項優化,令AI大模型在處理高考數學題時更加游刃有余。

      比學霸更牛,但大模型做題能力已拉開差距

      四道題目測試下來,最終得分如下:

      DeepSeek:33分;

      訊飛星火:33分;

      豆包:30分;

      Kimi:33分;

      文心一言:33分;

      通義千問:23分。

      經過測試,DeepSeek、訊飛星火、Kimi、文心一言均獲得滿分,豆包表現不錯,因一時疏忽,遺憾丟了三分,痛失高考狀元。通義千問計算較為簡單的問題時,都保持了極高的水準,但處理較難的問題時出現了計算錯誤,需要再接再厲。

      總是向AI行業潑冷水的蘋果,日前在論文中表示,AI推理模型只是「假思考」,根本沒有穩定、可理解的推理過程,更像是記憶,處理復雜任務時可能會崩潰。AI研究者Lisan al Gaib復刻蘋果測試方法后表示,模型不是因為推理能力差失敗,而是因為蘋果限制了輸出token。

      或許AI大模型推理能力仍存在上限,但我們看得到它們的進步。去年復旦大學NLP實驗室測試AI大模型時,它們面對高考數學題表現糟糕,小雷在幾次AI大模型橫評測試中,也得到了類似的結果。今年的測試中,AI大模型基本都能計算出問題的正確答案,曾經難住AI大模型的多選題,也未能再對AI大模型造成困擾。

      AI大模型數學題解答能力提升,最大受惠者可能是學生群體。國內學習機廠商和教育輔導平臺,已陸續加入AI答題能力,但許多設備的AI大模型僅能解答中小學問題,例如行業翹楚小猿搜題,題目庫不包含大學課程。

      這六款AI大模型的優秀表現,證明了國內頭部AI企業的實力,高考數學題已被征服,高等數學也不會遠了。學習機廠商、教輔平臺可以與頭部AI企業合作,增強產品AI答題的能力,繼續強化AI教育硬件業務。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    欧美日韩大陆在线| 加勒比av一区二区| 九9re精品视频在线观看re6| 亚洲精品综合精品自拍| 欧洲亚洲精品久久久久| 亚洲午夜久久久影院| 亚洲欧美日韩综合一区| 日本欧美韩国| 一本不卡影院| 国产精品第8页| 91精品丝袜国产高跟在线| 国产精品久久免费看| 91在线中文字幕| 3d动漫一区二区三区在线观看| 一本色道久久综合亚洲精品高清| 精品国产亚洲一区二区三区在线观看| 中文字幕五月欧美| 色婷婷精品久久二区二区蜜臀av| 成人一级视频在线观看| 欧洲精品国产| 日韩精品一区二区视频| 欧美日本在线| 女海盗2成人h版中文字幕| 国产精品一区2区3区| 一区二区三区在线播放欧美| 911精品国产一区二区在线| 国产呦系列欧美呦日韩呦| 九九热在线视频观看这里只有精品| 亚洲精品视频在线观看网站| 中文字幕二三区不卡| 国产精品成久久久久三级| 综合久久给合久久狠狠狠97色| 97人人爽人人喊人人模波多| 日韩视频一区二区三区在线播放| 奇米狠狠一区二区三区| 自拍偷拍亚洲在线| 91精品国产综合久久福利| 青青草视频在线免费直播| 日本综合精品一区| 亚洲欧洲日产国码av系列天堂| 久久久99精品免费观看不卡| 天堂综合网久久| 国产精品亚洲综合| 欧美精彩视频一区二区三区| 国产精品一区二区久久久久| 亚洲欧美日韩中文在线制服| 色天天综合色天天久久| 日本vs亚洲vs韩国一区三区| 黄毛片在线观看| 精品高清久久| 久久久久国产一区二区三区| 激情视频一区二区| 久久久久久夜| 国产高清在线一区| thepron国产精品| 日韩av影视| 亚洲欧美日韩国产中文专区| 亚洲精品天堂| 成人综合婷婷国产精品久久蜜臀| 午夜免费福利在线观看| 色呦呦在线资源| 久久青草国产手机看片福利盒子| 精品在线播放免费| 99久久777色| 亚洲v欧美v另类v综合v日韩v| 97偷自拍亚洲综合二区| 日韩av在线直播| 女人让男人操自己视频在线观看| 欧美激情在线一区| 欧美xxxxx牲另类人与| 麻豆av一区二区| 奇米在线7777在线精品| 日韩在线导航| 色偷偷偷亚洲综合网另类| 日韩亚洲国产欧美| 欧美丝袜一区二区三区| 国产精品久久久久久久久搜平片| 香蕉久久aⅴ一区二区三区| 日本麻豆一区二区三区视频| 色噜噜狠狠色综合网图区| 国产综合av一区二区三区| 一区二区三区四区视频| 91精品啪在线观看国产60岁| 欧美日韩国产一区二区三区| 日韩dvd碟片| www日韩欧美| 久久久久久久一区二区| 91麻豆精品国产91久久久更新资源速度超快| 亚洲国产精品专区久久| 欧美国产精品日韩| 岛国一区二区在线观看| 中文字幕一区日韩精品欧美| 国产精品青青在线观看爽香蕉| 国产精品久久久久久久久图文区| 国产一区二区中文字幕| 97久久综合精品久久久综合| 91产国在线观看动作片喷水| 亚洲欧美综合国产精品一区| 国产在线看片免费视频在线观看| 精品日本一线二线三线不卡| av在线亚洲男人的天堂| 免费观看久久久4p| 国产精品成人免费精品自在线观看| 国语精品视频| 国内精品伊人久久久久影院对白| 97国产精品videossex| 欧美日韩在线三区| 欧美videosex性极品hd| 视频一区视频二区中文字幕| 欧美激情视频一区二区| 天天色天天射天天综合网| 欧美激情中文不卡| 色影院视频在线| 日韩av综合网站| 欧美人与z0zoxxxx视频| 亚洲一二三区视频| 国产欧美日韩综合精品| 激情综合色丁香一区二区| 成人动漫在线一区| 国产99久久久国产精品免费看| 99在线看视频| 99视频精品全国免费| 亚洲大胆人体大胆做受1| 国产精品乱人伦| 精品久久久久久久| 17videosex性欧美| 久久久一区二区三区捆绑**| 97超视频免费观看| 一道本无吗dⅴd在线播放一区| 欧美日韩在线精品一区二区三区激情综合| 国产乱对白刺激视频不卡| 成人免费毛片嘿嘿连载视频| 国产在线不卡| 日韩午夜视频在线观看| 亚洲精品婷婷| 97精品国产aⅴ7777| 99久久亚洲精品蜜臀| 婷婷综合另类小说色区| 一本色道久久综合亚洲精品酒店| 欧美一区二区视频17c| 国产精品高清一区二区三区| 欧美精品日韩三级| 97偷自拍亚洲综合二区| 久久精品久久精品| 中文字幕 在线观看| 精品国产一区二区三区久久久| segui88久久综合9999| 免费在线观看黄色网| 在线看的av网站| 性感少妇一区| shkd中文字幕久久在线观看| 天天射天天综合网| 91久久精品无嫩草影院| 久久免费视频这里只有精品| 色视频一区二区三区| 麻豆av在线导航| 久久久久久久久久码影片| 色噜噜狠狠一区二区三区| 蜜桃麻豆av在线| 亚洲第一伊人| 欧美先锋影音| 欧美韩日一区二区三区四区| 精品国产麻豆免费人成网站| 亚洲成人精品视频在线观看|