<label id="dw83f"><button id="dw83f"></button></label>
          <cite id="dw83f"></cite>
          <sup id="dw83f"></sup>
          伊人查蕉在线观看国产精品,久久人人爽爽人人爽人人片av,国产av国片精品,亚洲妇女无套内射精,国产欧美日韩综合精品一区二区 ,九九热在线视频,亚洲一区二区乱码精品,久久伊人五月天 Image Modal
          全國

          熱門城市 | 全國 北京 上海 廣東

          華北地區 | 北京 天津 河北 山西 內蒙古

          東北地區 | 遼寧 吉林 黑龍江

          華東地區 | 上海 江蘇 浙江 安徽 福建 江西 山東

          華中地區 | 河南 湖北 湖南

          西南地區 | 重慶 四川 貴州 云南 西藏

          西北地區 | 陜西 甘肅 青海 寧夏 新疆

          華南地區 | 廣東 廣西 海南

          • 微 信
            高考

            關注高考網公眾號

            (www_gaokao_com)
            了解更多高考資訊

          首頁 > 熱點新聞 > 訊飛星火,憑什么成為最會高考的AI大模型?

          訊飛星火,憑什么成為最會高考的AI大模型?

          2025-06-09 15:26:29網絡資源


          高考

          高考的AI含量正在變得越來越高。考場之內,各類AI監考輔助系統、AI輔助閱卷等新技術正在不斷應用。考場之外,AI大模型們比拼答題也幾乎成了每年高考的“保留節目”。

          和往年不同,今年AI高考比拼的主角變成了深度推理大模型。相較于去年的大語言模型,深度推理模型在問題理解、思考深度以及回答輸出上都更具優勢,思維鏈的加入也讓人們更加清晰地看到了模型的思考過程。

          去年大語言模型混戰時,部分模型還無法準確理解題意,甚至出現作文跑題現象,而今年這種情況已大大減少。與此同時,得益于深度推理模型在數學邏輯思維能力上的提升,模型的高考數學得分屢創新高,涌現出越來越多的“AI狀元”。

          過去幾天,已有不少媒體率先對大模型的高考答題能力展出深度測評,涵蓋語文、數學、英語等多個主要科目。結果顯示,國產大模型的進步可圈可點。在多家媒體的大模型高考橫評中,國產大模型的答題水平絲毫不弱于OpenAI最新的推理模型,以DeepSeek R1、訊飛星火X1等為代表的國產大模型,更是實現了對海外主流模型的反超。

          以界面旗下的新媒體“電廠”針對高考語文作文的測評為例。電廠選取了高考之后公認較難的全國1卷語文作文進行測評,DeepSeek、通義千問、字節豆包、文心一言、騰訊混元以及訊飛星火等6款主流國產大模型參與作答,同時特別邀請到專業高中語文教師及專家,來對各大模型生成的高考作文逐一打分。評分規則為兩位教師專家各自獨立評分,最后取平均得分。



          根據兩位專家的最后評分可以看到,包括訊飛星火、DeepSeek、字節豆包以及通義千問四款大模型都獲得了50分以上的平均分,其中訊飛星火以平均分53分名列第一,DeepSeek以52.5分名列第二位,騰訊混元、文心一言則相對得分較低。不過,6 款大模型均能準確抓住題意,圍繞題干中”沉默與發聲”的關系展開論述。


          綜合專家意見,訊飛星火、DeepSeek得分較高的共同原因均是切中題意、立意深刻,同時邏輯縝密、論述完整,兼具思辨性與感染力。而得分較低的模型則或多或少在文章結構、素材選擇以及論述邏輯上存在明顯短板。

          中文寫作之外,也有媒體專門測試了幾款大模型的英文寫作水平。新京報選擇了今年高考英語北京卷的作文題目,測評DeepSeek R1、ChatGPT o3、通義千問 Qwen3、騰訊混元 T1、訊飛星火 X1、百度文心 X1等6款深度推理模型產品。模型答題結束后,新京報邀請到北京市十一學校一分校英語老師韓憲昌、深圳中學英語教師趙文嘉等兩位專家教師,參照往年高考評分標準對大模型進行打分并點評。


          從得分結果中可以看出,訊飛星火X1和DeepSeek R1再度實現對其他模型的反超,分別包攬第一、二名。其中,訊飛星火X1拿下全場最高分19.5分,DeepSeek R1 以 0.5 分之差位居其后。至于OpenAI o3,或許是不太適應高考答題標準,僅拿下14.5分。

          韓憲昌老師表示,幾款深度推理模型都能在內容方面切中要點,完成寫作任務。但是,內容細節多少、細節邏輯關系強弱、觀點表達精準性與簡潔性等方面,差別比較大。例如,得分較高的訊飛星火X1以及DeepSeek均能準確把握題意,語言精準,結構嚴謹,同時在句法結構上形式多變。而得分較低的模型要么在語法、用詞上存在欠缺,要么在論述邏輯上銜接的不夠緊密。

          聊完了“文”的部分,我們再來看看幾款主流的深度推理大模型在數學能力上的較量。高考數學考試結束當天,針對數學新高考1卷,科技媒體 IT 之家對幾款主流深度推理大模型進行了橫評,最終結果如下:


          在高考數學的最終得分中,DeepSeek以及訊飛星火表現突出,是所有參賽的深度推理模型中唯二獲得140分以上的大模型,領先一眾深度推理模型,穩居大模型高考數學答題第一梯隊。即便放在真人考生中,140分以上也屬于全國范圍內的“頂尖”水平。

          這也是深度推理模型的優勢所在,相較于更偏向主觀色彩的作文寫作,數學邏輯能力本就是深度推理模型的長處。IT 之家在測評中特別提到,和去年的主流的大語言模型相比,今年深度推理模型的數學能力有了明顯提升。

          綜合不同媒體針對語數外三科的橫評答題結果,訊飛星火X1以及DeepSeek R1以絕對優勢穩居大模型高考答題的第一梯隊,其中,訊飛星火X1更是以語數英三科綜合第一的成績,成為2025年最會高考同時也是最懂高考的國產大模型。

          訊飛星火X1在2025高考中的出色表現,離不開科大訊飛20余年來在教育領域的深耕。科大訊飛是國內最早利用人工智能技術賦能教育的科技公司之一,實現了覆蓋從學校教學、教師發展、智慧考試、素質教育、自主學習等教育全場景的產品及服務,同時構建起從國家、省、市、縣(區)到學校、家庭的智慧教育體系。

          AI大模型時代,訊飛星火延續了科大訊飛在教育領域的領先優勢。底座模型上,基于全國產算力訓練的訊飛星火大模型國內領先,星火X1更是在模型參數量比業界同行少一個數量級的情況下,實現整體效果對標OpenAI o1和DeepSeek R1。

          2025 年高考雖然很快就要落下帷幕,但大模型們之間的“高考”仍將繼續。在AI賦能教育越來越深入的當下,深度推理模型的進步,讓我們看到了更多AI+教育的可能性。

          本平臺所發布信息的內容和準確性由提供消息的原單位或組織獨立承擔完全責任!

          [標簽:廣東高考 高考改革 高考 高考報名]

          分享:

          高考關鍵詞

          主站蜘蛛池模板: 在线视频?日韩一区| 亚洲一区二区三级av| 韩国av一区二区| 久久久久综合中文字幕| 亚洲sm另类一区二区三区| 少妇人妻偷人精品免费| 一本久道综合在线无码人妻| 人妻少妇88久久中文字幕| 摸丰满大乳奶水www免费| 国产日产高清欧美一区丝瓜视频 | 中文字幕手机在线看片不卡| 亚洲日韩图片专区第1页| 91精品啪国产在线观看免费牛牛| 亚洲AⅤ乱码一区二区三区 | 国产av大全| 青春草在线播放在线观看视频| 青草99在线免费观看| A片丝袜| 少妇天堂网络| 亚洲国产综合精品中文第一区| 香蕉亚洲欧洲在线一区| 国产精品成人无码久久久| 久久综合图区亚洲综合图区| 少妇被爽到高潮喷水久久欧美精品 | 人妻网站成熟人妻VA网站| 精品3p| 浪潮av色综合久久天堂| 日本高清www片久久| 色多多app下载网址免费| 五月天综合网| 国产伦码精品一区二区| 免费看无码特级毛片| 亚洲AV丰满熟妇在线播放| 久久亚洲国产精品日日av夜夜| 熟女?国产?精品| 国产一区二区日韩在线| 日韩一区不卡成人av| av中文字幕国产精品| 性xxxxbbbb| 欧美69视频| 超碰国产精品久久国产精品99|