對標(biāo)OpenAI o1！Kimi發(fā)布新一代推理模型：中考高考考研全第一

發(fā)表于 2024-12-29 14:00:42 來源：下愚不移網(wǎng)

11月18日消息，對標(biāo)代推第日前，布新國內(nèi)人工智能公司月之暗面推出的理模Kimi國產(chǎn)大模型正式發(fā)布k0-math。

k0-math是型中Kimi推出的首款推理能力強(qiáng)化模型，采用全新強(qiáng)化學(xué)習(xí)和思維鏈推理技術(shù)，考高考考通過模擬人腦的研全思考和反思過程，大幅提升解決數(shù)學(xué)難題的對標(biāo)代推第能力。

據(jù)了解，布新在多項數(shù)學(xué)基準(zhǔn)能力測試中，理模k0-math的型中表現(xiàn)能對標(biāo)OpenAI o1系列可公開使用的兩個模型：o1-mini和o1-preview。

根據(jù)官方公布的考高考考結(jié)果，在中考、研全高考、對標(biāo)代推第考研以及包含入門競賽題的布新MATH等4個數(shù)學(xué)基準(zhǔn)測試中，k0-math初代模型成績超過o1-mini和o1-preview模型，理模拿下第一。

在業(yè)界最常使用的數(shù)學(xué)能力基準(zhǔn)測試MATH 中，k0-math模型得分93.8，超過 o1-mini的90分和o1-preview的85.5分。

官方表示，k0-math這一成績僅次于暫未開放使用的o1完全版94.8分。

據(jù)介紹，常規(guī)模型的設(shè)定目標(biāo)是盡快提供問題的答案，但k0-math不同，k0-math模型在做題過程中會花更長的時間來推理，包括思考和規(guī)劃思路，并且在必要時自行反思改進(jìn)解題思路，提升答題的成功率。

不過，月之暗面坦言，k0-math雖然擅長解答大部分很有難度的數(shù)學(xué)題，但是當(dāng)前版本還無法解答LaTeX格式難以描述的幾何圖形類問題。

另外，k0-math還有一些局限性需要突破，包括對于過于簡單的數(shù)學(xué)問題，例如1+1等于幾，k0-math模型可能會過度思考，對于高考難題和IMO題目依然有一定概率做錯、猜答案。

月之暗面表示，這些局限性既是機(jī)遇，也是挑戰(zhàn)，預(yù)計將在下一階段的模型迭代中逐步得到改善。

隨機(jī)為您推薦

熱門文章

文章排行

亚洲嫩模在线观看,日韩视频特黄色大片,乱色中文视频在线,动漫免费观看