无码精品人妻一区二区三区人妻斩,国产xxxx视频在线观看,一区二区三区在线 | 欧,国模少妇无码一区二区三区,午夜理论欧美理论片,国产精品高潮呻吟av久久软件,深夜放纵内射少妇,欧美交换国产一区内射

9.11比9.9大?馬斯克Grok3回答翻車了

KIM
KIM
2025-02-19 16:14:56

近日,馬斯克與xAI團隊,在直播中正式發布了最新版本Grok3。

此前,馬斯克將Grok-3描述為“地球上最聰明的AI”。他在X平臺上表示:“自己整個周末都在和團隊打磨產品。”

然而據媒體報道,有人測試了最新的Beta版Grok3,并提出了那個經典的用來刁難大模型的問題:“9.11與9.9哪個大?”遺憾的是,在不加任何定語以及標注的情況下,號稱目前最聰明的Grok3,仍然無法正確回答這個問題。

值得一提的是,用同樣的問題詢問DeepSeek時,無論是否開啟深度思考(R1)模式,對方都給出了正確的答案:9.9大于9.11。

“9.11和9.9哪個大”是AI領域的一個經典問題。

艾倫研究機構(Allen Institute)成員林禹臣曾在社交媒體平臺上發布的截圖顯示,ChatGPT-4o在回答中認為13.11比13.8更大。“一方面AI越來越擅長做數學奧賽題,但另一方面常識依舊很難。”他表示。

隨后Scale AI的提示工程師萊利·古德賽德(Riley Goodside)基于此靈感變換了問法,拷問了可能是當時最強的大模型ChatGPT-4o、谷歌Gemini Advanced以及Claude 3.5 Sonnet——9.11和9.9哪個更大?這幾家主流大模型通通答錯,他也成功將此話題傳播開來。

海外主流大模型答題。圖源:第一財經

Grok-3發布會的背景板上,寫著"our mission is to understand universe(我們的使命是了解宇宙)"。馬斯克曾表示,xAI公司的目標就是“了解宇宙”。

在一周前,馬斯克在直播中評論DeepSeek R1時,曾信心滿滿地表示“xAI即將推出更優秀的AI模型”。從現場展示的數據來看,Grok3在數學、科學與編程的基準測試上已經超越了目前所有的主流模型,馬斯克甚至宣稱Grok 3未來將用于SpaceX火星任務計算,并預測“三年內將實現諾貝爾獎級別突破”。

xAI在X平臺直播,馬斯克到場。圖源:中國新聞周刊

馬斯克強調,Grok-3可以減少AI幻覺,方法是通過來回檢查數據并嘗試實現邏輯一致性。他還透露,訓練Grok-3所使用的算力遠多于此前的版本,并使用了大量合成數據。

不同于DeepSeek的算法優化路徑(DeepSeek-V3用2048個H800 GPU,訓練2788千小時),xAI透露,Grok-3的開發的得益于用8個月時間建成的Colossus超級計算機,它由10萬個英偉達的H100 GPU驅動,為訓練提供了2億個GPU小時,比Grok-2多十多倍。

此外,xAI宣布推出名為Deepsearch的Grok-3智能搜索引擎,名字和Deepseek頗有幾分相似。

來源:九派新聞來源:九派新聞綜合東方財經、第一財經、中國新聞周刊等

免責聲明
標簽:馬斯克    xAI    9.11比9.9大    Grok3    
你該讀讀這些:一周精選導覽
更多內容...
奢華私語 時尚衣櫥
主站蜘蛛池模板: 一区二区三区高清av专区| 免费裸体无遮挡黄网站免费看| 国产成人人综合亚洲欧美丁香花| 国产夫妇肉麻对白| 国产偷国产偷亚洲清高网站| av成人午夜无码一区二区| 亚洲热线99精品视频| 国产又爽又刺激的视频| 久久综合婷婷成人网站| av无码一区二区大桥未久| 亚洲熟女乱色综合亚洲小说| 男人用嘴添女人私密视频| 蜜桃视频一区二区三区在线观看| 中文字幕制服丝袜第57页| 免费看国产曰批40分钟| 在线播放亚洲人成电影| 夜鲁鲁鲁夜夜综合视频欧美| 伊人蕉久中文字幕无码专区| 男女裸交免费无遮挡全过程| 精久国产一区二区三区四区| 精品亚洲国产成人| 久久丫免费无码一区二区| 免费无码毛片一区二区app| 国产麻豆精品一区| 女人被做到高潮免费视频| 亚洲爆乳少妇无码激情 | 亚洲国产日韩在线人高清| 国产内射一区亚洲| 亚洲最大av网站在线观看| 国产精品一区二区久久不卡| 无码人妻精品一区二区蜜桃色欲| 色诱久久久久综合网ywww| 亚洲欧美闷骚少妇影院| 大伊香蕉精品一区视频在线| 久久天天躁狠狠躁夜夜爽| 精品国产一区二区av麻豆不卡| 亚洲国产成人无码网站大全| 国产国语熟妇视频在线观看| 亚洲国产精品久久青草无码| 好男人中文资源在线观看| 免费人成网站视频在线观看国内|