每日經濟新聞 2025-03-11 20:30:45
每經編輯|黃勝
3月11日,針對DeepSeek將在3月17日發布下一代R2模型的傳聞,DeepSeek官方企業咨詢賬號在用戶群中回應稱,“辟謠:R2發布為假消息。”
3月11日,據東方財經援引媒體報道,有市場消息稱,DeepSeek下一代AI模型DeepSeek-R2或提前于下周一(3月17日)正式發布。
DeepSeek-R2在多個關鍵領域實現突破,包括更出色的編程能力、多語言推理能力,以及以更低的成本提供更高的準確性。專業人士認為,這些特性若得以兌現,可能使其在全球AI競賽中占據顯著優勢。
公開資料顯示,DeepSeek,全稱杭州深度求索人工智能基礎技術研究有限公司,成立于2023年7月17日,是一家創新型科技公司,專注于開發先進的大語言模型(LLM)和相關技術。
在硅谷,DeepSeek很早就被稱作“來自東方的神秘力量”,也是網上熱議的“杭州六小龍”之一。
2024年底,DeepSeek發布了新一代大語言模型V3,同時宣布開源。測試結果顯示,它的多項評測成績超越了一些主流開源模型,并且還具有成本優勢。
圖片來源:視覺中國
隨后,在1月世界經濟論壇2025年年會開幕當天,中國深度求索公司發布其最新開源模型R1,再次引發全球人工智能領域關注。據該公司介紹,R1模型在技術上實現了重要突破——用純深度學習的方法讓AI自發涌現出推理能力,在數學、代碼、自然語言推理等任務上,性能比肩美國開放人工智能研究中心(OpenAI)的o1模型正式版,該模型同時延續了該公司高性價比的優勢。據了解,深度求索公司R1模型訓練成本僅為560萬美元,遠遠低于美國開放人工智能研究中心、谷歌、“元”公司等美國科技巨頭在人工智能技術上投入的數億美元乃至數十億美元。
與DeepSeek閑聊的界面截圖
每日經濟新聞綜合公開消息、東方財經
免責聲明:本文內容與數據僅供參考,不構成投資建議,使用前請核實。據此操作,風險自擔。
封面圖片來源:每日經濟新聞 資料圖
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP