menu-icon
anue logo
熱門時事鉅亨號鉅亨買幣
search icon


大型語言模型





    2025-06-08
  • 蘋果近期發表一項具指標性的 AI 研究報告,震撼揭露目前市場上號稱具備「推理能力」的 AI 模型,如 Claude Thinking、DeepSeek-R1、o3-mini,實際上只是進行「進階記憶遊戲」,根本談不上真正的邏輯推理。為了避開常見的訓練資料污染問題,蘋果研究團隊自訂了一組從未出現在資料集中的 邏輯謎題,用來測試 AI 模型是否具備真正的 理解與推理能力。






  • 2025-05-31
  • 美股雷達

    人稱「網路女王」、曾早期投資 Meta、Spotify 與 Airbnb 等知名企業的矽谷明星投資人瑪麗 · 米克 (Mary Meeker) 警告,OpenAI 等美國人工智慧 (AI) 公司正面臨中國 DeepSeek 等更便宜競爭對手的威脅,由於大型語言模型訓練成本飆升,但定價能力承壓,商業模式前景不明。






  • 2025-05-26
  • 美股雷達

    在 Google I/O 2025 大會中,除了 Gemini 2.5 系列與 Veo 3 模型掀起話題之外,Google (GOOGL-US) 也悄然發布旗下首款擴散模型(Diffusion Model)Gemini Diffusion。雖非主舞台焦點,但這款新模型憑藉超高速語言生成能力與技術潛力,迅速引起 AI 社群高度關注。






  • 2025-05-13
  • 自 DeepSeek 橫空出世以來,中國 AI 產業版圖產生顯著變化。這不僅打破了過去中美大型語言模型主導的格局,也讓本土大型語言模型市場進入重新洗牌的階段。如今,包括字節跳動、阿里巴巴 (09988-HK) 、階躍星辰、智譜 AI 與 DeepSeek 等五家企業逐漸穩定成形,被外界視為中國 AI 領域的「五強格局」,產業正加速走向技術深化與應用落地的整合期。






  • 2025-05-01
  • A股

    中國科技巨頭小米 (01810-HK) 日前在官方公眾號「Xiaomi MiMo」無預警宣布,正式開源旗下首款推理大型語言模型 MiMo-7B,消息一出震撼整個人工智慧(AI)社群。這款模型從開發到釋出過程全程保密,未曾流出任何消息。根據官方釋出的技術報告,MiMo-7B 僅使用 70 億參數,卻在兩大關鍵任務:數學推理與程式碼生成中,分別超越 OpenAI 的 o1-mini 以及阿里巴巴 (09988-HK) 320 億參數的 Qwen QwQ-32B-Preview。






  • 2025-03-11
  • 美股雷達

    路透周二 (11 日) 援引兩名知情人士消息報導,臉書母公司 Meta Platforms(META-US) 正在測試與台積電 (2330-TW)(TSM-US) 合作生產的自研人工智慧 (AI) 訓練晶片,目的是要降低對輝達 (NVDA-US) 的依賴、減少基礎設施成本。






  • 2025-02-15
  • 科技

    美媒《CNBC》周五 (14 日) 報導,隨著中國新創公司深度求索 (DeepSeek) 推出更便宜且高效的人工智慧 (AI) 模型,可能會重塑資料中心的需求,進一步促進這一已經蓬勃發展的行業。資料中心是數位轉型和大型語言模型 (LLMs) 訓練的核心基礎設施,分析師長期預測其將持續成長。






  • 2025-02-06
  • 美股雷達

    Alphabet 旗下的 Google 周三 (5 日) 宣布更新其 Gemini 系列的大型語言模型 (LLM),並推出一款全新的低成本人工智慧 (AI) 模型,以對抗來自中國競爭對手 DeepSeek 的低價產品。Google 現在提供多個版本的 Gemini 模型,根據價格和效能有所區別。






  • 2025-01-24
  • A股港股

    人工智慧 (AI) 領域的發展日新月異,其中,大型語言模型 (LLM) 更是備受矚目。在這一領域中,一家名為 DeepSeek 的中國新創公司異軍突起,不僅在技術上取得了重大突破,更以其獨特的發展模式,引起美國矽谷的關注和震驚。據報導,訓練成本極低的「DeepSeek-V3」只用了 2048 張 H100 的 GPU 集群,且用時僅 53 天。