- 資訊與博客
商湯「日日新V6」多模態能力為國内最強、本钱業內最低 讓AI融入「黎民之日用」
商湯科技SenseTime在上海、深圳等多地舉辦2025技術交流日活動,,,,,,,重磅推出全新升級的「日日新SenseNova V6」(「日日新V6」)大模子體系,,,,,,,通過多模態長思維鏈訓練、全局記憶、強化學習的技術突破,,,,,,,形成領先的多模態推理能力,,,,,,,並突破本钱邊界。。。。。
「日日新 V6」模子能力顯著提升,,,,,,,在長思維鏈、推理、數理、全局記憶方面擁有顯著優勢,,,,,,,多模態推理能力國內第一,,,,,,,對標OpenAI o1,,,,,,,數據剖析能力大幅領先GPT-4o。。。。。同時,,,,,,,其高效能與低本钱完善結合:多模態訓練整體效率對齊語言訓練實現業內最低、推理本钱均實現業界最低;;;;;;;;全新的輕量級全模態交互模子SenseNova V6 Omni帶來了國内最強的多模態交互能力;;;;;;;;涵蓋國内首個支持10分鐘中長視頻深度剖析的大模子,,,,,,,對標Gemini 2.5 Turbo,,,,,,,達同類型最強。。。。。

商湯科技董事長兼首席執行官徐立体现:「 AI之道,,,,,,,在於黎民之日用。。。。。商湯日日新V6已跨越多模態邊界,,,,,,,釋放推理與智能的無限可能。。。。。」

多模態長思維鏈、強化學習、全局記憶,,,,,,,日日新V6率先實現多模態下深度思索
作為擁有超6,000億參數的混淆專家架構(MoE)原生多模態通用大模子,,,,,,,「日日新 V6」實現了多項技術突破,,,,,,,憑藉單一模子就可以完成文本、多模態等各類任務:
長思維鏈:超過 200B 高質量多模態長思維鏈數據,,,,,,,最長 64K 思維鏈;;;;;;;;
數理能力:數據剖析能力大幅領先 GPT-4o;;;;;;;;
推理能力:多模態深度推理國内第一,,,,,,,對標 OpenAI o1;;;;;;;;
全局記憶:率先在國内突破長視頻明确,,,,,,,支持10分鐘的視頻明确及深度推理。。。。。

在權威的推理能力及多模態能力評測中,,,,,,,「日日新 V6」在多個維度獲得SOTA (State-of-the-Art):

【焦点指標】純文本任務綜合性能優秀,,,,,,,比肩國際一線模子;;;;;;;;多模態性能領先,,,,,,,各方面性能突出;;;;;;;;純文本推理與多模態推理能力均對標GPT-4.5和Gemini 2.0 Pro等國際一流模子的水平

【強推理能力】日日新融合模子從 5.5 到 V6 / V6 Reasoner,,,,,,,推理能力顯著提升。。。。。在獨立評測中,,,,,,,多模態和語言深度推理任務上同時超過了OpenAI的o1和Gemini 2.0 flash-thinking的水平
基於超過200B高質量多模態長思維鏈數據,,,,,,,商湯通過多智能體協作進行長思維鏈合成和驗證,,,,,,,「日日新 V6」形成了突出的多模態推理能力,,,,,,,可以支持合成最長 64K 的多模態長思維鏈,,,,,,,支持模子長時間思索能力。。。。。
針對真實環境保存的複雜問題,,,,,,,「日日新 V6」強大的混淆圖文明确推理能力,,,,,,,能夠幫助用戶解決各類問題。。。。。
在複雜文檔繁瑣的文檔處理場景中,,,,,,,「日日新 V6」同樣能夠以多模態強推理能力解決用戶難題,,,,,,,可於商湯辦公小浣熊體驗:https://xiaohuanxiong.com/office
以保險理賠場景為例,,,,,,,「日日新 V6」可根據商業醫療保險理賠质料,,,,,,,判斷提供质料是否切合理賠要求,,,,,,,檢查是否保存亂開藥、亂檢查、质料缺失或者质料不齊等問題。。。。。

小額理賠雖然金額小但往往耗費時間長(3-7天),,,,,,,而交予「日日新 V6」,,,,,,,它能自主檢測到風險提醒,,,,,,,自主進行交织驗證,,,,,,,最後再給予用戶很是細緻、多維的結論,,,,,,,完成模子到客戶使用的最後一公里
得益於多模態強化學習的突破,,,,,,,商湯構建了面向多種圖文任務的混淆增強學習框架,,,,,,,基於差别難度分級和多獎勵模子的強化學習訓練。。。。。
國内率先於視頻明确突破10分鐘限制,,,,,,,超長內容實現秒級推理拆解
憑藉「全局記憶」能力,,,,,,,「日日新 V6」突破了傳統模子僅支持短視頻的限制,,,,,,,可支持10分鐘級視頻全幀率剖析。。。。。
基於強大的明确能力,,,,,,,「日日新 V6」還可以對視頻的精彩內容進行智能剪輯輸出,,,,,,,幫助用戶保存珍貴瞬間。。。。。

針對一段《黑神話》遊戲錄屏,,,,,,,遊戲玩家們可將一样平常積累的遊戲錄製、實況,,,,,,,輸入「日日新 V6」明确精彩內容和值得記錄的時間,,,,,,,剪輯出高光時刻,,,,,,,同時可自定義天生解說文案,,,,,,,幫助分享遊玩經驗和遊戲內的精彩操作
商湯自研技術可將視覺信息(畫面)、聽覺信息(語音、音效)、語言信息(字幕、口語)、時間軸邏輯對齊,,,,,,,形成多模態統一時序表徵。。。。。在此基礎上,,,,,,,通過細粒度級聯信息壓縮和內容敏感的動態過濾,,,,,,,實現長視頻的高比例壓縮,,,,,,,10分鐘視頻可以壓縮到16K tokens,,,,,,,仍然保存關鍵語義。。。。。
真正像人一樣交互,,,,,,,「SenseNova V6 Omni」發佈即實現多行業落地
伴隨日日新SenseNova V6的發佈,,,,,,,商湯日日新實時交互融合大模子升級至「SenseNova V6 Omni」,,,,,,,在角色饰演、翻譯點讀、文旅導遊、講解繪本、數學講解等場景下進行了深度優化。。。。。

以翻譯點讀場景為例,,,,,,,「SenseNova V6 Omni」讓用戶通過手指就能實現精準位置的空間交互,,,,,,,並精準明确局部信息與全局信息的關係,,,,,,,帶來更切合人類自然直觀的指讀交互體驗。。。。。
「SenseNova V6 Omni」擁有更像人的感知和表達能力、情绪明确能力,,,,,,,並已在具身智能等領域實現多行業、多場景落地,,,,,,,成為國内首個商業化的全模態實時交互模子。。。。。
滿血版「探讨」全量上線,,,,,,,現已開放內測
整合「日日新SenseNova V6」所有能力,,,,,,,商湯探讨也迎來周全升級,,,,,,,並推出全新探讨APP。。。。。用戶通過一個入口,,,,,,,即可體驗文字、圖像、視頻等多種模態流式交互體驗。。。。。
探讨APP已啟動內測,,,,,,,「日日新 V6」现在可於探讨Web端體驗。。。。。
發佈1億元現金券,,,,,,,全棧賦能場景落地
商湯科技還宣布投入人民幣1億元專項補貼,,,,,,,聚焦具身智能、AIGC等多個前沿領域,,,,,,,通過多維度的精準帮助,,,,,,,為企業提供從專家諮詢到模子訓練、推理驗證的全流程AI服務支持,,,,,,,打造「高效率、低本钱、端到端」的一站式賦能计划。。。。。






返回