哈哈(haha)体育

申請試用
登入
資訊與博客

商湯「日日新V6」多模態能力為國内最強、本钱業內最低 讓AI融入「黎民之日用」

2025-04-11

商湯科技SenseTime在上海、深圳等多地舉辦2025技術交流日活動,,, ,,,,重磅推出全新升級的「日日新SenseNova V6」(「日日新V6」)大模子體系,,, ,,,,通過多模態長思維鏈訓練、全局記憶、強化學習的技術突破,,, ,,,,形成領先的多模態推理能力,,, ,,,,並突破本钱邊界。。。。 。

 

「日日新 V6」模子能力顯著提升,,, ,,,,在長思維鏈、推理、數理、全局記憶方面擁有顯著優勢,,, ,,,,多模態推理能力國內第一,,, ,,,,對標OpenAI o1,,, ,,,,數據剖析能力大幅領先GPT-4o。。。。 。同時,,, ,,,,其高效能與低本钱完善結合:多模態訓練整體效率對齊語言訓練實現業內最低、推理本钱均實現業界最低;;;;;;;;全新的輕量級全模態交互模子SenseNova V6 Omni帶來了國内最強的多模態交互能力;;;;;;;;涵蓋國内首個支持10分鐘中長視頻深度剖析的大模子,,, ,,,,對標Gemini 2.5 Turbo,,, ,,,,達同類型最強。。。。 。


Screenshot 2025-04-11 at 3.04.31?PM.png


商湯科技董事長兼首席執行官徐立体现:「 AI之道,,, ,,,,在於黎民之日用。。。。 。商湯日日新V6已跨越多模態邊界,,, ,,,,釋放推理與智能的無限可能。。。。 。」


Screenshot 2025-04-11 at 3.04.44?PM.png


多模態長思維鏈、強化學習、全局記憶,,, ,,,,日日新V6率先實現多模態下深度思索

 

作為擁有超6,000億參數的混淆專家架構(MoE)原生多模態通用大模子,,, ,,,,「日日新 V6」實現了多項技術突破,,, ,,,,憑藉單一模子就可以完成文本、多模態等各類任務:

  • 長思維鏈:超過 200B 高質量多模態長思維鏈數據,,, ,,,,最長 64K 思維鏈;;;;;;;;

  • 數理能力:數據剖析能力大幅領先 GPT-4o;;;;;;;;

  • 推理能力:多模態深度推理國内第一,,, ,,,,對標 OpenAI o1;;;;;;;;

  • 全局記憶:率先在國内突破長視頻明确,,, ,,,,支持10分鐘的視頻明确及深度推理。。。。 。


Screenshot 2025-04-11 at 3.04.56?PM.png


在權威的推理能力及多模態能力評測中,,, ,,,,「日日新 V6」在多個維度獲得SOTA (State-of-the-Art):


Screenshot 2025-04-11 at 3.05.09?PM.png

【焦点指標】純文本任務綜合性能優秀,,, ,,,,比肩國際一線模子;;;;;;;;多模態性能領先,,, ,,,,各方面性能突出;;;;;;;;純文本推理與多模態推理能力均對標GPT-4.5和Gemini 2.0 Pro等國際一流模子的水平


Screenshot 2025-04-11 at 3.06.29?PM.png

【強推理能力】日日新融合模子從 5.5 到 V6 / V6 Reasoner,,, ,,,,推理能力顯著提升。。。。 。在獨立評測中,,, ,,,,多模態和語言深度推理任務上同時超過了OpenAI的o1和Gemini 2.0 flash-thinking的水平

 

基於超過200B高質量多模態長思維鏈數據,,, ,,,,商湯通過多智能體協作進行長思維鏈合成和驗證,,, ,,,,「日日新 V6」形成了突出的多模態推理能力,,, ,,,,可以支持合成最長 64K 的多模態長思維鏈,,, ,,,,支持模子長時間思索能力。。。。 。

 

針對真實環境保存的複雜問題,,, ,,,,「日日新 V6」強大的混淆圖文明确推理能力,,, ,,,,能夠幫助用戶解決各類問題。。。。 。

 

在複雜文檔繁瑣的文檔處理場景中,,, ,,,,「日日新 V6」同樣能夠以多模態強推理能力解決用戶難題,,, ,,,,可於商湯辦公小浣熊體驗:https://xiaohuanxiong.com/office

 

以保險理賠場景為例,,, ,,,,日日新 V6」可根據商業醫療保險理賠质料,,, ,,,,判斷提供质料是否切合理賠要求,,, ,,,,檢查是否保存亂開藥、亂檢查、质料缺失或者质料不齊等問題。。。。 。


Screenshot 2025-04-11 at 3.07.51?PM.png

小額理賠雖然金額小但往往耗費時間長(3-7天),,, ,,,,而交予「日日新 V6」,,, ,,,,它能自主檢測到風險提醒,,, ,,,,自主進行交织驗證,,, ,,,,最後再給予用戶很是細緻、多維的結論,,, ,,,,完成模子到客戶使用的最後一公里

 

得益於多模態強化學習的突破,,, ,,,,商湯構建了面向多種圖文任務的混淆增強學習框架,,, ,,,,基於差别難度分級和多獎勵模子的強化學習訓練。。。。 。

 

國内率先於視頻明确突破10分鐘限制,,, ,,,,超長內容實現秒級推理拆解

 

憑藉「全局記憶」能力,,, ,,,,「日日新 V6」突破了傳統模子僅支持短視頻的限制,,, ,,,,可支持10分鐘級視頻全幀率剖析。。。。 。

 

基於強大的明确能力,,, ,,,,「日日新 V6」還可以對視頻的精彩內容進行智能剪輯輸出,,, ,,,,幫助用戶保存珍貴瞬間。。。。 。


Screenshot 2025-04-11 at 3.08.19?PM.png

針對一段《黑神話》遊戲錄屏,,, ,,,,遊戲玩家們可將一样平常積累的遊戲錄製、實況,,, ,,,,輸入「日日新 V6」明确精彩內容和值得記錄的時間,,, ,,,,剪輯出高光時刻,,, ,,,,同時可自定義天生解說文案,,, ,,,,幫助分享遊玩經驗和遊戲內的精彩操作

 

商湯自研技術可將視覺信息(畫面)、聽覺信息(語音、音效)、語言信息(字幕、口語)、時間軸邏輯對齊,,, ,,,,形成多模態統一時序表徵。。。。 。在此基礎上,,, ,,,,通過細粒度級聯信息壓縮和內容敏感的動態過濾,,, ,,,,實現長視頻的高比例壓縮,,, ,,,,10分鐘視頻可以壓縮到16K tokens,,, ,,,,仍然保存關鍵語義。。。。 。

 

真正像人一樣交互,,, ,,,,「SenseNova V6 Omni」發佈即實現多行業落地

 

伴隨日日新SenseNova V6的發佈,,, ,,,,商湯日日新實時交互融合大模子升級至「SenseNova V6 Omni」,,, ,,,,在角色饰演、翻譯點讀、文旅導遊、講解繪本、數學講解等場景下進行了深度優化。。。。 。


Screenshot 2025-04-11 at 3.08.48?PM.png


以翻譯點讀場景為例,,, ,,,,「SenseNova V6 Omni」讓用戶通過手指就能實現精準位置的空間交互,,, ,,,,並精準明确局部信息與全局信息的關係,,, ,,,,帶來更切合人類自然直觀的指讀交互體驗。。。。 。

 

「SenseNova V6 Omni」擁有更像人的感知和表達能力、情绪明确能力,,, ,,,,並已在具身智能等領域實現多行業、多場景落地,,, ,,,,成為國内首個商業化的全模態實時交互模子。。。。 。

 

滿血版「探讨」全量上線,,, ,,,,現已開放內測

 

整合「日日新SenseNova V6」所有能力,,, ,,,,商湯探讨也迎來周全升級,,, ,,,,並推出全新探讨APP。。。。 。用戶通過一個入口,,, ,,,,即可體驗文字、圖像、視頻等多種模態流式交互體驗。。。。 。

 

探讨APP已啟動內測,,, ,,,,「日日新 V6」现在可於探讨Web端體驗。。。。 。


發佈1億元現金券,,, ,,,,全棧賦能場景落地

 

商湯科技還宣布投入人民幣1億元專項補貼,,, ,,,,聚焦具身智能、AIGC等多個前沿領域,,, ,,,,通過多維度的精準帮助,,, ,,,,為企業提供從專家諮詢到模子訓練、推理驗證的全流程AI服務支持,,, ,,,,打造「高效率、低本钱、端到端」的一站式賦能计划。。。。 。

【网站地图】【sitemap】