国产一级毛卡片视频在线播放,成人电影免费看,欧美精品日韩一区二区,日本福利视频在线,天天综合网加勒比

端側大模型迎來"輕"革命:移遠通信 × RWKV 打造"輕量AI大腦"

2025-07-28 10:56

上海2025年7月28日 /美通社/ -- 7月27日,移遠通信宣布與RWKV公司建立全面合作關系,雙方將依托移遠的算力平臺,優(yōu)化并支持RWKV最新模型架構,共同推動大模型在端側設備的低資源占用部署。此次合作成果于2025世界人工智能大會(WAIC)首次亮相,標志著端側大模型解決方案向更高性能、更廣場景的應用邁出關鍵一步。


RWKV(Receptance Weighted Key Value)是全球領先的RNN大模型架構,它成功結合了遞歸神經(jīng)網(wǎng)絡(RNN)的恒定復雜度和高效串行推理,以及Transformer的并行處理優(yōu)勢,使其在文本生成、時間序列、圖像和視頻、語音和音樂等領域表現(xiàn)出色,推理成本和訓練成本顯著低于Transformer。

這項技術的核心突破在于引入RWKV算子替代Transformer的位置編碼和多頭注意力機制。這一革新有效解決了Transformer在處理長序列時的空間和時間復雜度問題,在確保模型性能不受影響的前提下,實現(xiàn)了內(nèi)存占用恒定、token計算復雜度恒定,意味著運算過程更高效、更省力。這一特性讓 RWKV 在端側設備部署中展現(xiàn)出顯著優(yōu)勢:處理長序列時速度更快、內(nèi)存占用更低,相當于為終端設備配備了一個 "輕量化的AI大腦"。

在本次世界人工智能大會(WAIC)上,基于高通 QCS8550 平臺的兩大 RWKV 聯(lián)合解決方案將重磅登場:

  • RWKV Chat:思考永續(xù)

RWKV Chat是一款離線AI聊天應用,無需聯(lián)網(wǎng)即可實現(xiàn)推理、深度對話與文本續(xù)寫,支持個性化會話配置,成為用戶的"口袋級"生產(chǎn)力伙伴。例如其中的RWKV7-G1 2.9B模型在高通手機平臺的速度可達30 token/s,且由于RWKV架構無需KV cache,在超長推理后仍然可以速度恒定,內(nèi)存占用恒定。


 

  • RWKV Sudoku:超長CoT

RWKV 數(shù)獨則展示了20M超小參數(shù)模型在超長鏈式推理(CoT)下的數(shù)學解題能力,憑借恒定內(nèi)存與極少token消耗,輕松破解復雜數(shù)獨,直觀呈現(xiàn)RWKV架構在端側的高效潛能。


在Transformer架構主導大模型領域的當下,移遠通信以前瞻性的眼光,積極布局非Transformer的技術路線,致力于為客戶提供更低算力、更少內(nèi)存消耗的解決方案。

此次展出的RWKV7-G1 1.5B模型,經(jīng)過移遠通信的工程優(yōu)化后,在SG885G模組上的實測數(shù)據(jù)表現(xiàn)亮眼,明顯優(yōu)于同等參數(shù)量的Transformer架構的模型,具體來說,在Prefill階段:

  • 平均耗時減少83%
  • 平均處理速度提升345%

在Decoding階段:

  • 平均CPU使用減少23%
  • 平均內(nèi)存使用減少36%
  • 平均功耗減少18%

移遠通信的SG885G基于高通QCS8550平臺開發(fā),其AI綜合算力高達48 TOPS,能夠支撐7B左右參數(shù)級的多模態(tài)模型在本地化推理,從而實現(xiàn)實時視覺理解與多模態(tài)信息融合。在模型兼容性方面,移遠構建了強大的端側適配體系,率先實現(xiàn)對Llama、通義千問、DeepSeek等主流開源模型的全方位兼容,兼容的參數(shù)范圍覆蓋0.5B至8B,打造出了功能強大的端側大模型超級平臺。此外,在架構創(chuàng)新上,SG885G支持運行非Transformer路線的RWKV7架構,這一特征顯著降低了對算力和內(nèi)存的需求。

移遠通信首席運營官張棟表示:"此次與RWKV的戰(zhàn)略合作,是移遠通信 ‘讓終端擁有AI大心臟'技術理念的關鍵落地!RWKV的線性注意力架構,突破性地解決了端側設備的長序列處理瓶頸,再結合移遠的高算力模組,成功將AI大模型‘裝進'了物聯(lián)網(wǎng)終端。當農(nóng)機能‘看懂'土壤的干濕,當手表可以‘提醒'健康風險,AI就不再是飄在云里的概念,而是真真切切來到了田間地頭、來到了你我的手腕上,讓科技真正服務于每一處需要它的地方。"

RWKV聯(lián)合創(chuàng)始人&COO羅璇表示:"我們希望讓每一臺設備都聰明起來,就像為它們植入了會思考的‘大腦'。隨著RWKV架構在移遠算力平臺上實現(xiàn)規(guī)?;渴穑尳K端設備突破資源限制,構建‘云端能力+本地智能'的雙引擎協(xié)同生態(tài),為萬物智聯(lián)時代奠定技術基石。"

移遠通信與RWKV的戰(zhàn)略合作,不僅是一次技術與硬件的強強聯(lián)合,更是推動智能計算走向普惠的關鍵里程碑,讓"AI大模型"真正走出云端,融入萬物。

7月26日-29日,誠邀蒞臨WAIC 2025移遠展臺(H1 D815),近距離體驗端側大模型解決方案的前沿科技魅力。

關于移遠通信

上海移遠通信技術股份有限公司(股票代碼:603236)是全球領先的物聯(lián)網(wǎng)整體解決方案供應商,擁有完備的IoT產(chǎn)品和服務,涵蓋蜂窩模組(5G/4G/3G/2G/LPWA)、車載前裝模組、智能模組(5G/4G/邊緣計算)、短距離通信模組(Wi-Fi&BT)、GNSS定位模組、衛(wèi)星通信模組、天線等硬件產(chǎn)品,以及物聯(lián)網(wǎng)平臺、認證與測試服務、RTK網(wǎng)絡校正方案、工業(yè)智能、智慧農(nóng)業(yè)等服務與解決方案。公司具備豐富的行業(yè)經(jīng)驗,產(chǎn)品廣泛應用于智慧交通、智慧能源、金融支付、智慧城市、無線網(wǎng)關、智慧農(nóng)業(yè)&環(huán)境監(jiān)控、智慧工業(yè)、智慧生活&醫(yī)療健康、智能安全等領域。更多信息,敬請訪問移遠官網(wǎng)https://www.quectel.com.cn/,關注微信公眾號/視頻號"移遠通信"或發(fā)送郵件至marketing@quectel.com

消息來源:移遠通信