如果讓你說出今年人工智能領域最轟動的一件事情,那大部分人的答案應該是DeepSeek的橫空出世。今年2月初,DeepSeek在140個國家和地區的應用市場下載排行榜同時登頂,並以開源策略充分展現其技術自信。
開源大模型是指由研究機構或公司開發並公開發布的大規模預訓練模型,其源代碼、參數權重甚至是訓練數據(或數據生成方法)都開放透明,任何人都可以訪問、使用、修改和分發。
“DeepSeek是一款完完全全的開源模型,將各個環節包括數據、代碼、權重、推理鏈的運行思路、工程構建方法都開放出來,讓更多人願意參與進去。”賽迪研究院信軟所軟件產業研究室副主任黃文鴻解釋,就好比建造一所房子,真正的開源不僅公開圖紙、材料、房屋結構,還會清晰地告訴你,每一步應該建什麼,有了這些信息你就可以1比1還原房子。由此可見,DeepSeek開放程度之高前所未有,這也是其一經發布就產生巨大影響的原因之一。
DeepSeek對於我國人工智能產業發展最大的意義在於,其構建了基於自主研發基座大模型的開發生態,從軟硬件的適配到應用推廣甚至產品宣傳,都是全球廠商和開發者共同完成的,極大降低了生態建設成本。例如,微軟、英偉達、亞馬遜、英特爾、AMD等全球科技巨頭相繼宣布上線了DeepSeek開源模型推理服務,國內廠商諸如騰訊雲、阿裡雲均支持DeepSeek的一鍵部署和調用。
“這就像安卓操作系統是開源軟件一樣,因為開源具有良好的適配性,手機、芯片、智能家居等各類廠商紛紛接入,讓安卓成為移動互聯網時代能夠與蘋果IOS系統並駕齊驅的通用技術底座。”黃文鴻告訴記者,互聯網企業、車企、三大運營商等紛紛接入DeepSeek,后續會讓很多具體應用部署在DeepSeek基座模型上,將迅速提高其用戶數量和市佔率。
除DeepSeek以外,我國還有不少開源模型在業界引起廣泛關注。就在DeepSeek-R1發布前,上海AI創業公司MiniMax發布了其開源模型MiniMax-01,首次採用線性注意力機制,實現了技術突破﹔阿裡巴巴最新開源的通義千問QwQ-32B推理模型,在數學、代碼及通用能力的多項權威評測集中表現良好,穩居全球最大AI開源社區Hugging Face趨勢榜榜首,成為當下最受歡迎的開源大模型之一。
“這些都彰顯了開源對技術生態的推動作用,吸引了業內各方支持,形成良好的技術分享氛圍。”黃文鴻認為,信息技術領域具有強者恆強的發展規律,我國在開源模型上是有先發優勢的,必須進一步筑牢技術“護城河”。但目前各行各業真正懂開源模型的人才並不多,基於開源大模型的下游企業,以及做工程優化、模型調優的研發人員相對較少,高校應該培養更多相關人才,共同促成“創新—共享—再創新”,助力產業生態更加完備。
阿裡雲高級總監朱迅垚認為,開源理念在產業界還沒有形成廣泛共識,但DeepSeek和通義千問的成功會讓大家逐步認識到,開源模型將成為推動我國人工智能發展最強勁的引擎。下一步,建議從國家到地方再到企業,以更加積極的態度擁抱開源,同時在布局智能算力、構建高質量數據集、上雲用雲等方面加快創新步伐,緊跟世界先進水平。
DeepSeek發布以來,各行各業都在探索將其融入自身業務場景。“開源模型憑借其低成本、高性能、高開放度的技術優勢,加速了人工智能在行業的普及速度。”黃文鴻說。
今年2月,恆生電子大模型應用全面接入DeepSeek,在金融投研、合規、運營、投行等業務場景中取得較好效果。例如,在投行業務中,利用DeepSeek-R1理解能力,可自動解析招股書、盡調報告等復雜文檔,實現財務數據校驗、合規風險提示的秒級響應。
通義千問開源模型Qwen系列更是憑借其多模態、全尺寸的技術能力,以及由數量龐大的開發者和中小企業匯聚起的良好生態,加快賦能千行百業。截至目前,阿裡已開源200多款模型,包括文本生成模型、視覺理解/生成模型、語音理解/生成模型、文生圖及視頻模型等多模態,覆蓋從0.5B到110B參數的各類尺寸。
去年4月,中國科學院國家天文台人工智能工作組發布了基於Qwen打造的新一代天文大模型“星語3.0”。目前已成功接入國家天文台興隆觀測站望遠鏡陣列Mini“司天”,可實現自主控制望遠鏡進行觀測、分析觀測結果,智能地給出下一步觀測建議,這是大模型在天文觀測領域的首次應用。“從預測蛋白質結構到合成靶向藥物,再到發現新的病毒種類,大模型與科研相結合帶來了許多突破性成果。”朱迅垚說。
DeepSeek也好,通義千問也罷,我國開源模型正以其寬鬆的開發許可和低成本的訓練方式,提升人工智能在行業的應用廣度。
以ChatGPT為代表的閉源模型,其商業模式被稱為“token(令牌)經濟”,即通過向用戶提供API服務,基於token用量計價,然后來賺取利潤。那麼,開源模型又是如何盈利的?
對此,黃文鴻向記者分享了幾個案例。Meta公司推出的Llama大模型通過開源可以吸引更多企業和開發者加入其生態,為后續廣告收入創造機會。
市場上還出現了開源閉源並行的模型產品。具體而言,首先開放出來相對基礎的能力,培養用戶使用習慣,而更高性能的模型則需付費使用。還有的開源模型會與雲服務綁定售賣,相當於模型是免費的,收取的只是算力費用。“這種模式就好比你想用IOS系統就必須配備蘋果手機。再有更相似的案例是,谷歌通過安卓系統吸引用戶,再通過售賣谷歌郵箱、谷歌地圖等增值服務收取費用。”黃文鴻補充道。
在朱迅垚看來,很多做開源模型的企業具有濃厚的技術理想主義色彩,他們的初衷未必完全是奔著商業化去的。“通義千問大模型在全球擁有超過10萬個衍生模型和上億次下載量,這些都是免費提供給用戶的。但正因為開源,大量開發者被吸引過來,阿裡雲的模型服務和配套算力服務得到更多開發者青睞,開發者跟廠商形成一個‘開源—應用—反饋’的良性循環。”
開源模型的發展仍處於初期階段,如何形成健康成熟的商業模式業界仍在探索中。“企業做開源模型肯定是想盈利的,要摸索出一條正向循環發展路徑,在技術普惠和商業變現間尋找到平衡點,讓產業鏈上各個環節的參與者都能受益,確保開源模式持續穩定運轉下去。”黃文鴻建議。
人民網北京3月20日電 (記者羅知之)據中國人民銀行網站消息,初步統計,2024年末,我國金融業機構總資產為495.59萬億元,同比增長7.5%。 其中,銀行業機構總資產為444.57萬億元,同比增長6.5%﹔証券業機構總資產為15.11萬億元,同比增長9.1%﹔保險業機構總資產為35.91萬億元,同比增長19.9%。…
今日春分,溫度逐漸升高,春耕即將進入繁忙階段。在雲南,特色農產品人參果脫毒種苗正被科學培育﹔在河南,近500米的智能噴灌設備正在滋潤良田沃土﹔在湖南,各類農機助力農戶更加“慧”種田﹔在甘肅,大型“鐵牛”穿梭田間辛勤耕耘……跟隨AI,一起看這幅科技與汗水交織的春耕圖景。…
人民日報社概況關於人民網報社招聘招聘英才廣告服務合作加盟版權服務數據服務網站聲明網站律師信息保護聯系我們
人 民 網 股 份 有 限 公 司 版 權 所 有 ,未 經 書 面 授 權 禁 止 使 用