寧波東方理工大學(暫名)副校長、加拿大外籍院士曾文軍致辭
5月11日上午,以“大模型驅動產業發展”為主題的第九屆寧波市計算機大會(NBCC2025)在甬舉行,大會聚焦大模型、機器人、人工智能等前沿技術與教育、醫療、工業互聯網、產業鏈應用等深度融合,邀請了中國工程院鄭緯民院士、英國皇家工程院楊廣中院士、美國工程院陳掌星院士等多位嘉賓,同近千名與會者共話未來發展。
鄭緯民:大模型領域,寧波能做的兩件事和不必做的三件事
鄭緯民院士演講
作為土生土長的寧波老鄉,鄭緯民院士是中國計算機機器智能、人工智能大模型的領軍科學家,其帶領的清華大學計算機系團隊過去幾年為阿里的通義千問、月之暗面的Kimi以及Deepseek貢獻了許多開源技術,為中國大模型的成長提供助力。
他在會上的主旨報告首先介紹了一個人工智能大模型完整生命周期的5個重要環節。
首先是數據獲取,也就是從海量的互聯網絡和各類終端中獲取上千億計數的各類數據。第二個環節是數據預處理,這個階段要篩除重復數據、無效數據或低效數據。
“這個過程說起來簡單,但非常耗時,以GPT-4舉例,整個模型訓練周期是一年,其中有半年就是在做數據預處理。”他介紹。
第三個環節是模型訓練,這個階段需要海量的算力,還是以GPT-4舉例,需要1萬塊A100的GPU訓練半年以上。“前三個階段耗時耗資源,成本極高。我認為作為寧波這座城市以及寧波的企業,這三個環節不必要投入太多。”鄭緯民說。
第四個環節是模型調整,也就是說在通用大模型的基礎上做垂直領域模型的訓練,如醫療、教育、工業制造、金融等等,其實是模型的二次訓練,得到專屬行業的專用大模型。
而第五個階段就是應用,根據使用的實際情況繼續提高模型的能力和穩定性。
“后面兩個階段對寧波尤其重要,寧波產業基礎好,應該在全國率先訓練出細分行業的專用模型。”同時,鄭緯民特別強調,在人工智能時代要特別重視開源生態。他在現場介紹了兩個其帶領的清華團隊研發的兩項用于優化大模型的開源技術——“mooncake”“KTransformers”。
Mooncake的核心創新在“以存換算”,構建了一個分離的推理架構。
“比如,今天星期幾和明天星期幾,本質上是一個問題,但以往也是作為兩個問題來儲存和計算。我們的算法就是優化一系列這樣的問題,使得數據預處理、模型訓練和推理之間的任務可以高效分離開來,能夠在處理復雜任務時顯著降低延遲,提高吞吐量。”他介紹,Kimi大模型在采用Mooncake架構后,提升了59%至498%的有效請求處理能力,使其在處理長上下文輸入的場景中表現尤為突出。Deepseek的架構和英偉達新一代芯片也都借鑒了Mooncake,為此英偉達掌門人黃仁勛還在最新的發布會上致謝清華鄭緯民院士團隊。
“這就是開源生態的重要性,共同推進全球人工智能產業的發展和治理。”他說。
而KTransformers項目,則是讓普通人都可以享受到“專屬個人的滿血版推理模型”。
網頁版的DeepSeek-R1本質上是全球用戶都在云端使用價值20億元的算力硬件。而本地部署671B(6710億參數模型,也就是滿血版),理論上需要高端的A100/H100服務器才能支撐,設備價格高達數百萬元人民幣,令許多中小型團隊望而卻步。然而,KTransformers通過一系列技術創新,成功將計算負載壓縮到了可承受的范圍。能在24G顯存的消費級顯卡(如4090)上運行“滿血版”DeepSeek-R1,而內存消耗也顯著低于以往的預期。根據開發者實測,本地運行的顯存占用約為14GB,遠低于傳統部署方案。部署DeepSeek-R1的本地方案僅需不到7萬元,無疑是一次“算力民主化”的飛躍。
AI將助力各行業突破傳統
除了現在廣為人知的如DeepSeek之類的大模型,其實人工智能還有許多技術路線,如深度學習、具身智能、機器視覺、自然語義、類腦智能、神經元算法等。而不同路線的結合將產生各種神奇反應。
楊廣中院士演講
楊廣中院士介紹了醫療機器人的當前挑戰與機遇。目前,深度學習、具身智能、機器視覺三大技術結合的手術機器人已經能夠完成微米級的超顯微手術,如白內障剝除、黃斑裂孔修復、顱內血栓疏通等。而未來用機器人制造的機器人將呈現“更小、更智能、更安全”的三大趨勢。
他表示,醫療機器人已經開始成為連接診斷、治療及康復的智能生態系統,推動醫療進入精準化、個性化、遠程化的新時代,從而惠及更多普通人的身心健康。
陳掌星院士演講
“數據是燃料,知識是引擎”。陳掌星院士在《數據與知識雙驅動的智能大模型》的演講中,通過數據與知識的深度融合,突破了傳統工業模型的局限。未來,隨著邊緣計算、量子計算等技術的成熟,工業大模型將推動傳統制造業進入人工智能新階段。
本次大會由寧波市計算機學會、寧波數字孿生(東方理工)研究院主辦,寧波市信息協會協辦。