av免费网址在线观看-俄罗斯黄色录像-亚洲最色网-日本午夜一级|www.skffagnsk.com

賦能未來勞動,AI大模型將如何發展?

來源于:中國投資咨詢 日期:2025-04-30

自行業先驅OpenAI公司于2018年推出全球首個AI大模型GPT1、于2022年推出首個“爆款”模型ChatGPT3.5以來,全球各國掀起了大模型研發浪潮,眾多大型科技企業、初創企業、研究機構等紛紛投入通用大模型的研發中,形成“百模大戰”。

相比早期的AI模型產品,現階段的AI大模型是“通用”大模型,已經初步脫離特定任務“工具”層面、邁入通用智能階段,不僅表現在其內容理解、內容生成、邏輯推理、知識記憶等基礎能力獲得重大提升,也表現在其基礎能力具有良好的泛化性,可以就特定行業知識、特定任務類型進行優化調試,習得各行各業的細分技能,與人類勞動者的技能培訓可塑性類似。

AI大模型的強大技術能力,使得其在各行各業具有廣泛的應用潛能,相關技術及產業的持續發展,有望成為推動經濟社會進一步發展、全要素生產率進一步提升的重要因素之一。本文就AI產業生態、發展現狀及未來發展方向進行簡要介紹與梳理,可作為讀者了解AI產業的參考之一。

一、AI產業生態

AI即人工智能,指利用數字計算機或其控制的設備,通過感知環境、獲取知識、推導演繹等方法,模擬、延伸和擴展人類智能的理論方法及技術系統。

AI產業生態由基礎層、技術層和應用層構成。基礎層提供算力、數據和算法支撐;技術層以通用大模型(以下簡稱“AI大模型”或“大模型”)為基礎,通過算法開發形成底層技術能力,是AI系統的智力中樞;應用層以技術層和基礎層的能力為基礎,根據具體場景進行技術部署。

AI產業生態基礎層包括算力、數據和算法框架。算力方面,主要由云計算、服務器等廠商基于芯片、網絡設備等關鍵器件部件,提供云端調度或本地部署的算力硬件支持;數據方面,主要由數據服務商匯集數據資源,并進行清洗、標注等數據加工工作;算法方面,AI算法框架廠商為AI開發者開源提供算法框架。

AI產業生態技術層以通用大模型作為基礎,垂直應用模型、其他技術模塊作為補充。通用大模型分為生成式大模型和推理大模型兩類,分別具備快速響應優勢與邏輯推理能力優勢。在模型訓練階段,通用大模型可作為垂直應用模型的基礎,即在通用大模型的基礎上結合特定場景微調得到垂直應用模型;在使用階段,通用大模型和垂直應用模型或補充技術模塊可并行使用、相互分工,由通用大模型解決通用類問題,由垂直應用模型解決相對復雜的專業類問題,由補充技術模塊解決更細化的專業任務,并發揮后兩者細分任務分析精度更高、算力要求更低、響應速度更快的優勢。

AI產業生態應用層主要由智能軟件系統與智能硬件系統組成,智能軟件系統包括企業大腦類、智慧城市類、各領域辦公軟件等應用程序,能夠集成AI大模型技術進行功能與性能的迭代升級;智能硬件終端包括消費電子產品及醫護機器人、自動駕駛汽車等產品,通過集成AI大模型技術,提升認知層次與能力泛化性。

二、AI大模型技術優劣勢評析

1.AI大模型技術優勢:相比傳統AI模型,在四大基礎能力上有重大提升

與傳統AI模型相比,AI大模型在知識記憶、內容理解、內容生成和邏輯推理方面,性能都有顯著提高:

一是知識記憶方面,可將訓練時使用的海量信息進行抽象化理解與吸收,通過建模轉化為上千億參數之間的數學計算邏輯,并通過計算方式提取,因此,其對信息的記憶與調用并不是“查字典”式的引用,而是基于自身的理解進行知識吸收與輸出;

二是內容理解方面,對文字、圖片和對話意圖等內容的理解水平逐步接近人類,能夠捕捉文本關鍵詞或圖片關鍵內容,分析關鍵部分對應的意義或情緒等;

三是內容生成方面,能夠生成原創且連貫的文本,并根據現有數據生成新內容,其可基于大量文本數據的訓練,抓取內在聯系與人類使用模式,并通過基于對話回答問題、基于指令生成內容兩種方式進行輸出;

四是邏輯推理方面,實現“快、慢思考”兩種模式,對于簡單問題可根據統計概率論原理推算結果,對于復雜問題可將問題拆解為一系列有邏輯關系的多層思考步驟進行推演。

2.AI大模型存在的不足:相比人類智能,認知層次或存在根本性缺陷,同時存在多維度安全問題

AI大模型的認知層次或仍停留在統計概率層面,從而長期存在重大能力短板。國內外大量權威學者認為,現有AI大模型所輸出的內容主要是對現有知識進行最符合統計概率分布的“拼圖重組”,而根本性缺乏世界經驗或人類般的思維模式和心智模型。若該觀點屬實,則AI在取得算法架構上的重大突破之前,將長期存在真實準確性、邏輯智力、創造能力等方面的深層次能力短板。

同時,AI大模型還可能遇到各式惡意操作者,帶來多維度安全挑戰。若不對相關安全隱患加以防范,可能造成全社會范圍的安全威脅,而若對AI大模型的正常用途進行過嚴的限制,可能對模型的正常使用造成阻礙。主要的惡意操作者有:一是惡意網絡黑客,或將AI大模型用于自動化攻擊、深度偽造欺詐、對抗性攻擊等領域;二是惡意使用者,或利用AI從事生成惡意代碼、編寫釣魚郵件、密碼破譯等犯罪活動,甚至研發生物武器、策劃恐怖行動、創作違法信息等其他犯罪行動;三是惡意開發者,或在大模型的后訓練階段篡改模型善惡取向等“價值觀”,使模型系統性產出危險內容。

三、AI產業主要發展方向

未來,AI產業將呈現AI大模型技術持續提升、AI技術生態不斷豐富、AI應用形態不斷深化等主要發展方向。

1.通過拓展高質量數據、強化推理策略、創新算法架構等方式,促進AI大模型性能不斷提升

AI大模型廠商將繼續通過拓展高質量數據、強化推理能力、創新新型算法架構等方式,不斷提升AI通用大模型的技術性能,有望推動大模型以“頓悟”的形式提升在邏輯智力等方面的根本性短板。

高質量數據拓展方面,大模型訓練嚴重依賴互聯網公開數據,經預測或在2026年瀕臨數據枯竭。未來技術發展路徑有二:

(1)生成合成數據,即基于GANs算法、VAE算法等技術,按照現實場景數據規律生成能夠模擬交互場景的虛擬數據,預計2030年合成數據會成為AI訓練的主要數據來源;

(2)使用AI企業掌握的私有數據,如Google、Meta等企業擁有大量獨家數據資源,有望獲得一定優勢。

推理能力強化方面,目前大模型僅能完成簡單任務,對復雜任務和長文本分析等缺乏推理能力,需要多措并舉,強化模型邏輯思維能力與可靠性:

(1)強化思維鏈訓練、深度學習等方法提高模型推理能力;

(2)采用RAG檢索增強技術,使大模型在內容生成過程中更嚴格地與信息來源進行校對,從而減少生成內容的“幻覺”等錯誤。

算法架構創新方面,原有的Transformer架構的模型計算成本高、效率低,且存在“幻覺”等問題,亟須研發全新算法,主要有三個路徑:

(1)優化Transformer架構,如通過MoE結構等,優化算力調用效率;

(2)基于Transformer架構基礎上進行微調,如結合Transformer與RNN、CNN形成混合架構;

(3)開發區別于Transformer的新型架構,如實驗室階段的GyberDemo、H20等。

2.打造并豐富垂直應用模型、小模型終端應用技術生態,促進AI技術廣泛滲透應用

AI技術廠商將基于大模型,開發垂直應用模型、終端小模型應用等,形成大模型、垂直應用模型、終端小模型并存互補的技術生態,促進AI技術形成更高的專業知識精度和更小的算力成本,從而可以在細分產業、下沉應用領域進行廣泛滲透。

開發垂直應用模型方面,當前AI大模型在部分專業行業領域的知識深度、結構多樣性等方面尚無法滿足使用需求,需要進一步開發垂直大模型以供專業行業領域使用。未來,業界有望以AI大模型為基礎,使用特定領域標注數據進行監督式微調,增強模型對特定任務的理解和響應精度,研發形成行業專有大模型。

開發終端小模型方面,AI大模型在終端的應用存在算力需求量大、響應延遲等問題,難以在下沉場景廣泛普及。未來,業界有望持續通過知識蒸餾、提示工程、高效微調技術等方法,從AI大模型中提取關鍵知識并訓練應用于細分任務、算力需求較低的小模型,促進AI模型在終端場景的全面普及。

3.圍繞終端工作場景,持續完善“AI員工”、具身智能等應用形態,擴展應用范圍、加深應用層次AI下游應用廠商將依據各類腦力、體力勞動類工作崗位的能力要求,基于大模型等技術層提供的能力底座,持續迭代發展“AI員工”能力、開發AI具身智能技術,促進AI技術不斷完善應用形態、擴展應用范圍、加深應用層次,在經濟社會的各個方面進行賦能。

迭代發展“AI員工”能力方面,腦力勞動類工作的分析、決策壓力較大,需要部署AI進行輔助。未來,“AI員工”或將依據三個層次迭代演進,漸次強化應用深度與自主性:

(1)基于現有AI系統開發垂直模型增強模塊,自動化完成部分標準化業務流程,如自動分析企業輿論風險、增強傳統信貸評估模型的準確性與全面性;

(2)開發特定領域AI助手,依據指示協助完成碎片化工作流程的協助,如AI助手協助生成文案框架、潤色語法錯誤、創作內容草稿等;

(3)發展AI智能體,自主調用其他AI助手、應用軟件、數據接口等技術工具,獨立完成復雜任務。

開發AI具身智能應用方面,人口老齡化趨勢下,機械制造、貨物搬運、建筑施工、養老照護等體力勞動工作崗位面臨巨大勞動力缺口,亟須開發具身智能技術,解決現有AI技術“有腦無手”的問題。近年來,AI大模型驅動具身智能技術快速進步,能夠將多個功能模塊統一融合,具備多模態信息感知、理解與轉換能力,極大提升了通用性和泛化性。目前具身智能的環境適應力、執行精度等方面仍不具備大規模商用化條件,業界正在圍繞“感知+決策”“感知+決策+行動”等多條技術路線進行研發,有望在10年以內開啟具身智能商業化應用進程。