10月22日,以“前沿發明,引領AI產業新變革”為主題的“2024百度十大科技前沿發明”發布活動正式召開。在今年的十大前沿發明中,大模型已成為產業創新和解鎖新質生產力的重要抓手,AI原生應用正在融入生產生活的方方面面。
百度首席技術官(CTO)王海峰表示,前沿發明不僅支持百度提升了自有產品、業務效果和效能,也為百度產品AI原生化重構,為人工智能賦能千行百業貢獻了力量。百度發布十大發明,一方面,通過表彰這些引領產業創新的前沿成果,鼓勵更多的創新創造;另一方面,推動產業界更多應用這些成果,加快產業化進程。早在2017年,百度就開始探索和研究大模型技術,并進一步突破基于思考模型的智能體技術,拓展了大模型的能力邊界,促進大模型應用爆發。
北京市知識產權局副局長潘新勝指出,近年來,國家高度重視人工智能產業發展,北京市正在大力推動人工智能創新策源地和產業高地建設。市知識產權局大力支持以百度公司為代表的產業知識產權龍頭企業,在重點領域開展產業知識產權促進中心建設,以知識產權為紐帶帶動重點產業強鏈增效。作為人工智能領域領先企業,百度創新技術和知識產權工作已經走在了全國的前列。希望百度以此次發布會為契機,繼續加強科技創新,以人工智能技術加快賦能產業高質量發展。
現如今,人工智能與實體經濟加速融合,我國完備的產業體系為人工智能技術提供了廣闊應用舞臺,推動產業轉型升級,成為科技革命和產業變革的關鍵力量。2024年兩會提出“人工智能+”戰略,強調AI在數字經濟中的重要性,加快實現高水平科技自立自強。百度作為領先科技企業,積極推進技術規模化落地,加強自主創新,在城市、交通、工業、金融等領域取得顯著成果,為科技強國和產業強國目標貢獻力量。AI產業正處奇點,技術紅利將釋放,技術發展也將為各行業轉型注入新動力。
百度集團專利事務部總經理崔玲玲發布“2024百度十大科技前沿發明”:百度發布這些前沿發明成果,不僅是對百度技術創新能力的集中展示,更是對未來人工智能發展趨勢的深刻洞察。百度人工智能領域的前沿專利發明,涵蓋了從基礎算法到應用場景的全方位突破,正引領著AI產業新的變革,我們希望不斷加速專利技術的產業化進程,以此推動千行萬業的智能化升級,從而促進經濟高質量和可持續發展。
據介紹,自2013年入局AI領域,百度一直堅持壓強式、馬拉松式的研發投入,近十年累計研發投入近1700億元。據國家工業信息安全發展研究中心、工信部電子知識產權中心今年4月份發布的《新一代人工智能專利技術分析報告》顯示,截至2023年底,百度在人工智能全領域專利申請量19308件、授權量9260件,連續六年位居國內第一;在以大模型為核心的新一代AI領域,百度專利申請1432件、授權651件,成為技術創新和專利布局領軍者。
根據專利數據庫機構IFIclaims發布的生成式人工智能專利圖景洞察,百度生成式人工智能專利申請量躋身全球TOP10,是唯一進入該榜單的中國創新主體,并且專利技術涵蓋文本、圖像、語音、視頻四大基礎領域,成為這四個領域全面布局的全球四家公司之一。百度在人工智能及大模型技術領域的領先地位和卓越專利布局成績的取得,離不開其對AI技術長期持續的投入和專注。
百度2024十大科技前沿發明,具體如下:
一、基于生成式大模型的智能體技術
該發明技術創新性地引入了思考模型,使智能體具備了任務規劃、工具調用、知識增強和反思進化等多重能力。通過系統化的設計與核心能力的定向優化,能夠低成本地支持不同應用場景下智能體的規模化建設與部署;通過建設大規模仿真能力,加速智能體構建與分發。該技術系統已成功應用于文心智能體平臺、商家智能體、文心快碼等多個重點場景,顯著提升了智能體的研發效率,降低了研發門檻。其中,商家智能體通過規劃+專家的多模型協同技術和大規模仿真技術,提升反思、進化和使用工具的能力,構建AI營銷能力;文心快碼依托代碼推薦和智能體系統,與傳統DevOps工具鏈有機結合,推動人機協同結對編程的深度探索與落地。
二、基于大模型高效訓練框架的多模型協同進化技術
該發明技術從工程和算法兩個角度攻克系列難題。工程架構上,從混合并行策略、通信效率、計算存儲優化全方位創新突破,顯著提升大語言模型訓練性能,支撐文心全系列模型全流程高效穩定訓練。算法策略上,研發了大小模型協同的預訓練技術,攻克了模型間知識難以繼承的技術難題,改變了傳統模型的訓練范式,降低了新模型訓練成本。基于該發明構建了各規模模型的技術壁壘,使文心大模型訓練吞吐速度在過去一年提升了4.1倍,支持文心一言高效滿足不同需求的廣泛業務,賦能千行萬業。
三、基于大模型和知識檢索增強技術的多模態內容創編一體的智能系統
該發明技術綜合運用知識增強、多源內容解析、融合式編輯、檢索增強文生圖等技術,解決了專業長文及多模態內容生成質量弱、創編無法共享容器、文生圖主體準確性差等問題。檢索增強文生圖,旨在通過智能判斷用戶需求自適應處理參考圖,進而基于混合模態的生圖系統顯著提升了生圖主體的一致性,有效彌補長尾內容刻畫不準確的短板,整體效果遠遠超過文生圖原生系統。百度文庫已經在基于用戶指令及上傳內容實時生成行業研報、演示文稿、思維導圖、畫本漫畫并支持一站式編輯、跨模態轉換、通用/個性化生圖等復雜任務方面取得了顯著的效果提升。2024年8月,極光旗下月狐數據發布報告顯示,百度文庫智能PPT市場份額已達八成,近3月用戶規模復合增速達23%,增速遠超行業水平。
四、支持規模化的自動駕駛定位和車道級地圖生成技術
該發明技術突破了傳統模式的效率和成本問題,降低了地圖制圖成本95%,車道級道路里程超過360萬公里,實現全國超過41000個城鄉鎮道路的全覆蓋。基于地圖數據進一步構建的多模態傳感器融合的自動駕駛高精定位技術,精度達到厘米級,極大提高了可量產性,將車端定位依賴的地圖包體積降低97.5%,可靠性達到99.9999%,全面支撐目前蘿卜快跑全無人駕駛的規模化運營,在高架橋下、多層路、隧道等各種復雜困難場景實現全無人駕駛。
五、面向大模型智能化的個性化記憶機制
該發明技術創新性地提出了一套全面的記憶機制,涵蓋記憶加工、存儲、管理、觸發和利用五大模塊,賦予大模型個性化記憶能力。記憶加工借鑒人類海馬體機制,實現了對全場景用戶信息的深度理解和精準加工;記憶管理支持用戶主動與系統自動地增刪改查,確保了記憶庫的實時更新與準確;記憶觸發和利用,通過相關記憶的推測生成,輔助大模型產生更加擬人和個性化的回復。該發明技術已廣泛應用于智能AI助手、數字人等場景。
六、基于大模型的超擬真數字人建模、驅動與生成系統
該發明技術提出了一整套的超擬真數字人建模、驅動和生成方案。針對真人數字人,研發了數據驅動的人像建模、跨模態驅動和人像視頻生成大模型,實現了自然、擬真的數字人內容生產,獨家支持大幅動作&遮擋場景的直播人像克隆,并實現了首個全身智能驅動直播間落地。針對超寫實3D數字人,基于文心大模型研發了模態遷移和多智能體協作技術,實現了分鐘級制作媲美影視大片、3A游戲的超寫實數字人形象及運營內容。該發明技術已廣泛應用于數字人直播、視頻生產、智能體等眾多真人和3D數字人的產品中。
七、基于大模型的生成式商業檢索系統
該發明技術變革了傳統的 “索引-召回-排序”流程,扁平化系統漏斗,減少信息損失,通過構建索引學習任務,將商業信息編碼進模型參數,實現“模型即索引”,利用大模型的理解和推理能力,實現“生成即檢索”,新范式顯著提升系統定向效率120%。該發明所涉及項目業界率先落地,實現大規模工業化應用,生成式大模型結合商業搜索場景取得多項技術創新,創意豐富度提升37倍,創意質量提升92%,獲得了顯著的業務收益和廣泛技術影響力。
八、大模型數據飛輪技術
該發明技術通過整合用戶反饋、執行反饋和自監督反饋等多種來源和形式的信息,自動識別模型缺陷并高效合成高質量、多樣化的訓練數據。同時結合多源反饋的強化學習方法,顯著提升了模型訓練效果。該創新技術構建了一個能夠持續自我改進的數據飛輪,有效突破了大模型的數據瓶頸,降低了數據獲取成本,提高了大模型的適應性和魯棒性,提升了模型在不同任務場景下的泛化能力,加速大模型持續進化。
九、大模型高效推理技術
該發明技術提出的高效推理技術,底層模型層基于飛槳框架,在推理架構方向,結合主流的PrefixCaching、Lookahead、PagedAttention、PD分離等方向持續創新,并將各項技術高效結合,大幅提升模型吞吐和性能。在大模型壓縮方面,采用大模型無損量化技術,通過激活自適應分段平滑與權重聯動重排等方法,在業內率先實現了對百億千億級大模型的高效無損壓縮。該發明支持多種大模型壓縮和推理加速手段,目前已應用于百度智能云千帆大模型平臺等核心業務,減少模型推理的資源消耗,節省大模型部署成本超50%,提升模型性能,模型吞吐提升3-5倍。
十、用戶數據反饋驅動的檢索生成系統
該發明技術提出的檢索生成系統,能夠結合用戶行為反饋信號,實現快速自我強化。通過滿意度建模和強化學習直接對齊用戶偏好,并利用用戶反饋觸發系統快速反思,解決了傳統數據應用時專家反饋效率低和用戶偏好建模難的問題。基于該框架的檢索生成系統已覆蓋18%的搜索流量,廣泛應用于文字、視頻、圖片等搜索場景。多元用戶反饋的規模大、可循環的特性,使系統能夠快速適應數據、產品和環境的變化,幫助系統自動化尋優,加速系統向理想狀態演進,具備極高的實用價值和市場競爭力。
友情鏈接: 政府 高新園區合作媒體
Copyright 1999-2024 中國高新網chinahightech.comAll Rights Reserved.京ICP備14033264號-5
電信與信息服務業務經營許可證060344號主辦單位:《中國高新技術產業導報》社有限責任公司