河北:目前常態化歸集數據已達8700億條 全力支撐人工智能各類應用場景落地
我省常態化歸集數據達8700億條
全力支撐人工智能各類應用場景落地
河工新聞網訊(記者王超)近日,記者從省數政局獲悉,近年來,我省以“人工智能+”行動為引領,建立了數據基礎制度規范,持續擴大數據資源供給,全力支撐人工智能各類應用場景落地。截至目前,我省完成數據編目79.4萬條,常態化歸集數據達8700億條,可為人工智能應用提供豐富的語料資源。同時,統籌建設了省級公共數據平臺,構建涵蓋數據編目、治理、共享、開放等10余項功能的技術支撐體系。
在常態化開展公共數據歸集利用上,去年,我省組織開展了公共數據歸集“百日攻堅”行動,匯聚了一批公共數據。今年,公共數據歸集轉入常態化階段,出臺了《河北省公共數據常態化歸集實施規則》,以“人工智能+”“數據要素*”等場景為驅動,堅持“以需促歸、以供促用”原則,制定公共數據“一張表”。
在深化公共數據登記和治理中,通過剖析“人工智能+”已有場景案例發現,我省“人工智能+”13個領域場景,均為公共數據、企業數據、社會數據等多元融合的場景,其中,在農業、教育、醫藥健康、商貿物流、政務服務等領域公共數據起底層支撐作用,使用占比較高;在鋼鐵、化工、汽車制造、機器人、新能源等領域公共數據起輔助作用,使用占比相對較低。為此我省制定了《河北省公共數據資源登記管理實施細則》,上線公共數據資源登記平臺,率先在公共數據使用占比較高的一產和三產開展公共數據資源登記,累計受理登記申請7033條、審核通過4280條,其中4280條已同步至國家數據資源登記平臺,覆蓋醫藥、教育、交通等多個行業領域,登記數量位居全國前列。
在打造高質量行業數據集中,按照“‘人工智能+’行動到哪里,高質量數據集的建設和推廣就要到哪里”的要求,我省聚焦人工智能+鋼鐵、化工、汽車等產業領域,全面啟動企業數據調查編目,對接指導河鋼數字、敬業集團、長城汽車等企業,深度挖潛治理各領域行業數據,建成轉爐煉鋼生產數據集、智能駕駛數據集等654個高質量行業數據集,為垂直大模型訓練、智能體建設提供了基礎養料。同時,面向社會常態化征集高質量數據集,強化經驗交流共享,更好支撐“人工智能+”行動。
在歸集治理公共數據、打造高質量行業數據集的基礎上,去年以來,省數政局與省有關部門、各市共同在鋼鐵、化工、醫藥等26個領域研發垂直大模型292個,10個通過中央網信辦備案。今年我們重點推動垂直大模型向智能體迭代升級,加快實現模型遷移復用。




