4月29日,國家數據局正式發(fā)布全國數據標注優(yōu)秀案例集,湖南表現亮眼,共有3個(gè)案例成功入選。這不僅是對湖南在數據標注領(lǐng)域努力的高度認可,也標志著(zhù)湖南在數字經(jīng)濟與產(chǎn)業(yè)創(chuàng )新融合發(fā)展上邁出了堅實(shí)步伐。
作為人工智能產(chǎn)業(yè)發(fā)展的基石,數據標注通過(guò)為文本、語(yǔ)音、圖片、視頻等各類(lèi)原始數據添加精準“標簽”,形成高質(zhì)量數據集,從而助力機器更好地學(xué)習、理解和應用,對推動(dòng)人工智能技術(shù)進(jìn)步起著(zhù)關(guān)鍵作用。今年1月,國家數據局啟動(dòng)數據標注優(yōu)秀案例征集工作,經(jīng)過(guò)多輪嚴格評審,最終評選出47個(gè)優(yōu)秀案例,涵蓋技術(shù)創(chuàng )新、行業(yè)賦能、標準應用、生態(tài)培育、人才培養五大方向,旨在樹(shù)立行業(yè)標桿,推動(dòng)數據標注產(chǎn)業(yè)高質(zhì)量發(fā)展。
此次湖南入選的3個(gè)案例特色鮮明,分別在不同領(lǐng)域發(fā)揮示范引領(lǐng)作用?!禔I手語(yǔ)翻譯數據標注賦能無(wú)障礙信息建設》案例聚焦聽(tīng)障群體信息需求,研發(fā)數據標注平臺系統,構建包含超80萬(wàn)條視頻數據與千萬(wàn)字級語(yǔ)料的龐大數據集,為AI手語(yǔ)翻譯模型訓練提供了核心支撐,目前該成果已廣泛應用于電視臺手語(yǔ)播報、政務(wù)服務(wù)手語(yǔ)引導等場(chǎng)景,極大便利了聽(tīng)障人士獲取信息;《鐵塔視頻數據標注賦能多領(lǐng)域智慧監測》案例自主構建采集標注規范體系,基于DeepSeek、文心大模型等技術(shù),并結合樣本增強、虛擬場(chǎng)景融合、半監督學(xué)習等算法,實(shí)現了標注流程自動(dòng)化率72.8%,建成了中南地區規模最大、應用領(lǐng)域最多的鐵塔視頻樣本庫,綜合成本降低64.5%,有效解決了以往存在的樣本標注標準不統一、復雜場(chǎng)景識別精度不足、人工標注成本高昂等問(wèn)題;《數據標注專(zhuān)業(yè)人才產(chǎn)學(xué)融合培養平臺》案例致力于破解數據標注產(chǎn)業(yè)人才短缺難題,提出校企產(chǎn)學(xué)融合模式,建設標注培訓師隊伍、技能培訓認證體系、智能培訓工具、人才晉升通道和成長(cháng)保障機制,構建了六位一體的系統化人才培養舉措方案,已為社會(huì )和企業(yè)培養萬(wàn)余名標注人才。