4月29日,國(guó)家數(shù)據(jù)局正式發(fā)布全國(guó)數(shù)據(jù)標(biāo)注優(yōu)秀案例集,湖南表現(xiàn)亮眼,共有3個(gè)案例成功入選。這不僅是對(duì)湖南在數(shù)據(jù)標(biāo)注領(lǐng)域努力的高度認(rèn)可,也標(biāo)志著湖南在數(shù)字經(jīng)濟(jì)與產(chǎn)業(yè)創(chuàng)新融合發(fā)展上邁出了堅(jiān)實(shí)步伐。
作為人工智能產(chǎn)業(yè)發(fā)展的基石,數(shù)據(jù)標(biāo)注通過(guò)為文本、語(yǔ)音、圖片、視頻等各類原始數(shù)據(jù)添加精準(zhǔn)“標(biāo)簽”,形成高質(zhì)量數(shù)據(jù)集,從而助力機(jī)器更好地學(xué)習(xí)、理解和應(yīng)用,對(duì)推動(dòng)人工智能技術(shù)進(jìn)步起著關(guān)鍵作用。今年1月,國(guó)家數(shù)據(jù)局啟動(dòng)數(shù)據(jù)標(biāo)注優(yōu)秀案例征集工作,經(jīng)過(guò)多輪嚴(yán)格評(píng)審,最終評(píng)選出47個(gè)優(yōu)秀案例,涵蓋技術(shù)創(chuàng)新、行業(yè)賦能、標(biāo)準(zhǔn)應(yīng)用、生態(tài)培育、人才培養(yǎng)五大方向,旨在樹(shù)立行業(yè)標(biāo)桿,推動(dòng)數(shù)據(jù)標(biāo)注產(chǎn)業(yè)高質(zhì)量發(fā)展。
此次湖南入選的3個(gè)案例特色鮮明,分別在不同領(lǐng)域發(fā)揮示范引領(lǐng)作用?!禔I手語(yǔ)翻譯數(shù)據(jù)標(biāo)注賦能無(wú)障礙信息建設(shè)》案例聚焦聽(tīng)障群體信息需求,研發(fā)數(shù)據(jù)標(biāo)注平臺(tái)系統(tǒng),構(gòu)建包含超80萬(wàn)條視頻數(shù)據(jù)與千萬(wàn)字級(jí)語(yǔ)料的龐大數(shù)據(jù)集,為AI手語(yǔ)翻譯模型訓(xùn)練提供了核心支撐,目前該成果已廣泛應(yīng)用于電視臺(tái)手語(yǔ)播報(bào)、政務(wù)服務(wù)手語(yǔ)引導(dǎo)等場(chǎng)景,極大便利了聽(tīng)障人士獲取信息;《鐵塔視頻數(shù)據(jù)標(biāo)注賦能多領(lǐng)域智慧監(jiān)測(cè)》案例自主構(gòu)建采集標(biāo)注規(guī)范體系,基于DeepSeek、文心大模型等技術(shù),并結(jié)合樣本增強(qiáng)、虛擬場(chǎng)景融合、半監(jiān)督學(xué)習(xí)等算法,實(shí)現(xiàn)了標(biāo)注流程自動(dòng)化率72.8%,建成了中南地區(qū)規(guī)模最大、應(yīng)用領(lǐng)域最多的鐵塔視頻樣本庫(kù),綜合成本降低64.5%,有效解決了以往存在的樣本標(biāo)注標(biāo)準(zhǔn)不統(tǒng)一、復(fù)雜場(chǎng)景識(shí)別精度不足、人工標(biāo)注成本高昂等問(wèn)題;《數(shù)據(jù)標(biāo)注專業(yè)人才產(chǎn)學(xué)融合培養(yǎng)平臺(tái)》案例致力于破解數(shù)據(jù)標(biāo)注產(chǎn)業(yè)人才短缺難題,提出校企產(chǎn)學(xué)融合模式,建設(shè)標(biāo)注培訓(xùn)師隊(duì)伍、技能培訓(xùn)認(rèn)證體系、智能培訓(xùn)工具、人才晉升通道和成長(zhǎng)保障機(jī)制,構(gòu)建了六位一體的系統(tǒng)化人才培養(yǎng)舉措方案,已為社會(huì)和企業(yè)培養(yǎng)萬(wàn)余名標(biāo)注人才。