樂收生意寶 令人稱奇的大神級AI,都曾經曆過無數次訓練,AI訓練的核心是數據,盡管數據驅動並不是AI算法訓練的唯一方式,但不能否認的是,相對來說,擁有海量數據的領域,是AI滋生的更好溫床。

舉(ju)一(yi)個(ge)簡(jian)單(dan)的(de)例(li)子(zi),與(yu)其(qi)他(ta)多(duo)個(ge)小(xiao)語(yu)種(zhong)翻(fan)譯(yi)比(bi)起(qi)來(lai),英(ying)漢(han)翻(fan)譯(yi)器(qi)的(de)翻(fan)譯(yi)能(neng)力(li)往(wang)往(wang)會(hui)更(geng)強(qiang),就(jiu)是(shi)因(yin)為(wei)英(ying)漢(han)互(hu)譯(yi)的(de)使(shi)用(yong)頻(pin)率(lv)遠(yuan)遠(yuan)高(gao)於(yu)其(qi)他(ta)各(ge)語(yu)種(zhong)的(de)互(hu)譯(yi)。同(tong)理(li),人(ren)臉(lian)識(shi)別(bie)技(ji)術(shu)應(ying)用(yong)率(lv)遠(yuan)高(gao)於(yu)虹(hong)膜(mo)識(shi)別(bie),因(yin)為(wei)人(ren)臉(lian)數(shu)據(ju)更(geng)方(fang)便(bian)收(shou)集(ji)。
數據匱乏或是采集成本高,是阻礙AI發展的一個重要原因。麵對這種情況,數據增強技術應運而生。
所謂數據增強技術,就像是數據的繁殖皿,可以讓數據進行“有絲分裂”,增強樣本擴大數據集。

就拿圖像數據來說,當圖像數據不足時,可以對原圖像做一些改動,例如裁剪、旋轉、鏡像反轉、輕微的扭曲、增加噪點、增加遮擋物等等。也許對人類來說,被改動過的圖像很容易被識別,看出與原圖的差異。但對於AI來說,即使幾個像素點的變動,也是一個全新的數據樣本。
eryingyongyuwenbenshuju,zeyouhuyihecixiangliangtihuanliangzhongfangfa。tongguojiqifanyi,jiangyijuhuacongzhongwenfanyichengyingwen,zaiyouyingwenfanyichengzhongwen,jiukeyishixianyuxu、tongyicidengdengdetiaozhengtihuan,dedaoyuliaochengerdexiaoguo。yijitongguoziranyuyanshengchengjishu,jiangyijuhuazhongdebutongduixiangjinxinghuafenbingtihuanshengchengxindejuzi,jiuxiangtongyici、近義詞替換。

令人驚喜的是,這些數據增強技術也開始通過深度學習的加持逐漸提升效率。
去年4月,穀歌的AutoAugment技ji術shu,設she計ji了le一yi個ge自zi動dong搜sou索suo空kong間jian,利li用yong搜sou索suo算suan法fa來lai確que定ding適shi合he數shu據ju集ji的de圖tu像xiang增zeng強qiang策ce略lve,製zhi定ding執zhi行xing的de順shun序xu並bing且qie自zi動dong執zhi行xing。比bi如ru將jiang一yi個ge動dong物wu或huo植zhi物wu照zhao片pian數shu據ju集ji輸shu入ru給geiAutoAugment,AutoAugment通過計算會確定出先平移再剪裁是讓AI對於數據“陌生感”最大化的解決方案,然後開始自動執行。是不是很精妙?
-----本文轉自網絡,如有侵權請聯係我們及時刪除處理。
樂收生意寶-是樂收網旗下精準、便捷的采購信息和供應信息發布平台,樂收生意寶用簡單的理念,致力於為中國4000萬中小企業和商業人士提供便捷的采供信息服務!

手機版|
關注公眾號|

下載手機APP

