Dolphin1000智能廣告監播分析係統】
(智能自動截取工業級 詳情見www.zghpc.com)
1,廣告公司、電視購物公司、廣告投放量大的企業都需要解決以下問題:
實時收看將要播出的電視廣告(有線電纜內包含的全部頻道);
監控廣告播出情況,對漏播、延播、廣告前後環境實施錄像,以便日後核對;
將同業的個別或全部產品廣告實施錄像,以便隨時參閱、分析、篩選產品和時段;
實現無人值守的電視廣告錄像,以提高員工工作效率;
利用係統自動地對電視廣告播出視頻進行廣告識別、條目登記,直接生成廣告監播報表和分析圖表;
相關部門經理需要在工作筆記本上隨時隨地的監控電視廣告的播出;
鑒於以上問題,現將係統的關鍵性環節說明如下,以利於盡可能的靠近用戶的現實需要:
2,傳統的廣告監播方式
用傳統的廣告監播方式來處理一套電台(電視)節目中廣告信息的過程通常包括下列步驟:
**日: 用傳統的錄像機、錄音機錄製節目並保存
**日: 廣告監測人員通過回放錄音/錄象,記錄出現的廣告信息
第三日: 廣告監測人員將監看數據交監播**處理
第四日: 獲取監播報告
我們通常說廣播、電(dian)視(shi)廣(guang)告(gao)監(jian)測(ce)是(shi)大(da)量(liang)的(de)人(ren)力(li)堆(dui)積(ji)起(qi)來(lai)的(de)數(shu)據(ju),這(zhe)一(yi)點(dian)都(dou)不(bu)誇(kua)張(zhang),尤(you)其(qi)是(shi)電(dian)台(tai)廣(guang)播(bo),因(yin)為(wei)人(ren)的(de)耳(er)力(li)無(wu)法(fa)辨(bian)別(bie)以(yi)倍(bei)速(su)播(bo)放(fang)聲(sheng)音(yin)的(de)內(nei)容(rong),但(dan)卻(que)能(neng)大(da)致(zhi)看(kan)明(ming)白(bai)以(yi)倍(bei)速(su)播(bo)放(fang)的(de)視(shi)頻(pin)圖(tu)象(xiang)。也(ye)**是說,一個監測員若要真實可信地處理前**全部24小時的數據,**必須花26-30個小時的時間。這樣,一個電台一個頻段每天24小時的監測數據處理,將需要3-4個人工來完成,而後還需要人員錄入、QC,*後才能生成監播結果報告單,總共需要4-5個人工來完成。
3,基於音頻的廣告智能監播技術原理
在電台或電視節目中播放的廣告普遍具有下列特征:
1、 同一版本的某個廣告的播出時間上具有重複性和連續性,時間短的會重複播放一星期,長的甚至會達到半年以上。
2、 重複播放的廣告都具有相同的音頻特征(聲紋和頻譜)。
3、 不同版本的廣告具有完全不同的音頻特征。
例如,下麵看到的**是某個廣告樣本的“音頻特征波形圖”:
如果能夠通過語音識別引擎將某套節目中**出現的某廣告的音頻特征信息提取出來,製作為該廣告的音頻識別樣本,**可(ke)以(yi)通(tong)過(guo)語(yu)音(yin)識(shi)別(bie)引(yin)擎(qing)用(yong)該(gai)樣(yang)本(ben)對(dui)後(hou)續(xu)數(shu)據(ju)進(jin)行(xing)連(lian)續(xu)自(zi)動(dong)識(shi)別(bie),並(bing)將(jiang)識(shi)別(bie)出(chu)的(de)廣(guang)告(gao)記(ji)錄(lu)到(dao)數(shu)據(ju)庫(ku)中(zhong),從(cong)而(er)實(shi)現(xian)基(ji)於(yu)音(yin)頻(pin)的(de)廣(guang)告(gao)自(zi)動(dong)監(jian)播(bo)。
實現基於音頻的廣告自動監播的技術關鍵是語音識別引擎的設計,需要解決下列技術難題:
? 廣告識別準確度。如果識別準確度低於80%,係統的可信程度**不可接受。而識別準確度高的算法往往計算量也非常大。
? 計算能力。語音識別算法的計算量非常大,普通的CPU難以負擔,隻能采用專用DSP硬件實現的方案。
? 處理速度。一般而言,實際的應用係統都需要同時監播數十套電台、電視節目。這對識別引擎的硬件設計提出了很高的要求。
4,ZG DOLPHIN 1000型 智能廣告監播係統,
ZG DOLPHIN 1000型 智能廣告監播係統以99%的識別準確度為設計目標,充分利用了飛速發展的DSP技術,攻克了上述技術難題,使基於音頻的廣告自動監播進入實用階段。
ZG DOLPHIN 1000型 智能廣告監播係統采用基於高速DSP高速、高精度語音識別算法,實現了電台、有線電視節目中播出廣告的自動識別和分析統計。根據操作員預先確定的廣告樣本,本係統能從電台、電視的聲音信號中準確地識別出某個廣告是否出現、在什麼時間出現(精確到0.1秒),以及該廣告播放的時間長度。識別出的廣告的相關信息被自動存入數據庫。
ZG DOLPHIN 1000型 智能廣告監播係統除了具備廣告智能監播功能以外,同時還具有節目監錄功能。通過掛接大容量的海量存儲設備,ZG係統夠將全部節目數據保存30天以上甚至更長,以便事後查證。
4.1,語音識別工作站
語音識別工作站是整個音頻廣告自動監播係統的核心設備,包括廣告識別所需的全部硬件部分和軟件,具體包括:
a,工業級的高性能專業計算平台及相應的調度軟件,滿足係統24小時連續不間斷運行的需要。
b,專用的超大容量音頻數據采集硬件及相應軟件,可以同時對多達10路電台音頻(或電視伴音信號)進行數字化,並將數字化的聲音數據和視頻數據以文件方式保存到工作站的本地硬盤或外掛的磁盤陣列上。
c,專用的視頻數據采集硬件及相應軟件,采用*先進的MPEG4壓縮技術,可以同時對多達10路輸入視頻信號進行數據采集和壓縮,將視頻數據的碼流將到了*低。
d,專用硬件構成的超級語音識別引擎,用以對輸入的原聲數據提取音頻特征。語音識別引擎使用了目前*先進的DSP芯片陣列和識別算法,可以同時對多達10路輸入原聲數據的音頻特征進行並行計算。
e,每台識別工作站可以同時處理多達10套廣播或電視節目。
4.2,磁盤陣列
音頻、視頻信號數字化後,每天產生的數據量是相當可觀的。對於電台節目,每天24小時產生的數據大約為1G(1000M bytes)左右;對於電視節目,采用*先進的MPEG4壓縮格式,每天24小時產生的數據大約為6G左右(包括聲音原聲數據和視頻圖象數據)。
例如,如果需要在一台識別工作站上同時監測16套電視節目和16套廣播節目,並且要求聲音和圖象數據都至少保存90天,那麼需要的存儲空間大約為:
6G*16*90 = 8640 G
1G*16*90=1440G
如此大的存儲要求需要使用海量存儲設備,通常是磁盤陣列。
4.3,操作員終端
本係統中,所有需要人工參與的工作都是在操作員終端上進行。操作員終端提供友好、方便的圖形化人機交互界麵,實現正常節目的確定、廣告樣本的提取、廣告監聽/監看、自動識別、廣告識別結果的存儲和管理等功能。
操作員每天的主要任務,主要包括下列內容:
(1) 打開保存在工作站上的某套電台或電視節目某天的錄音和錄象文件。
(2) 係統用前一日(或多日)的樣本庫對當日原聲進行自動預識別。識別出的廣告會自動標注到波形上,同時將相關信息保存到數據庫中。
(3) 利用終端軟件提供的工具聽取(查看)原聲數據(和圖象),從中發現新廣告,將新出新廣告製作成樣本。
(4) 給gei新xin樣yang本ben輸shu入ru主zhu題ti詞ci並bing保bao存cun。此ci時shi終zhong端duan軟ruan件jian會hui自zi動dong在zai當dang日ri原yuan聲sheng文wen件jian中zhong對dui新xin樣yang本ben進jin行xing自zi動dong識shi別bie,將jiang識shi別bie出chu的de新xin樣yang本ben在zai波bo形xing上shang進jin行xing標biao記ji,並bing記ji錄lu到dao數shu據ju庫ku中zhong。
(5) 操作員重複步驟(3)~(4),直到完成對該日全部新廣告的提取和處理。
操作員終端按照實際需要進行配置。一般而言,如果每天24小時的數據都需要處理,每3~4套節目需要配置一台操作員終端。
下麵是操作員終端的一個操作界麵:
4.4,監播結果數據庫服務器
數據庫服務器上主要存放每套節目的樣本信息和監播結果的數據庫。
監播結果數據庫集中存放各套節目監播結果。數據庫中每條記錄都包含下列信息:
? 媒體來源,如某某廣播電台FM xx.xxxHz,某某廣播電台AM xx.xxxHz,某某電視台
? 廣告名稱(主題詞)
? 節目類型。對於17號令的應用而言,分公益廣告、酒類廣告、影響進食類廣告、普通廣告、禁止播放類廣告、節目
? 播出日期、時間
? 廣告/節目持續時長
用戶收益:
? 實現實時監督播出的廣告播出長度,播出時間的精確性
? 可以監督電視台因工作過失產生的漏播,缺幀等情況
? 可作為電視台是否落實廣告播出合同的依據
? 可實現在同一時刻內同時監控多個廣告播出情況的功能
? 可有效地收集同業的媒介廣告播出情況,利於用戶有效地進行行業分析
手機版|
關注公眾號|

官方公眾號
掃碼手機店鋪


