人工智能技術在媒體資產(chǎn)領域的應用
人工智能技術在媒體資產(chǎn)領域的應用
陳福生
(泉州晚報社)
【摘 要】黨的十九屆四中全會首次將“數(shù)據(jù)”增列為一種生產(chǎn)要素,要求建立健全由市場評價貢獻、按貢獻決定報酬的機制,標志著以數(shù)據(jù)為關鍵要素的數(shù)字經(jīng)濟進入新時代。數(shù)據(jù)要素所引發(fā)的生產(chǎn)要素變革,正在重塑著我們的需求、生產(chǎn)、供應和消費,改變著社會的組織運行方式。從媒體數(shù)字化轉型的實踐經(jīng)驗中我們可以得知,媒體的數(shù)據(jù)資產(chǎn)是媒體數(shù)字化轉型的數(shù)據(jù)底座,必須管理好媒體的寶貴數(shù)據(jù)資產(chǎn),才能有效地進行媒體數(shù)字化轉型。而對媒體數(shù)據(jù)資產(chǎn)的數(shù)據(jù)管理需要數(shù)據(jù)資產(chǎn)框架來支撐數(shù)據(jù)資產(chǎn)的展示、記錄、分析,通過數(shù)據(jù)資產(chǎn)框架可以明晰媒體擁有的數(shù)據(jù)資產(chǎn)、實現(xiàn)數(shù)據(jù)資產(chǎn)安全分享、提升數(shù)據(jù)資產(chǎn)質(zhì)量、實現(xiàn)數(shù)據(jù)資產(chǎn)變現(xiàn)等數(shù)據(jù)管理目標。項目立項前期,報社積累了幾十萬張圖片。
隨著新媒體的發(fā)展,特別是5G落地之后,報社積累的圖片和音視頻內(nèi)容越來越多。這些內(nèi)容伴隨著刊發(fā)的轉換隨即成為沉沒資產(chǎn),缺少二次利用甚至多次利用的可能。如果單純的在服務器開辟存儲空間,只能解決媒體資產(chǎn)存儲的問題,不能解決媒體資產(chǎn)二次加工和衍生利用的問題,如果要解決媒體資產(chǎn)使用的問題要先過媒體資產(chǎn)結構化管理這一關。傳統(tǒng)的媒體資產(chǎn)結構化需要依靠人工,耗時耗力還達不到效果,在人工智能技術輔助下,提升了媒體資產(chǎn)管理效率、增強了媒體資產(chǎn)管理的安全性,也帶來了媒資資產(chǎn)的多維度應用。本文從泉州晚報社的應用思考出發(fā),希望給全國報業(yè)乃至媒體領域貢獻實踐應用經(jīng)驗。
【關健詞】媒體資產(chǎn) 人工智能 新型 應用
1 為什么要建設人工智能技術加持的媒體資產(chǎn)解決方案
1.1 報業(yè)領域面臨的媒體資產(chǎn)管理問題
數(shù)據(jù)成為了媒體基礎性戰(zhàn)略資源,良好的數(shù)據(jù)資產(chǎn)管理是釋放數(shù)據(jù)要素價值的基礎。數(shù)據(jù)資產(chǎn)管理包含數(shù)據(jù)資源化、數(shù)據(jù)資產(chǎn)化兩個過程,通過數(shù)據(jù)資源化構建全面有效的、切合實際的數(shù)據(jù)資產(chǎn)管理體系,提升數(shù)據(jù)質(zhì)量,保障數(shù)據(jù)安全;通過數(shù)據(jù)資產(chǎn)化,豐富數(shù)據(jù)資產(chǎn)應用場景,建立數(shù)據(jù)資產(chǎn)生態(tài),持續(xù)運營數(shù)據(jù)資產(chǎn),顯性數(shù)據(jù)資產(chǎn)的業(yè)務價值、經(jīng)濟價值和社會價值。
從信息時代到數(shù)字時代,數(shù)據(jù)由記錄業(yè)務逐漸轉變?yōu)橹悄軟Q策,成為了組織持續(xù)發(fā)展的核心引擎。未來,數(shù)據(jù)資產(chǎn)管理將朝著統(tǒng)一化、專業(yè)化、敏捷化的方向發(fā)展,提高數(shù)據(jù)資產(chǎn)管理效率,主動賦能業(yè)務,推動數(shù)據(jù)資產(chǎn)安全有序流通,持續(xù)運營數(shù)據(jù)資產(chǎn),充分發(fā)揮數(shù)據(jù)資產(chǎn)的經(jīng)濟價值和社會價值。
近年來,隨著新媒體的發(fā)展,報業(yè)對視頻和圖片這類圖像資產(chǎn)有著共性需求,主要是圖像類資產(chǎn)的匯聚問題和管理問題。
(1)圖像類資產(chǎn)的匯聚問題
圖像類資產(chǎn)來源有多種。包括新華社通稿圖片和視頻;外購的圖片和視頻;收錄的影像資料;各地記者站提供給的圖片和視頻;以及報社編采人員大量的自采圖片和視頻。
圖像類資產(chǎn)的存儲方式有多種。如果是通過系統(tǒng)獲取的圖像類資產(chǎn),會存在服務器的存儲空間;如果是編采人員自采的圖像類資產(chǎn)則會保存在編采人員手中。當需要使用時,需要通過記憶回想當時這個圖像類資產(chǎn)是哪個編采人員采集、哪個制作人員加工、發(fā)布在哪些渠道、大致發(fā)布的時間,才能找到對應的圖像類資產(chǎn)。也可以說報社花費了成本獲取的圖像類資產(chǎn)在匯聚和存儲方面沒有形成報社統(tǒng)一管理且可以方便利用的資源。
(2)圖像類資產(chǎn)的管理問題
圖像類資產(chǎn)的非結構化特性。圖片以及視頻都屬于非結構化對象,無法通過關鍵詞檢索精準找到想到的圖片素材或者視頻鏡頭。如果不對圖像類資產(chǎn)進行管理,編采人員通常會通過記憶方式,按照印象中的關鍵詞檢索圖片和視頻,然后再通過人工方式從檢索結果中肉眼“掃描”圖片,通過拖動圖像時間線的方式找到想要的視頻鏡頭。這樣的資源查找方式不適合新媒體內(nèi)容快速生產(chǎn)方式。因此很多媒體采用人工方式對圖像類資產(chǎn)進行結構化,使編采人員利用資源時能快速找到想要的內(nèi)容。
傳統(tǒng)的人工管理方式存在一些弊端。如下所述:
①需要加工人員對新聞內(nèi)容有豐富經(jīng)驗
采用人工對圖像類資產(chǎn)進行結構化操作,需要加工人員對新聞內(nèi)容有非常豐富的經(jīng)驗。因為新聞內(nèi)容不光是時政新聞,還有體育類新聞、民生類新聞、經(jīng)濟類新聞等等,不同垂類新聞需要按照不通過的體系進行結構化加工,需要加工人員對不同垂類新聞有豐富經(jīng)驗。我們以體育新聞舉例,體育新聞的結構化加工很多時候依靠體育類的編采人員進行加工,但本身編采工作比較繁忙,工作重心在內(nèi)容的采編而非資產(chǎn)加工,因此依靠編采人員對資產(chǎn)進行加工的方式行不通;一些媒體成立專門的資料室或者通過外包方式對資產(chǎn)進行結構化加工,這就需要加工人員對不同垂類新聞有經(jīng)驗要求。
②加工的標準無法與時俱進
一些媒體為了能對圖像類資產(chǎn)進行標準化加工,制定了規(guī)范,比如分類體系、標簽體系。但只代表了標準制定時的要求,無法與時俱進。比如對于人物的加工規(guī)范,隨著人物的職務變化,需要更新標準內(nèi)容;
此外,互聯(lián)網(wǎng)發(fā)展變化很快,會出現(xiàn)很多新情況,在制定規(guī)范時無法預測后續(xù)會出現(xiàn)哪些情況,因此加工規(guī)范的適用性存在局限性。
③存在遺漏的情況
由于圖像類資產(chǎn)采用人工加工的方式,無法那么精準的識別圖像類資產(chǎn)的所有要素,會存在遺漏的情況。當遺漏出現(xiàn)時,編采人員使用就會有問題,比如找不到、找不全等情況的出現(xiàn)。
1.2 報業(yè)領域面臨的媒體資產(chǎn)使用問題
圖像類資產(chǎn)的使用方向也非常多。包括新聞內(nèi)容生產(chǎn)的使用、內(nèi)容衍生品的使用和內(nèi)容經(jīng)營方面的使用。
①新聞內(nèi)容生產(chǎn)有很多業(yè)務場景需要使用圖像類資產(chǎn)。
比如地區(qū)宣傳片的制作中需要使用大量的圖像類資產(chǎn);體育類新聞內(nèi)容需要大量的圖像類素材;在新聞視頻的制作過程中會應用到空鏡頭素材等等。如果沒有圖像類資產(chǎn)的匯聚和管理,對于新聞內(nèi)容的選題和制作都存在問題。
②衍生品制作的使用問題
圖像類資產(chǎn)特別適合內(nèi)容衍生品的制作,比如對地區(qū)歷史文化的介紹、重點企業(yè)的介紹、文創(chuàng)產(chǎn)品的應用、數(shù)字藏品的應用都需要圖像類資產(chǎn)。如果對圖像類資產(chǎn)沒有好的管理手段,在資產(chǎn)使用方面會存在問題。
③經(jīng)營方面的使用問題
報業(yè)的圖像類資產(chǎn)都是報社單位花費了成本采購或者采集加工而來。在作為內(nèi)容素材進行刊發(fā)后還可以作為資產(chǎn)對外進行經(jīng)營。
比如給當?shù)匚k局進行輸出,從而獲得政府部門和行業(yè)管理部門的政策或者經(jīng)費支持??梢宰鳛榘鏅鄡?nèi)容輸出給新媒體平臺,可以按照流量情況獲得利潤分成??梢宰鳛榘鏅鄡?nèi)容輸出給圖像類平臺使用,從而獲得版權收入。
圖像類資產(chǎn)在經(jīng)營方面有很多應用模式,如果圖像類資產(chǎn)的管理手段跟不上業(yè)務發(fā)展,則報社的資產(chǎn)會成為沉沒成本。
1.3 人工智能技術在媒體資產(chǎn)管理應用的可行性隨著人工智能技術在圖像類內(nèi)容的應用,使圖像類內(nèi)容資產(chǎn)的管理方式得到了很大提升。
(1)利用圖像指紋技術實現(xiàn)以圖搜資源
傳統(tǒng)資源管理平臺只能以全文、關鍵詞等文本方式進行資源查找。利用人工智能技術,可以通過視頻指紋技術實現(xiàn)以圖搜資源的新穎手段:
視頻指紋是:基于視頻文件每幀畫面計算得到的特征值,只要畫面內(nèi)容(數(shù)據(jù))沒有變,該指紋就不會變。
視頻指紋識別:通過視頻指紋的比對,快速找到畫面內(nèi)容相匹配的資源文件視頻指紋的特點如下:
視頻指紋較?。好繋嬅?0字節(jié),每小時的指紋特征大小為3.6MB。指紋生成效率高:F1-200整機提供400倍的復合指紋生成效率。首幀快速定位技術——快速判定查詢幀是否為指紋庫首幀
容錯計數(shù)與終止查詢技術——允許查詢過程中存在少量錯誤,提升查詢魯棒性丟幀匹配技術——允許查詢視頻存在少量丟幀,提升魯棒性
匹配位置修正技術——當匹配位置出現(xiàn)偏移時(比如由于上下變化生成的黑邊),重新定位匹配位置,提升查詢魯棒性
可信度自動調(diào)節(jié)技術——自動調(diào)節(jié)容錯計數(shù),提升查詢魯棒性關鍵幀加速技術——基于關鍵幀技術,明顯提升查詢效率
采用視頻指紋技術,可以提升搜索命中結果,帶有命中的時碼信息,使用人員可以直接快速定位到對應的位置查看。
(2)語音轉文字
①提取圖像類資產(chǎn)的標簽。利用智能語音識別分析技術,實現(xiàn)視音頻資源入庫時,自動將視音頻的語音信息轉寫為文字,通過NLP技術,提取文字中的關鍵詞作為圖像類資產(chǎn)的標簽。
②生成視頻字幕。利用智能語音識別分析技術,可以將視頻資源的語音識別為文字。對識別結果提供純文本與時碼+文本兩種形式結果,可以導出用于稿件的快速編寫或者應用到字幕的快速制作添加,大大節(jié)省同期聲制作人工成本。
(3)適配新媒體發(fā)布的編解碼技術
不同的采集設備有不一樣的格式,不同的新媒體發(fā)布渠道需要不同格式的資源。在視頻類資源采集時調(diào)用兼容上百種資源格式的編解碼技術,將資源轉換為適合新媒體制作及發(fā)布的資源。不僅提升文件轉換操作效率,也降低文件因轉碼導致?lián)p壞或不適配的風險。
(4)數(shù)字水印保護知識產(chǎn)權
水印,作為保護知識產(chǎn)權的重要手段,早已被大眾習慣且接受。但是這種方法仍然存在著多方面的不足。對于觀眾來說,蓋在圖像或畫面一角的logo會破壞原圖,且影響美觀。對于內(nèi)容所有者來說,這種直接顯示在畫面上的水印也很容易被去除。針對這些問題,隱形水印這門技術被提出并逐漸發(fā)展了起來。
數(shù)字水印(隱形水印),是一種肉眼不可見的水印,可以保持圖片美觀的同時,保護資源版權。對圖片使用加入隱藏文字的水印,借此避免圖片未經(jīng)授權的復制和拷貝,可通過對原圖進行變換操作,得到水印圖來證明版權歸屬??梢詫ν鈭D片不同用途加入不同的隱藏水印,防止泄露,如果資料被復制、傳播可根據(jù)解碼出的唯一標識得出泄露方信息。
2 人工智能技術在媒體資產(chǎn)解決方案中的創(chuàng)新性應用
2.1 人工智能的結構化加工
利用人工智能的能力,視頻類資源可以采用語音轉文字的方式,對視頻文件的語音內(nèi)容轉換成文字內(nèi)容,方便制作成為視頻+文字稿件的混編稿件。
2.2 人工智能的圖像檢索
為了便于后續(xù)對圖片/視頻資源進行查找,可借助人工智能技術,實現(xiàn)以圖搜圖、以圖搜視頻、以視頻搜視頻的功能。便于使用人員對資源的精準檢索。
2.3跨庫運營發(fā)布
在報社內(nèi)部和報社外部分別有一個圖像類資源庫。內(nèi)部的圖像類資源庫支持內(nèi)部內(nèi)容生產(chǎn),外部圖像類資源庫支持對外展示、經(jīng)營。
內(nèi)部圖像類資源庫的運營人員可以將庫內(nèi)優(yōu)質(zhì)的圖片/視頻內(nèi)容推送外部圖像類資源庫,將優(yōu)質(zhì)內(nèi)容進行對外展示發(fā)布。也可以對圖像類資源進行單張或者套餐定價,實現(xiàn)資源的運營變現(xiàn)。
2.4 賽事集錦
可以通過人工智能技術,將包含有相同視頻元素的圖像類資產(chǎn)進行聚合,按照體育類人物、精彩瞬間生成賽事集錦。
2.5 數(shù)字人播報
報業(yè)缺少專業(yè)的出鏡主持人,在進行新聞視頻播報的時候如果有個數(shù)字人作為主持人,會提升視頻內(nèi)容的觀感。特別是如果新聞播報時增加手語數(shù)字人的手語播報,對于聽力障礙人士是個福音。
數(shù)字人可以是卡通形象也可以是真人形象。數(shù)字人可以模擬真人動作;能夠選配聲音、聲調(diào)、語速;可以選擇頭發(fā)、皮膚、服裝。在挑選好數(shù)字人后,給數(shù)字人輸入一段文字內(nèi)容,就可以讓數(shù)字人進行內(nèi)容播報。這種應用在報業(yè)新媒體中已經(jīng)得到應用。
3 人工智能技術在媒體資產(chǎn)領域的應用展望
3.1 人工智能提升短視頻產(chǎn)能方面的應用
(1)圖文一鍵轉視頻
對于報業(yè)來說,缺少專業(yè)的視頻制作人員,因此存在視頻生產(chǎn)產(chǎn)能不足的問題。報社對于生產(chǎn)圖文類內(nèi)容的經(jīng)驗比較豐富,可以借助人工智能技術將圖文類內(nèi)容一鍵轉為視頻內(nèi)容,且還不涉及版權問題。
實現(xiàn)方式為通過人工智能技術,將文字內(nèi)容提取摘要,將圖片內(nèi)容生成圖片視頻,通過文字轉語音方式,將內(nèi)容摘要作為口播內(nèi)容。當視頻生成后,我們看到圖片素材進行播放的時候,搭配著口播內(nèi)容,且口播內(nèi)容還可以配合圖片播放的節(jié)奏進行播報。這樣的圖文轉視頻方式極大提升了視頻產(chǎn)能不足的問題。
(2)數(shù)據(jù)視頻的生產(chǎn)
數(shù)據(jù)視頻原先需要1-2周才可以制作完畢,借助人工智能方式,可在3分鐘之內(nèi)生成數(shù)據(jù)視頻。
模板選擇:數(shù)據(jù)新聞編輯器有多種形式、多種樣式的視頻模板。包括折線圖,柱狀圖等多種數(shù)據(jù)新聞模板,可根據(jù)需要選擇適合的模板。
視頻預覽:在使用數(shù)據(jù)新聞視頻編輯器時,可實時預覽視頻合成的動態(tài)效果,并在平臺上對視頻的數(shù)據(jù)、參數(shù)等信息進行調(diào)整,實現(xiàn)生成視頻效果“所見即所得”。
數(shù)據(jù)表格編輯:使用人員可以在數(shù)據(jù)新聞視頻編輯器中的數(shù)據(jù)配置頁面中,編輯新聞中所需的表格數(shù)據(jù)。編輯過程中,支持在視頻預覽區(qū)實時預覽基于當前數(shù)據(jù)所合成的視頻的動態(tài)效果。
數(shù)據(jù)上傳:數(shù)據(jù)新聞視頻編輯器支持操作者上傳表格數(shù)據(jù)進行數(shù)據(jù)配置。對于已有的表格數(shù)據(jù),可直接通過上傳數(shù)據(jù)功能將表格數(shù)據(jù)上傳至編輯器中,并預覽視頻效果。上傳后的數(shù)據(jù)可以在編輯器中進行實時編輯更新。
視頻配置:數(shù)據(jù)新聞視頻編輯器中,可選擇坐標軸數(shù)據(jù)數(shù)據(jù)來源,自定義編輯主標題、副標題、單位等視頻中出現(xiàn)的文案內(nèi)容。能夠選擇配色方案、自定義視頻時長。
智能配樂:可在數(shù)據(jù)新聞視頻編輯器中,為生成的視頻選擇本地化版權音樂作為配樂素材。
視頻生成:數(shù)據(jù)新聞視頻編輯器可高效合成視頻,一鍵合成視頻。
3.2 人工智能在提升短視頻制作效果方面的應用
智能超分的應用:通過智能超分,可以將低分辨率的視頻變?yōu)楦叻直媛实囊曨l。高分辨率視頻可以提升視頻清晰度,獲得更好的視頻觀感。
老片修復的應用:可以通過人工智能方式,識別老片的噪點、劃痕,并通過視頻技術去掉早點、劃痕、提升視頻清晰度。
老片上色的應用:通過對一些基礎幀預置色彩模式,再通過人工智能技術對圖像的運算,對黑白片進行上色。
視頻去抖的應用:如果在視頻采集時沒有三腳架或者穩(wěn)定器,拍出來的視頻有抖動,再去重拍也不太現(xiàn)實??梢酝ㄟ^人工智能技術,最大限度的去掉抖動幀,實現(xiàn)視頻畫面的穩(wěn)定效果。
視頻去水印的應用:可以通過人工技術,識別水印位置,通過人工智能技術去掉水印和logo,得到一個清版視頻內(nèi)容,便于后續(xù)視頻的多渠道使用。
視頻橫轉豎的應用:視頻橫轉豎在新媒體領域有應用價值。比如網(wǎng)站發(fā)布的視頻是橫版,在手機上發(fā)布的視頻需要轉成豎版。通過人工做兩版視頻太麻煩了,可以采用人工智能技術,通過視頻橫轉豎的應用,將適配網(wǎng)站的橫版視頻轉為豎版視頻。轉后的豎版視頻還可以實現(xiàn)主畫面居中的效果。
4結束語
媒體數(shù)據(jù)資產(chǎn)運營是指通過對媒體數(shù)據(jù)服務、數(shù)據(jù)流通情況進行持續(xù)跟蹤和分析,以數(shù)據(jù)價值管理為參考,從數(shù)據(jù)使用者的視角出發(fā),全面評價數(shù)據(jù)應用效果,建立科學的正向反饋和閉環(huán)管理機制,促進數(shù)據(jù)資產(chǎn)的迭代和完善,不斷適應和滿足數(shù)據(jù)資產(chǎn)的應用和創(chuàng)新需求。媒體數(shù)據(jù)資產(chǎn)管理是一項長期性的、體系化的工作,為保證各項數(shù)據(jù)資產(chǎn)管理活動有效開展,統(tǒng)籌推動數(shù)據(jù)資產(chǎn)管理工作順利進行,戰(zhàn)略規(guī)劃、組織架構、制度體系、平臺工具、長效機制等保障措施變得極為重要。隨著人工智能技術的發(fā)展,媒體應用場景的不斷創(chuàng)新,相信數(shù)據(jù)賦能媒體轉型升級的愿景將會得以實現(xiàn)。
新聞技聯(lián)動態(tài)
- BIRTV2023 媒體大模型創(chuàng)新和應用技術交流會 邀請函 2023-07-26
- 【邀請函】中國新聞技聯(lián)2023 年學術年會 2023-07-20
- 新融合與智安全高峰論壇隆重召開! 2023-04-20
- 首個全國性媒體AIGC研究機構在廣西成立 2023-04-14
- 【邀請函】“數(shù)字中國”下的媒體新機遇 “王選獎”獲獎案例分享會暨媒體融合創(chuàng)新發(fā)展研討會 2023-03-23
- [邀請函]"中國新聞技聯(lián)"市縣融媒體分會2023年學術年會 2023-03-15
- 推動知識資源平臺合規(guī)健康發(fā)展 共促數(shù)字版權規(guī)范化合理化 2023-03-06
- 成功舉辦中國新聞技術工作者聯(lián)合會市縣融媒體分會年會暨換屆大會 2022-12-23
- 中國新聞技聯(lián)新聞信息標準化分會 2022年年會成功召開 2022-12-01
- 《機器生產(chǎn)內(nèi)容自動化分級》團體標準 正式發(fā)布實施 2022-12-01