我們分析了10000條視頻,終于知道了今日頭條推薦系統的秘密


          Warning: Invalid argument supplied for foreach() in /data/cxweb/www/gupowang.com/public/article/view.html on line 71
          7年前
          【來源丨視頻幫平臺】

          【編輯丨善小花】


          有人說,2016年是直播元年,也有人說,內容的黃金時代又來臨了。直播和內容一相遇,短視頻就應運而生。所以,你們或許都聽過,短視頻已經成為了新的互聯網風口。——姑婆

          就算法機制平臺而言,播放量絕大部分取決于【推薦量】。

          受“今日頭條金秒獎組委會”的邀請,視頻幫就“金秒獎”第一季度累計3.04億播放量的10166個參賽短視頻進行了專業分析。


          由今日頭條主辦的“金秒獎”(jmj.toutiao.com)是首個短視頻行業專項獎項,以一線資源和獎品希冀成為中國優秀短視頻作品發源地。

          特借此機會,用一篇干貨說清楚今日頭條的推薦機制。


          推薦的流程是:

          短視頻上傳并審核后進入推薦系統,系統識別短視頻內容的分類,標題等標簽信息后試探性推薦給首批目標用戶,根據用戶反饋進行多批次推薦或停止推薦。

          整合全部影響【推薦量】的因素及算法模型邏輯后,將其劃分為兩大板塊——轉化率,熱度

          轉化率=推薦給目標用戶后獲得的播放量/推薦量

          這很好理解,如果算法機制是人的話,費力氣將你的短視頻推給了10000個用戶,最后只有1個用戶點擊播放,鬼才會繼續把精力放你身上~

          系統每批次推薦量的量級都是根據上一批次推薦后的【轉化率】來評估的。

          即,如果首次推薦的轉化率差,后面當然不會再獲得推薦~

          因此【推薦給目標用戶后獲得的播放量】就變得至關重要,是影響轉化率的唯一變量,直接決定著推薦量的多與少。

          而【推薦給目標用戶后獲得的播放量】的4大決定因素是分類、標題 、用戶垂直精準度、封面。

          用大白話總結來說就是:取決于誰會看? 看不看?

          讓我們模擬一遍推薦流程中來思考:

          Step.1 短視頻A進入推薦系統后,系統根據其上傳設定的分類“體育”將其放置于體育分類池中。
          ——分類

          Step.2 系統抓取短視頻A標題《姚明大動作,男籃設兩隊兩主帥》中的關鍵詞,“姚明”,“男籃”。
          ——標題

          Step.3 系統匹配用戶數據中標有“姚明”“男籃”所對應“體育”“籃球”“姚明”“男籃”等標簽的用戶,小量級試探性推薦,觀察用戶是否感興趣觀看并有良性反饋。

          ——用戶垂直精準度
          ——標題+封面

          Step.4 繼而擴大量級推薦,并根據“姚明”,“男籃”關聯更多關鍵詞及標簽用戶,如“NBA”,"CBA","奧尼爾"等......

          ——用戶垂直精準度

          到這兒,我們來結合“金秒獎”第一季度累計3.04億播放量的10166個參賽短視頻,逐一就【轉化率】的影響因素進行數據驗證及運營建議:

          標題

          將全部10166個參賽短視頻的標題提取后,劃分標題字數長度區間并匹配平均播放量,得出趨勢如下:

          標題字數長度在5-10個字內的短視頻平均播放量最低;

          標題字數長度在25-30個字內的短視頻平均播放量最高;

          標題字數長度與平均播放量整體呈遞增趨勢。

          A、從系統抓取標題中關鍵詞層面來說

          字數越多越有空間包含更多的關鍵詞信息,從而使得系統識別更明晰更豐富,得以推薦更精準垂直的目標用戶,獲得更多的播放量。

          若標題內可識別關鍵詞信息過少或對應標簽缺失,推薦系統只得無目標“試探性”推薦,無法保障推薦的用戶垂直精準度,自然難以獲得良性反饋。

          B、從用戶閱讀標題時可接收到的內容信息量來說

          字數越多越有空間將短視頻內容表達完整及包裝,起承轉合,徐徐誘之,獲得更多的播放量。


          那么,哪些詞能夠get到用戶的G點,使得用戶在閱讀標題的3秒內,獲得百發百中的刺激反應呢?

          我們將全部10166個參賽短視頻的標題進行自然語言處理,提取高頻詞,再以平均播放量為基準進行排序整理。

          最熱名詞:

          絕活,解放軍,結婚,農村,武器,美女,中國,舞蹈,真相,姿勢,答案,秘密,做法;

          最熱動詞:

          吐槽,發現,盤點,曝光,揭秘;

          最熱形容詞:

          火爆,神秘,可怕,第一,厲害,奇葩;

          最熱副詞:

          終于,竟然;

          最熱連詞:

          結果;

          互聯網閱讀場景下,標題的存在不再是傳統意味上的“畫龍點睛”。背負“誘發點擊”功能的標題與其說是語言藝術,不如說是心理學藝術。

          標題直接決定著用戶是否會點擊播放,觀察了10166個參賽短視頻中高播放量的短視頻并結合上述詞組,發現分段式結構的故事性標題更能完成“誘發點擊”的任務。

          最熱副詞:終于,竟然;使得標題內的關鍵元素形成沖突,

          最熱連詞:結果的脫穎而出也驗證著前因后果留懸念的句式更有內容性,劇情轉折呈現力更強,沖擊用戶情緒。

          參賽作品中電影解說內容短視頻“宇哥講電影”就深諳其道:


          同一視頻,“宇哥講電影”在其他平臺仍主打主流的《X分鐘看完XXX》格式,在今日頭條卻定制了專屬標題。

          其對李安導演的《喜宴》解說短視頻,標題起名為《親友鬧洞房時不知新娘新郎其實是假結婚,這下只能假戲真做了!》,輕松獲得350萬播放量。

          并不推薦標題黨或固定標題模型來突破播放量門檻,而是要在大量的觀察和分析后,了解平臺的用戶接收習慣或文案取向風格來做突破,才是長久之道。

          標題黨或固定標題模型反而容易被平臺以技術手段排查。

          封面

          用戶瀏覽短視頻的信息流頁面時,平均停留時間很短暫,3秒鐘的有效時間內,如何利用封面將用戶的注意力鎖定?得以被閱讀標題,被播放?

          我們通過對“金秒獎”第一季度全部10166個參賽短視頻進行觀察,發現高播放量短視頻的封面制作規律:

          NO.1、 封面與短視頻內容的調性統一


          內容調性,簡單說就是潛在受眾會喜愛的內容風格。喜愛看《鄉村愛情故事》的觀眾與喜愛看《花樣男子》的觀眾很難在審美層面達成一致。沒有必要盲目跟隨頭部內容潮流,封面的色調,配色,設計只要堅持應和潛在受眾即可。

          NO.2、 畫面清晰度高,定制尺寸,景別以中景,特寫為主


          頭部內容每新發一個短視頻,配合各個平臺不同的封面展現要求會輸出20張以上的封面圖,來保證預期清晰度,畫面不變形。同時,雙封面要求下,會根據封面展現形勢進行調整,重新設計。

          除了向頭部內容學習,還有一個很好的方法,學習平臺上“廣告”的封面圖。廣告投放的背后是高費用成本,人力成本與經驗成本的結果,每張廣告都有其借鑒價值和意義。

          NO.3 、高亮核心重點,彰顯戲劇張力


          含有劇情的搞笑,情感,資訊等類目短視頻,封面可采用短視頻中最有戲劇張力單幀的截圖,最夸張,最有表現力的表情或是容易誤解(污解)的片段,人物間要有交流意味。

          分類

          我們將全部10166個參賽短視頻進行分類并匹配各分類的平均播放量。又剔除了平均播放量不及10萬的“冷門兒”分類。

          除了傳統的美食、時尚、生活方式等變現能力強的垂直領域,隨著消費升級,受眾對資訊專業度的需求快速提升,如金融,健康,教育等類別正處于爆發前夜。

          在推薦系統中,因內容分類冷門兒導致潛在目標用戶群過少而難以獲得推薦量的情況不勝枚舉。短視頻項目冷啟動階段,鎖定平臺熱門分類去輸出內容的確會相對獲得好成績。

          主流受眾“把持”的推薦機制正是泛娛樂內容起量快的主要原因。

          然而同樣的,在推薦機制中,同類標簽(垂直內容)的短視頻作品互有助力,“抱團成長”。用戶行為反饋的數據與收益,在不斷喚起更細分內容的啟動和專精。長尾效應下,越是大量級平臺,垂直內容培育就越需要更多的時間,但前景必然一片大好。

          另,單個賬號專注單一垂直分類非常的重要。

          系統在前期識別并確認賬號的分類領域后,當該賬號發布不屬于已確認的分類領域的內容時,系統需要重新識別分類再進行推薦。

          這導致會延長推薦啟動時間,無法在規定時效內,推薦給絕對目標用戶。自然難以拿到良好的【轉化率】成績。播放量也不會很理想。

          就高播放量的參賽短視頻作品進行觀察,其主體賬號分類非常統一,如有多個細分短視頻欄目,采取的是注冊多個賬號來規避以上風險。

          熱度=用戶反饋

          讓我們重溫下推薦流程,短視頻上傳并審核后進入推薦系統,系統識別短視頻內容的分類,標題等標簽信息后試探性推薦給首批目標用戶,根據用戶反饋進行多批次推薦或停止推薦。

          所謂的用戶反饋即是決定【推薦量】的另一大板塊——熱度

          用戶反饋包括了評論、點贊、分享、播放完成度。

          分享,評論,點贊


          我們將全部10166個參賽短視頻以播放量為基準進行區分,分為0-1萬播放量,1-10萬播放量,10萬+播放量三個樣本組。匹配相應的平均評論量,平均點贊量,平均分享量。

          用戶反饋行為與播放量呈正相關。

          近期愈發多的短視頻主感知在己身沒有調整的情況下,同比16年推薦量變少.......是因為,很多短視頻主未重視的“用戶反饋行為數據”在推薦系統中的權重升高。

          首先,算法機制平臺多以資訊平臺起家,在海量內容開荒收割用戶市場時期,用戶粘性通過資訊內容的“取之不竭”及高興趣匹配度的識別手段來維系。

          而內容平臺階段時期,整體戰略及運營策略發生轉變。

          在內容提供方與平臺處于賣方市場關系,在內容提供方需要更強的商業變現空間和機制,在用戶停留幾率取決于內容提供方等幾點需求下,內容提供方與用戶的強聯系及機制必然需要建立。

          這是趨勢性問題,平臺在其中也將所獲頗豐。

          此刻,今日頭條客戶端新版本的上線,正面表達了這一訴求:強化社交!

          敲黑板,從今天開始注重粉絲運營,注重用戶反饋,在發布簡介信息及短視頻中強調與用戶互動。最基本的:

          “如果喜歡,可以關注我或給我一個贊,有什么想告訴我的可以在下方評論哦~”

          播放完成度


          在視頻分析頁面,有播放完成度的統計功能

          低于20%,20%-80%,高于80%的播放完成度三檔對應的是三檔不同等級的推薦量評估。同時,整體播放完成度的成績也影響頭條賬號主體的評級。播放完成度與短視頻時長,跳出率,觀看進度都有相應的關系

          我們僅就短視頻時長來觀察“金秒獎”第一季度全部10166個參賽短視頻,



          5分鐘-6分鐘時長的短視頻平均播放量最高;

          4分鐘-5分鐘時長的短視頻平均播放量次之;

          2分鐘-3分鐘時長的短視頻意外處于第三序位。

          數據結果供你參考,可以測試調整你的短視頻時長來觀察相應效果。

          最佳發布時間

          另,在短視頻流程中,用戶的及時反饋(點擊播放,評論,分享,點贊)可以在有效時間內同比獲得更多批次的推薦量。

          這也是上文中提及不專注單一垂直分類的短視頻賬號所發布的內容無法在有效時間內獲得保障推薦量的反面后果。

          在短視頻發布后的推薦時效——24小時內,獲得推薦批次的多與少直接影響著播放量的成績。

          這也要求在短視頻發布的時間點,用戶能夠快速反饋。

          粉絲運營是一方面,用戶活躍時間也是重要的影響因素。

          為保障數據的有效性,在“金秒獎”第一季度全部10166個短視頻外,我們額外抓取了今日頭條上45萬個短視頻,將發布時間與平均播放量對比。



          07:00,12:00,17:00 分別是一天中3個最佳發布時間。

          觀察數據趨勢,與非算法機制平臺發布最佳時間點對比有一定區別,

          這源于發布后到達用戶的流程不同,

          非算法機制平臺內容發布后直達關注粉絲,由粉絲選擇點擊閱讀與否,閱讀后同時段分享擴大覆蓋面。

          算法機制平臺內容發布后則進入推薦系統進行首批目標用戶反饋測試,再而多批次推薦,需要時間。

          將數據中平均播放量所匹配的07:00,12:00,17:00最佳發布時間,與互聯網用戶客戶端的活躍時間數據進行比照,

          此數據結論的確留有著【推薦系統】反饋測試收集時間的余地。

          上述便是【推薦量】的秘密,在透徹了解推薦流程后,逐一因素進行分析與調整就可使得你的推薦量足以與你的內容質量比肩!也許這才是真正的“不輸在起跑線上”。

          收藏

          {{favCount}}

          個人收藏

          投稿請戳這里!投稿
          0

          次分享

          文章評論(0)

          {{ user.nickname }}
          發表評論
          登錄 進行評論
          加載更多 正在加載中... 沒有更多了