隨著在線廣告的流行,pay by per click (每次點擊付錢)的模式 逐漸被大家接受?墒请S之而來的問題就是fraud clicking的預防迫在眉捷,因為這將直接關系到這種廣告模式能否長久生存和能否成為一種真正的網站擁有者的收入來源。 下面介紹Google Adsense系統如何從系統角度出發防止點擊欺騙,希望對其它的在線廣告系統防止虛假點擊能有很好的指導作用。隨著在線廣告的流行,pay by per click (每次點擊付錢)的模式 逐漸被大家接受?墒请S之而來的問題就是fraud clicking的預防迫在眉捷,因為這將直接關系到這種廣告模式能否長久生存和能否成為一種真正的網站擁有者的收入來源。下面介紹Google Adsense系統如何從系統角度出發防止點擊欺騙,希望對其它的在線廣告系統防止虛假點擊能有很好的指導作用:1] 點擊率 = 點擊次數/共瀏覽的次數。點擊率是一個判斷是否有無fraud clicks的關鍵的方法,可以想像一個網站上的廣告的點擊率超過10%將意味這什么。#of Click/# of Viewed2] 點擊覆蓋率/獨立IP ,這個分布里如果有;單個IP 的(點擊/瀏覽)=點擊覆蓋率超出了3倍的系統誤差范圍內將有作弊的嫌疑。例子,例如來自 129.119.200.1 的用戶瀏覽了 16個網頁,點擊了4個廣告,而整個廣告的點擊率「從[1]里計算的到」是5%,那么計算得到:%5 X 16 =~ 1,方差為Sqrt(1) = 1,點擊覆蓋率=4/1 = 4 ,根據數學上高斯分布,這種概率小于萬分之一。Ratio VS IP distribution3] 點擊率『點擊覆蓋率』/IP/時間根據時間序列對點擊率進行分析,如果在某一個時間段上有明顯的峰值,那么這將以為著有潛在的欺騙點擊的可能。Ratio VS time4] 網頁load的時間和 廣告點擊時間差的分析,以及每兩次click之間時間差序列的分析[網頁load的時間和 廣告點擊時間差] 應該是一個泊松分布 possion distribution,而每兩次click之間的時間差也應該是一個Possion distribution,如果這個時間用秒記,大于25秒的話基本上呈現高斯分布的形狀。[time of loading - time of click] distribution VS Possion[time difference of two clicks] distribution VS Possion/Gaussion5] 針對Proxy點擊的分析改變IP進行點擊可以說在以往是最難以解決最難以發現作弊方式,大概國人進行Alexa的Boost時就多半采用了Proxy進行虛假點擊的方法,可是這里只要通過反向監查IP的來源是否是帶有Proxy功能的服務器就可以知道了。Reverse Proxy check6] 針對 http_agent的分析Http_agent/時間 的時間序列的分析,峰值超過3方差需要審查7] 針對 http_referral 的分析referral/時間 的時間序列的分析 ,峰值超過3方差需要審查8] 整體效果上還有一個非常有用的量:所有用戶的有效的每千次展示費用的均值/獨立IP這個將能更加直接找到spam clicking 的運行計算機并且予以封殺。Overall Ratio VS IP即便我在這里給出了以上的防止作弊的辦法,但是不要忘記了:邪惡的人永遠比正義的人來的多,來的猛烈。作者:盧亮 原文出處:http://www.wespoke.com/archives/000795.php
如果您覺得此文對您有啟發或者幫助,可以花3秒鐘收藏到QQ空間。平時注意多收集,用時不會干著急!
所屬行業:培訓教育
周期:35個工作日
所屬行業:旅游出行
周期:60個工作日