400-699-0896 产品试用 登录

“马蜂窝”被捅,数据造假难题如何解?

2018-10-30

99click商助科技

这两天马蜂窝被捅了,内容抄袭,数据造假,大量灌水,赤裸裸地欺骗用户。一石激起千层浪,数据造假,作弊,刷量等问题再次被推到舆论的前沿!

这两天马蜂窝被捅了,内容抄袭,数据造假,大量灌水,赤裸裸地欺骗用户。一石激起千层浪,数据造假,作弊,刷量等问题再次被推到舆论的前沿!

马蜂窝冤,却又不冤。

广告作弊乱象滋生,数据造假由来已久

实际上,互联网平台数据造假,一直都不是新鲜事。2014年,马蜂窝CEO陈罡就曾在微博,公开炮轰去哪儿网通过虚假评论造假。

互联网广告繁荣的同时,也滋生了一系列乱象。网络广告行业组织交互广告署援引的数据称,约36%的互联网流量被认为是虚假的,是由黑客控制的计算机生成的。所谓的僵尸流量欺骗了广告客户,因为通常情况下只要广告显示出来——无论是否被用户看到,广告客户就需要付费。

行骗者利用虚假流量哄抬网站流量,通过中间商向广告客户收费。安全专家指出,行骗者身份很难界定,他们通常远程操控网站,例如他们可能人在东欧地区。

根据全美广告商协会(Association ofNational Advertisers)的估计,虚假点击在今年将会给广告主们带来72亿美元的损失,这一数字比2015年的63亿美元增长了将近10亿美元,虚假点击量占整个网络广告点击量的比例超过了十分之一

甚至连媒体平台也会主动造假:

原WE队员微笑在斗鱼直播时,其显示观看人数竟然超过“13亿”!而2015年中国全国人口数量才13.6亿;

2010年世界杯期间,视频网站酷6网公布了世界杯期间日浏览量(PV)峰值达到3.99亿,日独立用户峰值为5233万,而后被爆出酷六首页上竟有多达5次的PV统计;世界杯专题页面上,打开一个日历嵌套页面,竟然也被计入一次PV统计。

互联网广告作弊日益成为一个让广告主们头疼的事情。

面对层出不穷的造假,如何鉴别广告作弊?

目前数字营销领域的广告大致分为两大类:

品牌广告以大企业的品牌宣传为主,多以千次曝光的形式计费,广告主追求的是长期的品牌溢价;

效果广告则多以单次点击或单次行为收费,更多关注广告投放后短时间内有没有实际转化和收益。

在实际投放中,广告主往往希望投放的结果是两者兼得品效结合,希望一次投放能保证时间、曝光、点击、地域、人群、设备、转化(注册、购买、问卷等行为)等多个指标。

每一次广告曝光都涉及媒体、投放中间平台(DSP、adnetwork、adexchange等)和看广告的人这三个主要环节,广告主将一笔预算委托第三方平台进行广告投放后,其他环节对他们来说就是非透明的难以掌控的,这种信息不对称滋生了很大的数据作弊空间,其中的利益相关方可能有目的性的通过欺骗性手段实现广告效果。曝光作弊、点击作弊、转化作弊的行为并不鲜见,这也是广告主投放广告时的两点核心困惑。

对广告主而言,可以通过简单的数据分析方式发现一些明显的异常点。一份疑似作弊的投放数据报告有如下特征中的某一点或某几点:

1.点击或曝光数据中的异常峰值

2.点击或曝光出现峰值时转化数据并没有增长

3.点击或曝光出现峰值时到站流量反而下降

4.点击或曝光出现峰值时到站跳出率增长

5.投放的媒体属性和点击的地域属性不符(如投放某地域门户网站但点击数据集中于其他城市)

6.点击时间曲线和媒体的流量曲线不符

7.各广告位的CTR与广告形式的平均CTR不符(如横幅广告位CTR大于1%)

……

通过自动化的程序模拟点击是最常见也是成本极低的一种点击作弊方式,广告主可以通过分析点击数据日志区分真人点击和机器点击

要确定是否是机器点击,通过以下两个维度甄别:

1. 点击请求的Headers异常:

Hearders请求中的Referer和Useragent是最直观判断机器行为的方法,在反爬虫策略中也应用广泛。机器行为模拟的点击请求由于没有正常访问路径,Referer可能为空,Useragent可能不是正常浏览器的Useragent。但Hearders非常容易伪装,这一策略只能甄别那些初级作弊者。

2. 点击行为分析:

机器点击具有一定的连续性,可以通过判断同IP同设备的连续点击、同IP段的大量点击、同IP连续点击间隔时间等进行判断。段位稍高的作弊者会通过改变IP地址、改变cookie地址、低频率点击等方式掩盖程序自动点击的特征,在这种情况下需要结合到站后的点击行为轨迹进行综合分析。

1030.0.jpg

除了点击作弊之外,现在的网络广告作弊甚至能做到虚假转化。

广告主最看重的效果数据就是点击后的转化效果,比如用户注册数、商品下单数、参与活动的人数等。转化作弊即在注册、激活、下单等不同场景下通过自动化程序有针对性的模拟真人行为。

以转化作弊中的机器注册为例,除了传统的频率、次数的防御以外,目前有效的分析维度有:

注册者的URL访问轨迹:机器注册可能出现到站后只访问注册URL频繁注册的行为。

1030.2.jpg

注册者是否查看了页面上的静态资源:机器注册在访问时只关心网页上的文字,在没有验证码的情况下不会加载页面上的CSS或JS信息。

不同账号同密码注册

注册者从到站到注册间的时间间隔:真人通过点击广告到站后往往在注册前会有较长

时间的浏览过程,而机器行为则会在到站后直奔主题,连续两个点击之间时间非常短。

从以上的例子可以看到,虽然广告的投放带来大量的新注册用户,但这批新注册用户可能充斥着僵尸用户,实际的留存率极低。广告主是数字营销领域作弊链中最大的受害者,因为有各种作弊手段的存在,广告主损失的不仅是大笔的广告预算,还有虚假转化带来的各种营销活动的虚假繁荣。

破解互联网广告作弊,解决方案,有吗?

目前,解决网络广告作弊的思路大致有三种:

1、广告主自己对流量和转化进行甄别评估。

作弊的甄别方法我们总结了三种:

1)浅层次作弊,用技术分析可以搞定;

2)中层次作弊,看用户行为的异常,比如热图分布;流量分布;以及一些数据指标异常等。

3)高层次作弊,就只能分析数据的合理性。一般来说到了高层次作弊,作弊与否已经不重要,重要的是看你的业务目的是否达成。如果没有达成,效果很差,就算没作弊意义也很小。

2、使用第三方的广告监测服务平台

目前很多广告公司,媒体,广告主都会选用第三方的广告监测平台(如国内的99click商助科技),以此保证数据的公正、可靠、真实性,让广告主了解实际的广告效果,减少广告主损失。

3、媒体平台加强反作弊算法,提高机器人识别率。

无论广告是被虚假点击还是虚假转化, 最终还是要回归到广告主的平台上,从源头上杜绝广告作弊的可能性才是最佳的选择。

利益还在,造假依然有庞大的市场。

回归正常,还有很长的一段路要走!

想知道更多市场营销策略,请关注我们微信公众号:cn99click,

或登录我们官方网站:http://www.99click.com


99click商助科技
QQ咨询
在线咨询