8.5万就能买2015年的CR-V?假的!

经常关注二手车的朋友们可能注意到一个现象:网上那些热门二手车,为啥有些车源那么便宜?就像题图所述的车源,到底是真是假?

对于那些背离行情的车源,淘车顾问都是很“粗暴”地认为是假车源。然而他们除了经验,也没有特别客观的判定方法,我认为这样很不妥当。这篇文章即是抛砖引玉,讨论下“通过大数据分析识别假车源”的方法。


说明两点:

*我可不会什么大数据分析,只是抛砖引玉,期待专业大神的降临。

*下文涉及的思路可供个人借鉴,但真正的靠谱判别,还是要依赖二手车平台的技术手段。


不过在聊数据方法之前,我们先来聊一下【假车源】为什么会出现,及其对二手车行业的伤害。


1. 为什么会有假车源?

购买二手车是个转化率很低的事件,如果车商想多做几笔生意,【引流】就变得非常重要。如果一个车商一年交易量有2000台,他可能需要十几万的客户群。如何获得这么多客户的信息,就变成车商面前最大的问题 了。


在互联网营销中,要想获得超多的曝光,最简单的手段就是打造爆款。但车子又实在太贵了,不能像数据线或安全套那样亏本销售。所以,假车源的生意经是这样的:

很明显,假车源的目的仅仅是获取客户联系方式,它的功能和假房源没区别。下次我们详细聊聊客户被忽悠到店后,车商是如何安利其他车源的——绝对套路深深。


多说一句:比房产中介更恶心的是,部分不法车商把客户约到店后(尤其是外地客户)会强买强卖、诈骗定金、捆绑销售或者以次充好,这就牵涉到违法犯罪了。所以异地淘车,还是找爱车的诺诺这样的专业第三方比较好——从来都是我们欺负人,还没有别人欺负我们的。


2. 假车源的危害性

就像假房源部分摧毁了房产中介的口碑一样(每晚八点给我打电话摧毁了剩下的口碑),假车源对二手车行业的诚信度的破坏是超乎想象的。


一般来说,二手车商最常见的造假手段是车况注水、里程修改、价格虚高等,这些行为目的还是为了交易。交易双方只要价格谈的拢, 生意还是能做的。


但假车源不一样,它的存在全是为了获取客户的联系方式,而不是为了交易。而客户去二手车平台看车源,可是为了能正儿八经买台车。交易双方的目的发生错位之后,这个行业很快就会失去消费者的信任——任何信息发布都有可能被视为虚假。久而久之,消费者很快就会对整个行业失去信心。


即便是没有人吃亏上当,假车源也完成了劣币驱逐良币的任务,摧毁了整个行业。更有甚者,因为东部沿海某地的假车源实在太多,尽管当地二手车交易量巨大,但依然在业内口碑不佳,爱车的诺诺目前还不会前往该地开设分号。所以说,假车源是多维度的毒药。


实际上,在房产中介市场,连“100%真房源”都能变成slogan,足以说明行业的畸形。


这是我们一个淘车顾问,他实在忍受不了了,对某地的一位假车源发布者进行了声讨:

郑重声明:淘车顾问在该地工作过很长时间,非常喜欢那个城市。之所以怒火滔天口不择言,绝非是打地图炮,仅针对发布假车源的二手车行业害群之马,属于同行间赤裸裸的仇恨,请大家不要投诉我们搞地域歧视。


3. 如何识别假车源?

下面,通过一个实例,我们来看看如何通过数据分析识别假车源。


我们以热度很高的本田CR-V为研究对象,抓取2014~2016上牌的车源的年份、价格和里程。车源地当然选择前文所述的假车源泛滥的东部沿海某地,而数据来源则是我也不知道假车源多不多的58二手车。因为纯手工抓取,难免有疏漏,仅为说明方法,大家别当真。

(图:58二手车自动推荐的车源)

首先,我们将所有价格做排序,分析3年车龄内的该地的CR-V的价格走势。


两个网站的价格走势,都体现出了“三阶段”特征:低价区车源的价格非常低,但数量少;高价区域的价格非常高,但数量更少;中间区域的价格接近,但车源数量非常多。

(注意:纵坐标为车价(万元);横坐标为车源序号,下同;)

注意:低价区和高价区的曲线走势陡峭,这说明车源之间的价格差过大。比如,低价区一台售价11.4万的CR-V,相邻车源的价格是9.36万和12.02万,价差竟然超过2万元,高价区亦然。但是在中间区域,价格分布则紧密许多,一台15万的CR-V,相邻的价格差可能不足0.1万,甚至还有很多相同价格的车源。

很显然,售价8.5万或10万的2015年CR-V肯定是假车源,但为了严谨,我们委托当地的同行调查了部分车源,也证实了我们上述推断:被我们怀疑的车源,经验证的确是假车源!下面的几个结论,也都是经过该同行的实际调查,结果和我们的判断基本一致,故不再赘述验证过程。


做买卖,大家都希望一分价钱一分货,在寻找假车源的过程中,我们还能顺便看看性价比如何。二手车交易中,里程(假设没有造假)是大家十分关注的指标,我们以此为例,看看58二手车网站上,3年车龄的CR-V车源的价格和里程之间的关系。

(注意:纵坐标为车价(万元);横坐标为里程(万km),下同)

这张图的信息量很大,我先抛砖引玉。


首先,能很明显的看出车辆里程价格分布的疏密。散点密集的区域是市场的主流,也就是说,3年的CR-V在58二手车网站上,大部分都是12万~16万,里程在0.8~3.5万km。


除此之外,我们在散点图中画几个辅助线,就可以获得更多的信息。

我们将一百多个散点分成4块区域,每块区域内的车源,都有自己的特点。


A区的车子数量很少,但价格贵、里程高,看上去有点扯淡。不过根据淘车顾问的经验,这些车辆应该有过人之处,不然肯定要滞销。


B区的车源数量很多,价格高、里程少,符合大多数车商的定价策略。


C区的车源价格低、里程少,这很不合理。车商没理由把低里程车辆卖的如此低价,除非是明摆着的事故车--但这样的车源也不会那么多啊!唯一的解释就只能是假车源。


当然,并非所有C区的车源都是假车源,严谨的说法是,距离坐标轴越远的车辆,假车源的嫌疑就越大。


D区域也是一个合理区域,这里的车辆里程高、价格低。不过会有事故车、问题车隐藏其中,淘宝贝需谨慎。不过也有假车源藏匿其中的,因为在某些网站上,只有把里程数写的奇高,才能挂超低价格(正常逻辑:只有挂超低价格,才能把高里程车辆卖出去)。


那如何划定这样的“十字交叉线”呢?说实话,只能凭经验。二手车行业是人和人博弈的地方,我们可以借助科学方法来辅助我们,但还离不开这靠说不明道不清的经验。

除此之外,可以给这些散点添加一道“趋势线”,它说明某个里程数对应的一个“最合理”的价格。高于这个条线都“不合算”,低于这条线就是捡便宜了——当然,您要真是拿着这根线去给淘车顾问提要求,他们保证批评你犯了教条主义错误,然后回公司打我一顿。


另外,我们发现,因为CR-V的车源众多,假车源尽管数量惊人,但它们对所有车源的平均价格的影响微乎其微,平均价格也和中间价格相差无几(正态分布大法显灵了,但必须是车源数量足够多才管用)。利用这个特点,我们可以快速获取某个车型的行情价格:将所有车源价格按顺序排列,找到中间位置的车源的价格,就可以视为这个车型的行情价格。


不过58二手车好像不支持按价格排序……


4. 结论

之所以挂出假车源,根源在于二手车商无获取足够的流量,这是因为二手车行业小、散、非标准化的特性形成的,短期内还是很难解决的。如果是很有实力的车商,我建议考虑内容营销,通过优秀的内容获取流量——就像诺诺一直在做的——换言之,诺诺是不会有假车源的。


我还要怼一下某地同行们:

任何生意做大了,都要面临激烈的竞争,想脱颖而出必须花点脑筋。但所作所为违背基本诚信,最终的结果就是行业臭掉,公司还是要倒闭或改行,受害的还是自己。绝大多数当地人都对这种行为深恶痛绝,对这些害群之马诅咒的比我们还狠。


最后,再次重申这篇文章真正的目的:假车源可以通过非常简单的数据分析的方法来清除掉,希望各大流通机构、二手车交易平台肯定能开发能够用更多、更强大的大数据工具来KO掉这些祸害。