过去,我国房地产市场以交易新房为主,这部分数据无法精准获知,因而大数据在房地产领域的应用并不深入。互联网正无时无刻不在向我们生活的各个角落渗透,它也在向房地产领域不断渗透。虽说房地产行业是一个非常低频的行业,消费场景很短暂,一个人的一生中交易房屋的次数仅有几次,互联网和大数据在该领域的发展可能不如高频次消费场景下那么深入。但近年来,互联网在房地产领域的渗透和应用依旧可圈可点。

贝壳研究院产品技术负责人刘卯带来了代表存量交易市场规模的数字“5.9万亿”,并分享了存量时代房产大数据应用的前景。据他介绍,贝壳研究院测算2017年全国二手房交易规模在5.9万亿元左右。这个数据背后的含义代表着中国房地产市场经过40年的发展,已经进入到了存量时代,而这样的改变也让众多房地产企业开始思考转型,以便适应新的市场特点,实现更好的生存和发展。

在房地产行业,过去以开发雅西高速三维动画为主的增量房时代,“拿地”、“瑷呦趴建设”、“回笼资金”是企业生存发展的核心思考,“市场需求是否旺盛”、“选址定价是否合理”、“功能服务是否可以满足”这些问题无需过多用心。市场上,房产项目一经落地,就会被消费者抢购一空。而在“存量时代”,这种“躺着挣钱的思路”已被证实不再可行。

受此影响,传统的龙头开发商企业万科、绿镇魂街张颌地、龙湖等纷纷提出要向城市运营商的定位转变,“重新规划业务布局、重新研究服务及定位易丽美、重新思考产业链结构和市场供需”,成为企业生存的当务之急。而这种大规模的转型,单凭企业的经验和直觉显然不够。

因此房产大数据所具有的采集、整理、统计、分析、预测、决策等功能就将发挥重要作用。当前对企业来说,大数据的应用还存在诸多痛点和难点。其中,数据积累不足、数据类型单一是众多大数据产品的短板,很难为行业带来具有广泛意义的参考价值;另外,产品测算方式验证的缺失也是当前很多大数据产品的痛点,未经检验给出的指导策略很难让人信服。

近两年,以Real Data为代表的一系列房产大数据产品的出现,逐渐在这两方面有所突破。据悉,Real Data是贝壳研究院以存量交易数据为基础推出的一款大诛仙3荒火余烬数据产品。其用户包括政府、房企、金融机构等房产全产业链参与者。随着贝壳研究院对RealData产品的不断完善,其功能也在不断升级。

刘卯介绍道,Real Data所研究的数据范围,包括链家从2008年开始搜集的真实存在的房源数据,截止到目前累积了超过1亿套房源的相关数据。而这样的数据体量,对行业进行宏观层面的精准思考具有极大的帮助。

除庞大的数据量之外,Real Data所采集的数据类型也是相当丰富的。2014年链家对当时内部的各项业务进行整合,实现了线上的全流程管理,并将大数据所采集的数据扩展到各项业务的所有行为,为后续打造更系统、更全面的大数据功能奠定了基础,更为房地产企业的决策参考提供更多维度的信息。

据介绍,目前基于Real Data的帮助,贝壳找房对进驻平台的用户提供包括市场分析、产品定位、项目选址、客户分析和估值等多种大数据服务,而平台用户也因此获得了多种赋能,为业务的开展打开局面。

数据技术破解行业痛点

《数据》:虚假房源是中介行业的顽疾,目前贝壳找房如何利用大数据和技术破解这一痛点呢?

刘卯:所谓真房源实际上是有四项定义的,贝壳理解的四项真实定义即真实存在、真实在售、真实信息以及真实价格。那么贝壳是如何利用大数据的能力去保证这四项数据的真实呢,大概有三个方面,第一个方面是由于贝壳的前身是链家,从2008年建设到现在的这个楼盘字典,保证了相对比较全量真实的房屋,所以在经纪人进行录盘的过程当中,他需要先过第一道关,如果我们的楼盘字典里面没有的房屋,那么这个房屋就会大概率被判定为不真实存在,所以在这一环节我们就有能力去保证并且判断房源是否真实存在。

第二个方面就是贝壳的真实价格,当有需求的用户在外网上看到了一个价格,首先要和贝壳预估的价格相比较。房屋的价格是不是过于偏低,是不是经纪人用低价来吸引客户。这样真实价格的保障取决于,过去链家提供了一个相对比较准确和覆盖率相对比较高的一个估价服务,贝壳估价服务体系可以精确到每一套不同的房屋,根据房屋的300多个属性来预估出一个相对准确的价格,所以如果网站上显示的价格离这个估计的价格相对比较远的阿标的一家人话,我们就会认为这是一个相对不科学的价格。

最后就是贝壳的真实信息和真实在售,这就是相对偏业务上的一个动作,也就是说经纪人在网上展示的房屋,业主是否有真实出售的意向,以及经纪人在网上展示房屋,面积和一些土地用途、交易用途的信息是否是真实的。这些重要的信息因素会直接影响到用户实际购买当中的一些决策,判断这些信息是否真实主要取决于沉淀下来的房源验真的策略。

今天的租赁客户更愿意去高频而深度地访问互联网,我们看到租赁大部分的匹配发生在线上,租房者会在前面花40多天看房子,线下交易5天不到,说明交易对信息的依赖更重。互联网租赁平台对交易的体验、租赁用户的体验尤为重要,用户的习惯正在被逐渐改变。

《数据》:目前有很多行业都透露着房产大数据的兴趣,贝壳是如何看待房产大数据的具体应用?

刘卯:对于房产大数据的应用贝壳主要分为两个层面去看待,即对内和对外两个方面。对于贝壳本身房产大数据其实是我们一直有在应用的,贝壳将房产大数据主要应用在保障服务标准和效率,重塑业务流程以及提升用户体验这三大方向。对外的应用也是目前我们正在探索的领域,也是已经有一些阶段性输出的,就是为地产商下游相关企业来提供决策服务,包括市场分析、项目定位、选址、客户分析和估值等等。

持续发力大数据

《数据》:在房产经济领域,链家是布局大数据比较早的公司,开始为交易和流量服务,贝壳租房是否完全继承了链家大数据,除此以外贝壳还yxwd3具备哪些链家不具备的属性和功能?

刘卯:首先贝壳的大数据平台和大数据资源是对所有的业务线开放和使用的,所以贝壳租房是属于贝壳的一个业务线。它完全继承了贝壳的相关资源和能力的。贝壳也组建了自己的大数据相关团队,在做完全针对租赁场景下的一些特有的服务。

贝壳找房继承和升级了链家网在产品技术、品质控制和数据挖掘等中医排瘀培训方面的优势能力。作为服务于整个行业的开放平台,贝壳找房也将通过“楼盘字典”和全生命周期的真房源验真系统,去帮助进驻平台的商家提高其真房源的管理能力。目前,贝壳找房的真房源率可以达到95%以上。

事实上,贝壳很早便开始利用大数据对用户整个生命周期的租赁、买房、换房等交易行为进行观察和研究,深入挖掘用户的真实需求。而对于下一步大数据的继续应用和发展,今天互联网内容建设的一个问题是网站都比较重视房源信息的建设,链家网和贝壳网强调的是真房源,而在前端知识生产、交易相关的周边信息上还有完善空间,所以需要和有各种各样消费场景周边的地铁信息、配套信息结合才能满足消费者更多的需求。对于专注泛房地产研究的贝壳来说,开展全生态圈的跨界联合研究,把自身的优质数据资产与行业共享,也是一项在持续推进的计划。

《数据》:贝壳找房被认为是更高于链家的服务平台,贝壳在数据方面的核心竞争力有哪些?

刘卯:如果是相对于互联网整体的行业来看的话,其实贝壳所处的行业是有一些弊端的,对于数据来说,贝壳所处的行业常年来看是一个长期低频,但短期高频的一个场景,它相对于衣食住行里面的其他领域来说,频率都会非常低。

用户交付的这个频率也会比较低,这样产生的数据就会很少,但是在房产弯刀残魂垂直领域来说,贝壳找房还是有很多的核心竞争优势的,一方面,就是我们已经有相对成熟契约驸马的数据积累和采集能力,是因为从静态数据来说,我们从2008年就开始采集所有的物理存在的房屋信息,到现在已经突破了1亿套数据量级,从动态信息来说,链家从2014年开始做线上的宣传,以及互联网化的升级,到现在为止,我们已经对业务流程当中每一个流程的节点都做到了线上化、产品化。

目前已经具备把业务当中所有环节的行为数据进行收集,这是一个先发的优势,另一方面是应用的和实践的优势,因为所有的数据和策略只有去应用和实践才会有价值和反馈。楼盘字典就是很典型的例子集食惠网,只有在长期被使用和反馈当中才促使它的每一套房屋的数据会越来越准。从过去仅支持链家北京杭文投一个城市的二手房业务,到现在支持贝壳平台上所有入驻商家的二手房、新房、租赁、旅居、海外、装修等业务,楼盘字典也从链家的“楼盘字典”升级为全行业的楼盘字典。随着技术的不断迭代,如今的“楼盘字典”已经形成了房屋数据的智能采集、动态实时更新、智能校验、信用评估的智能化工作流程。

最后就是算法的应用,只有在业务当中实际得到了验证,而且不同的算法策略是根据不同的业务逻辑和规则来适应的,所以只有在链家业务逻辑蓝男色下经过一系列虫鸟的锤炼,贝壳才能更好地移植和赋能到其他平台和公司企业上。文 / 林杉