在19日上午召開的第五屆中國統計開放日上,國家統計局首次對外展示了其正在研究的基于百度搜索數據來預測房地產價格的新工具,并演示了這項工具對北京房價的驚人的預測力。在開放日上,國家統計局也展示了新研發的網購數據統計,而其數據來源之一就是剛赴紐約上市的阿里巴巴。
騰訊也沒有缺席這場建設大數據統計的國家戰役。甫一開年,國家統計局局長馬建堂就馬不停蹄的走訪了中國最具代表性的互聯網企業。馬建堂的身影出現在京東商城和阿里巴巴,以及1號店、CBI易貿集團、百度等企業。今年6月末,馬建堂來到了騰訊,并從馬化騰手中接過了一個企鵝公仔。
百度如何統計房價
更為精確的房地產價格統計一直是政府希圖攻克的難題。因為個人隱私、陰陽合同等問題存在可能影響源頭數據的真實性,而現有房地產數據數出多門的情況也增加了“數據打架”的幾率。
相對而言,海量的搜索數據不經意就透露了真實的房地產走勢信息。
利用基于百度搜索數據,國家統計局篩選出同房地產價格有關的一系列關鍵詞,然后通過這些關鍵詞出現的時間頻次同以往實際發布的新房數據和二手房數據價格的走勢實施擬合并建立模型,最后根據所建模型預測未來房地產價格的走勢。這就是國家統計局新工具的基本原理。事實上,除了國家統計局之外,美國的谷歌也是在用這種原理來預測流行病的爆發趨勢。
利用這一工具,國家統計局在開放日現場演示了一把對北京房價的模擬和預測。
《第一財經日報》記者注意到,通過百度數據所得出的價格曲線預測值同實際價格曲線之間的擬合程度較高,其中百度搜索數據對二手房價格擬合效果比新房更好。這或許是因為剛需人群在尋找二手房交易時更能提供準確而真實的信息。
如果這項工具投入應用,官方內部有望提前多天就了解到下月房價的大致走勢。統計部門也希望,在房價實際數據出來后能使用這一工具檢驗官方數據的有效性,從而提升統計數據的有效性。
國家統計局同阿里巴巴的合作則由來已久。在向社會“找數據”的進程中,淘寶網是統計部門最先矚目的大數據來源。因為淘寶網上的交易數據既是實時成交數,又真實有效,這正是統計部門以往驅動龐大的調查隊伍所希望尋找的絕佳數據。