用程式分析房地產可行嗎?房價分析看這裡 - FinLab
文章推薦指數: 80 %
用程式分析房地產可行嗎?房價分析看這裡! Tags: PYTHON, 房地產. 大家都在說房價市場恢復景氣,然而真的是這樣子嗎? 你有沒有覺得,怎麼每個人說的話都不一樣?
Skiptocontent
Tags:PYTHON,房地產
大家都在說房價市場恢復景氣,然而真的是這樣子嗎?你有沒有覺得,怎麼每個人說的話都不一樣?數據雖然都是實價登錄,但有些人就是看到漲,有些人就是看跌?究竟誰說的對,還是必須要親自研究一下數據,才會知道!
內容目錄
隱藏
1
數據是拿來「調整」的?!
2
難道數據造假?!
3
取得實價登錄資料
4
讀取資料
5
圖表分析
5.1
每年房價走勢圖
5.2
那總體來說呢?
5.3
不是有人說2019年房價回升了嗎?
5.4
但是
6
建物型態
6.1
分佈圖
6.2
買房使用Python簡單的範例
數據是拿來「調整」的?!
身為一個「曾經」產出學術文章寫手,就會知道這些數據是有很多「可以操作空間」(這樣講對嗎?XD),不要相信任何人幫你統計的數據,因為任何人的數據都有可能想達成某種目的,例如某人要增加流量和公信力,就可以危言聳聽一點,用數據製作房價都在下跌的結論,某房仲想要刺激房地產,就會製作止跌回升的訊號!
難道數據造假?!
不論上漲下跌,相信這些數據都是對的,都是從政府的實價登錄而得到,但分析方式不同,就會產生不同的結果!
所以數據是用來「感覺」的,而不是單看少數「專家」的結論,只能多做一點實驗,盡量讓實驗客觀公正。
這篇文章總共分成三個部分:
獲取實價登錄房價歷史走勢圖房價分佈圖所以接下來我們就用Python來跟大家一起分析實價登錄的資料吧!
取得實價登錄資料
首先跟上次一樣,爬取了實價登入所有歷史數據,這次我們爬取csv檔:
importrequests
importos
importzipfile
importtime
defreal_estate_crawler(year,season):
ifyear>1000:
year-=1911
#downloadrealestatezipfile
res=requests.get("https://plvr.land.moi.gov.tw//DownloadSeason?season="+str(year)+"S"+str(season)+"&type=zip&fileName=lvr_landcsv.zip")
#savecontenttofile
fname=str(year)+str(season)+'.zip'
open(fname,'wb').write(res.content)
#makeadditionalfolderforfilestoextract
folder='real_estate'+str(year)+str(season)
ifnotos.path.isdir(folder):
os.mkdir(folder)
#extractfilestothefolder
withzipfile.ZipFile(fname,'r')aszip_ref:
zip_ref.extractall(folder)
time.sleep(10)
有了上述這個function我們可以將實價登錄資訊全部爬取下來:
real_estate_crawler(101,3)
real_estate_crawler(101,4)
foryearinrange(102,108):
forseasoninrange(1,5):
print(year,season)
real_estate_crawler(year,season)
real_estate_crawler(108,1)
real_estate_crawler(108,2)
下載完後,會看到每一年每一季的實價登錄資料夾,裡面有很多檔案,主要可以分成以下三種:
x_lvr_land_a:房屋買賣交易x_lvr_land_b:新成屋交易x_lvr_land_c:租房交易其中x是一個英文字母,代表每個縣市,也就是你身份證字號的開頭,例如台北,就是「a」,新北市就是「f」,以此類推。
讀取資料
接下來我們以台北市為例子,看看能不能找到台北市便宜的好房子,首先我們將歷年資料都讀進來:
importos
importpandasaspd
#歷年資料夾
dirs=[dfordinos.listdir()ifd[:4]=='real']
dfs=[]
fordindirs:
print(d)
df=pd.read_csv(os.path.join(d,'a_lvr_land_a.csv'),index_col=False)
df['Q']=d[-1]
dfs.append(df.iloc[1:])
df=pd.concat(dfs,sort=True)
然而這些資訊還必須再經過處理,才會讓我們待會的資料分析更好下手!
#新增交易年份
df['year']=df['交易年月日'].str[:-4].astype(int)+1911
#不同名稱同項目資料合併
df['單價元平方公尺'].fillna(df['單價元/平方公尺'],inplace=True)
df.drop(columns='單價元/平方公尺')
#平方公尺換成坪
df['單價元平方公尺']=df['單價元平方公尺'].astype(float)
df['單價元坪']=df['單價元平方公尺']*3.30579
#建物型態
df['建物型態2']=df['建物型態'].str.split('(').str[0]
#刪除有備註之交易(多為親友交易、價格不正常之交易)
df=df[df['備註'].isnull()]
#將index改成年月日
df.index=pd.to_datetime((df['交易年月日'].str[:-4].astype(int)+1911).astype(str)+df['交易年月日'].str[-4:],errors='coerce')
接下來我們可以來看一下這些資料有哪些欄位:
df.columns
上圖我們比較在意的是:
單價元坪:每坪房價是多少物件型態:住宅大樓, 倉庫, 公寓, 套房…等鄉鎮市區:中山區, 中正區, 信義區, 內湖區…等每年房價的變化接下來我們就來將上述這些數據,變化成一些圖表,方便我們以視覺化的方式來理解資料。
圖表分析
老實說,每個建商給的房價走勢圖好像都不太一樣,我不知道他們是怎麼處理這些數據,有時候走勢都好棒棒的感覺,至少finlab的處理的方式,是完全透明,攤在陽光下讓大家知道,我覺得「公佈程式」就是一種比較公正、透明、公開的方式讓大家檢驗這樣的計算是否公正,假如哪裡可以再改進,也可以跟我說!
每年房價走勢圖
下圖我們就來計算歷年房價的走勢圖,我們希望每一區可以分開畫,方便我們瞭解地區、時間這兩個因子對於房價的差異:
prices={}
fordistrictinset(df['鄉鎮市區']):
cond=(
(df['主要用途']=='住家用')
&(df['鄉鎮市區']==district)
&(df['單價元坪']
甚至還有報導說,某些地段回到了2014、2015高點,這都是拿單一區段來當結論,見樹不見林的方式,背後居心自然是眾人皆知。
思考一下,為何現在都在推新建案?有很多節目,專家們都宣導,買公寓(舊房子)比較可能選到有壁癌、排水系統不好、貸款成數較低…等等,鼓吹大家買新建案。
當然他們很有可能是為了消費者著想,這些都是實話,不過也有可能是因為新房子比起公寓,更能賣出好價錢,進而維持房價不衰退,所以接下來我們就來分析一下:
建物型態
building_type_prices={}
forbuilding_typeinset(df['建物型態2']):
cond=(
(df['主要用途']=='住家用')
&(df['單價元坪']
但是以平均來當作指標,其實也不是這麼精確,我們還是用分佈圖用眼睛來感受一下,才是最好瞭解房價的方法:
分佈圖
plt.rcParams['font.size']=20
fordistrictinset(df['鄉鎮市區']):
dfdistrict=df[df['鄉鎮市區']==district]
dfdistrict['單價元坪'][dfdistrict['單價元坪']<2000000].hist(bins=120,alpha=0.7)
plt.xlim(0,2000000)
plt.legend(set(df['鄉鎮市區']))
上圖中可以明顯感受到,不同地區房價的差異性,例如最右邊的分佈(大安區),大部分單價都比較貴,同時我們也可以看到一些低的詭譎的房價(每坪0萬?!),當然也有很多高的咋舌的單價,甚至一坪200萬都有,只能說富人的世界跟我們一般人還是差距很大呀!
我們取平均的時候無法將這些怪房價給濾除,但好在人眼可以,這就是分佈圖的重要性!
買房使用Python簡單的範例
假如今天我們想在北投買房子,可以將北投的房價單獨拿出來看,並且按照建案型態製作分佈圖
dfdistrict=df[(df['鄉鎮市區']=='北投區')&(df['year']>=2018)&(
(df['建物型態2']=='住宅大樓')|(df['建物型態2']=='公寓')|(df['建物型態2']=='套房')
)]
dfdistrict=dfdistrict[dfdistrict['單價元坪']<2000000]
dfdistrict['單價元坪'].groupby(dfdistrict['建物型態2']).hist(bins=50,alpha=0.7)
plt.legend(set(dfdistrict['建物型態2']))
這樣我們就可以一眼看出來,究竟公寓跟電梯大樓有什麼不一樣,方便我們在選擇的時候,多一些考慮,讓我們在買房談價格時,可以有更全面的概念!
有時候買房不是為了投資,而是生活所需而不得不,在這個時代,我們已經無法買的精妙,炒房產呱呱叫,但至少在面對這種重大抉擇時,能有多一份數據輔佐,盡量不要「虧太多」,買到與價格相符的好房!
假如希望我們未來可以多多發佈類似的文章,可以到粉絲團幫我們按個讚~!
覺得我們的文章有幫助到您,就把它分享給身邊的人吧!
Sharethiscontent
Opensinanewwindow
Opensinanewwindow
Opensinanewwindow
Opensinanewwindow
FinLab-韓承佑
嗨大家好,我是韓承佑,FinLab創辦人,畢業於巴黎薩克雷大學資工博士,目前擔任臺灣量化交易協會學術顧問、台北商業大學創新育成中心創業技術顧問與上市科技公司量化交易顧問。
當初,我喜歡寫程式、無意間因為軟體比賽接觸Fintech,從此開始了財經跟程式的學習之路。
我們成立FinLab量化投資部落格,用自己研發的軟體,對台灣股市做大量快速的實驗。
希望可以在量化投資的路上,當大家的「武器製造商」!
YouMightAlsoLike
好用Package:用ffn分析時間序列
2020-07-23
自動下單(Part1):用Python爬取交易記錄
2020-07-22
用深度學習幫你解析K線圖!
2020-07-22
年報酬30%的泡沫選股策略秘技大公開|實際下單做實驗|FinLab財經實驗室
2021-01-22
Bokeh探索頻道(1)~Python互動式圖表函數庫初體驗
2020-07-20
Bokeh探索頻道(2)~客製化技術圖表升級
2020-07-20
利用Pandas輕鬆選股–Python實作教學
2020-07-22
財報爬蟲超簡單–用Python一次抓綜合損益、資產負債、營利分析
2020-07-22
每週收到新知識
只要有新文章,立刻用Email通知你
加入
Emailisrequired
Emailisnotvalid
Thanksforyoursubscription.
Failedtosubscribe,pleasecontactadmin.
關於網站
FinLab財經實驗室
股票如何選擇?要怎麼學習量化投資?財報、技術指標如何看?FinLab利用股票分析、財經python教學,讓你在在茫茫股海中,找到專屬於自己的投資方法。
Facebook粉絲專頁
FinLabYouTube頻道
Opensinanewtab
近期文章
FRED總體經濟指標輕鬆抓|美國汽車指標|美股回測外掛教學
2022-05-25/
0Comments
融資融券主力板塊|Treemap延伸應用|DashBoard製作教學(4)
2022-05-22/
0Comments
Plotly-多重圖組|融資維持率|DashBoard製作教學(3)
2022-05-18/
0Comments
文章分類
AI看股票(17)
FinLabYouTube(4)
Python新手教學(21)
PYTHON財經(13)
Uncategorized(3)
加密貨幣(18)
基本面分析(20)
大盤漲跌(10)
實價登入(3)
技術面(16)
投資新手(5)
生產力(12)
籌碼面(7)
股票策略(23)
財報狗分析(5)
財經PYTHON教學(47)
選股策略(27)
量子電腦(1)
Python理財入門課程Python理財進階課程Python加密貨幣實戰課程
延伸文章資訊
- 1用程式分析房地產可行嗎?房價分析看這裡 - FinLab
用程式分析房地產可行嗎?房價分析看這裡! Tags: PYTHON, 房地產. 大家都在說房價市場恢復景氣,然而真的是這樣子嗎? 你有沒有覺得,怎麼每個人說的話都不一樣?
- 2房地產市場分析基本理念
唯. 一般房市無法如完全競爭市場有效. 率運作,因此房市有一定數量空屋. 存在。 Page 12. 參、房地產市場供需調整分析. 一、房地產次市場分析.
- 3房產還是最保值!建商五點誠實分析:現在房價雖高但絕不是終點
台灣的房地產經歷上一波的發展,實際上已經到了轉折點。也就是形勢不一樣了,所以目前而言,房產投資雖然還是資產保值的方法,但是一定要審慎評估。
- 4房地產產業資料庫網路聲量與輿情分析- Social Lab社群實驗室
奠基於最全面、最即時的《OpView社群口碑資料庫》,獨家公布房地產產業社群影響力指標與網路聲量分析,提供每季建商影響力排行榜評析及產業輿情分析報告, ...
- 5房地產| 遠見雜誌- 前進的動力
國內房地產概況,涉及都更、危老等政策法令與房產業者發展趨勢。 ... 性信用管制還有空間,房市管控後續可能會瞄準30年期房貸等方向進行,房仲業者分析,對小資家庭而 ...