[Geek]程式化自動抓取Google市集中的App資料   Leave a comment

今天閒聊的時候,發現有人被主管要求要去Google市集中找出排名前50的App,而且該App還要是台灣軟體商做的。

有人正在手工努力的做,做到快睡著的時候來問我大安站哪邊有好吃的時候,就造成了這個範例程式的產生。

身為一個軟體人,就是要有懶惰的精神,聽到這樣的需求,二話不說當然是跟對方說直接用程式分析Html檔案內容,抓出特定的節點出來分析。

關鍵工具:

  1. .NET中萬能的WebClient物件
  2. HAP(Html Agility Pack)

HAP真的是一個好東東阿,她可以讓你用XPATH的方式去挖HTML裡面的節點,非常好用。

附上範例原始檔,請使用VS2012開啟,或是直接參考program.cs檔案。

因為是POC的範例程式,所以對原始碼美感不負責喔 XDDD

下載連結:https://dl.dropboxusercontent.com/u/11180335/GoogleMarketRank.zip

廣告

Posted 2014 年 04 月 03 日 by sfcer0414 in Geek, KB

Tagged with , , ,

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com 標誌

您的留言將使用 WordPress.com 帳號。 登出 /  變更 )

Google photo

您的留言將使用 Google 帳號。 登出 /  變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 /  變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 /  變更 )

連結到 %s

%d 位部落客按了讚: