結合大數據,透過資料蒐集、挖掘、清理與分析,呈現新聞事件表象背後的原因,並探討網路社群發酵事件的脈絡與發展。

數據分析

分配完未決定選民,也不一定能猜對台北市長選舉結果 (下)


假如我們知道有部分的人永遠沒辦法被電話民調給訪問到,那我們有辦法推估這群人的比例,甚至推測他們比較支持泛藍還泛綠嗎?當然,這方面的推估與計算,一直是各家民調公司老闆的拿手絕活與多年經驗。我在這邊只提出一個最簡單的數學估計方法與驗證。

  • 2018-06-13
  • 王宏恩

放言數據分析》假新聞罰三天?立委邱志偉提案爆熱⋯⋯網問:誰來定義真假?


進一步分析「假新聞」的關聯議題,可發現前五大關聯詞為「提案」「邱志偉」「假消息」「散播」與「民進黨立委」,顯示這波話題熱度相當聚焦於民進黨立委邱志偉提案,「假新聞罰三天」已成網路最新流行語。

  • 2018-06-13
  • 放言數據中心 葉小慧

先有目標還是先有資料?談啟動AI化專案會碰到的問題


盤點資料這個動作,不僅僅是釐清資料有無而已,同時也是在檢視企業本身於資料科學/人工智慧時代來臨時的體質優劣,建議企業主們無論如何都應該嘗試著盤點公司內部所有的資料,從電子化到紙本,從交易記錄到活動企劃文件,從擁有的到想要的,這將會是企業未來發展的重要戰略資源。

  • 2018-06-12
  • 許懷中

分配完未決定選民,也不一定能猜對台北市長選舉結果(上)


無論在學術界或是在民意調查實務界,各家高手都有各種分配這些未決定選民的方式,比較符合學說的做法是觀察這些選民上次投給誰、政黨認同比較支持誰、或是在特定重大政策上跟哪一位候選人比較接近,然後透過回歸模型或決策樹模型來分派這些未決定選民。但在上面這三個例子中,假如只看手上的資料,那這些未決定選民透過甚麼統計模型去分派,都不可能分派到百分之百給民進黨的。但這確實在選舉日發生了。

  • 2018-06-06
  • 王宏恩