Lookinfo 看資訊

資訊、圖表、簡報、故事、視覺化

Archive for the ‘圖表實作’ Category

HBL 高中籃球聯賽的冠軍隊伍消長

without comments

今天不知道為什麼突然對HBL有點興趣,所以看了一下歷年的隊伍表現。肉眼隨便一看,發現常勝隊伍總是那幾隊,但好像有的隊午後來不見了,也有些隊伍一直前幾名但無法拿冠軍。

所以就來畫一畫排名圖。畫完之後發現,真的很多隊伍因為各種原因,突然就不好了,亦或是突然變好了。我個人很相信團隊中少數幾個人就能夠影響全部表現,或者是教練、或者明星球員、或者學校提供資源的主管等等。

我只有繪製曾經得過冠軍的。繪圖工具是……Excel。

 

屏東高中。曾經應該是HBL的霸主吧。

HBL 屏東高中歷年成績

 

南山高中,一直很強。

HBL 南山歷年成績

立志工商,後來就不行了。

 

再興中學,強過一陣子。

HBL 再興歷年成績

 

三民,近年來都不錯。

HBL 三民歷年成績

 

新榮,似乎可以看到一個峰跟一個谷

HBL 新榮歷年成績

松山,最近也都不錯

HBL 松山高中歷年成績

 

能仁應該是這幾年表現最好最穩定的

HBL 能仁歷年成績

女生的我就不畫了……

Written by richy

March 20th, 2014 at 7:10 pm

蘋果日報「斷腿開刀奔353公里急診都爆滿南北狂找醫院」新聞時序圖

without comments

蘋果日報2013年9月8日的頭版為「斷腿開刀 奔353公里 急診都爆滿 南北狂找醫院」,如果你單看標題,你會以為台灣有一個可憐的病患,發生車禍大腿骨折之後,全台灣到處找醫院都沒有人要幫他開刀。看完導言:

車禍斷腿,竟然流浪南北三市、奔波353公里、前後花了4天才完成開刀。36歲油漆工葉政勳7月11日在新北市淡水區發生車禍,左大腿骨折,但最初收治他的淡水馬偕醫院沒為他開刀,轉診到台北榮總,也因急診塞爆排不上刀,任他在急診室躺了兩天,最後他花1萬2千元包救護車至高雄義大醫院,14日才完成手術。

我的眼淚都流出來了,醫界真黑心啊!台灣是一個沒有醫德的地方!

但,實際上這新聞跟標題與導言企圖營造的氣氛好像不是那麼一樣啊。馬偕醫院深夜收治病患後,已經安排隔天的手術,假如一早就開刀,實際上等於在12小時內就開刀了,醫院急診收了、也安排了開刀,蘋果日報到底是哪來的勇氣在標題說「急診都爆滿,南北狂找醫院」?第一間醫院不就收了嗎?也安排開刀了啊。結果病患自己要轉院到台北榮總。只有這一家爆滿吧!接下來去了高雄義大醫院,義大醫院也是凌晨收治,下午開刀,急診爆滿了嗎?沒有啊。從收治到開刀之間的時間,看起來也跟淡水馬偕差不多啊。

這種新聞,如果蘋果日報當初自己畫圖表,把關係畫清楚,我覺得蘋果應該也不會放上頭版。所以啊,新聞圖表真的很重要啊!

蘋果日報病患轉院4天開刀新聞的時間序列圖表,說明病患從淡水馬偕轉診到台北榮總與高雄義大醫院的流程

Written by richy

September 10th, 2013 at 9:52 am

世界各大洲舉辦夏季奧運會的趨勢圖表

without comments

日本今天又再度取得夏季奧運的舉辦權,這是奧運歷史以來,日本第三次申請到奧運主辦權,也是亞洲的第五次。

從1896年在希臘雅典重新舉辦現代奧運之後,奧運到現在已經舉辦過27屆,之後還有2屆的舉辦地點也已經確定,另外有3屆因為人類愛打仗而取消。

在32屆的申辦國當中,我們可以看到這個運動逐漸從「歐洲洲際盃運動會」擴大成「西方世界運動會」然後再逐漸地成為世界運動會。以下是我從維基百科取得並加工後的表格。這個表格完全正確,但不容易「看」到趨勢。如果仔細看,可以發現歐洲舉辦的次數逐漸沒有那麼頻繁,然後其他洲漸漸出現,但大部分的人能第一眼看到的東西就僅此而已。

申辦國 所屬洲 備註
 希臘 歐洲 1896年
 法國 歐洲 1900年
 美國 北美洲 1904年
 英國 歐洲 1908年
 瑞典 歐洲 1912年
 德國 歐洲 1916年 因戰取消
 比利時 歐洲 1920年
 法國 歐洲 1924年
 荷蘭 歐洲 1928年
 美國 北美洲 1932年
德國 歐洲 1936年
 日本 亞洲 1940年 因戰取消
 英國 歐洲 1944年 因戰取消
 英國 歐洲 1948年
 芬蘭 歐洲 1952年
 澳洲 大洋洲 1956年
 義大利 歐洲 1960年
 日本 亞洲 1964年
 墨西哥 北美洲 1968年
 西德 歐洲 1972年
 加拿大 北美洲 1976年
 蘇聯 歐洲 1980年
 美國 北美洲 1984年
 南韓 亞洲 1988年
 西班牙 歐洲 1992年
 美國 北美洲 1996年
 澳洲 大洋洲 2000年
 希臘 歐洲 2004年
中国 亞洲 2008年
 英國 歐洲 2012年
 巴西 南美洲 2016年
 日本 亞洲 2020年

我心想如果同樣用表格為底,但以各洲為欄,在出現的年份再打上國家名稱,這樣或許可以看出來歐洲是不是逐漸變少、變得多少。其他國家又怎麼樣逐漸變多,頻率如何。我想讓讀者「看」到幾樣東西:

  • 每一個洲大致上的數量分布
  • 每一個洲在這一百多年中申辦頻率
  • 歐洲與非歐洲之間的數量變化
  • 重複的申辦國次數

得到的結果如下:

歷年奧運會申辦國與洲趨勢圖

美國已經辦過四次了,是世界上舉辦次數最多的國家,雖然此後一直有申辦,但我想評審大概也不想要讓美國辦很多次,或許可以解釋北美洲長達24年都沒有比賽的原因。

 

Written by richy

September 8th, 2013 at 1:05 pm

陳水扁、馬英九總統就職演說文字雲

with 2 comments

這兩天我看很多人Facebook上都貼上了自己的文字雲分析。原則上我也不需要跑,因為跑出來中間會是一個巨大的 XD 。

文字雲的背後是字頻分析。美國新聞界最常拿來從事字頻分析的時候就是總統就職演說、總統元旦文告等等。然後可以看出不同總統受到當時政治、經濟環境還有個人、政黨立場的影響,有什麼變化、差距如何。

中華民國在台灣從2000年開始總統全民直選後,總統演說的分析也是挺有趣的。可惜沒有一個演說中間有 XD。以下文字雲都是由文章詞彙分析機產出。

2000年陳水扁就職演說文字雲

陳水扁2000總統就職演說

2004年陳水扁就職演說文字雲

陳水扁2004總統就職演說

前面兩張有點類似,但跟後面兩張保證不一樣!

2008年馬英九就職演說文字雲

馬英九2008總統就職演說

2012年馬英九就職演說文字雲

馬英九2012總統就職演說

 

當然,中文斷字分析本來就是一個巨大的課題,上面四個的字詞斷字都不是百分之百精準,但起碼可以看出兩個總統之間有很大的不同。

 

想看到更多用視覺呈現資訊的方法與案例,請加入Lookinfo粉絲團

 

Written by richy

June 20th, 2013 at 1:54 pm

如何繪製精準的Facebook社群網路圖?

without comments

由於台灣非常多人使用Facebook,加上現在許多人幾乎都加了數百甚至幾千個Facebook朋友,我們可以透過視覺化的方式,來看看自己到底處於幾個社群當中,這些社群彼此之間有什麼關係。Facebook上雖然有些社群視覺化的工具,但很多只是畫好玩的,沒有太大意義,接下來我會介紹一種比較專業而且可以持續分析的方法。

在開始之前,請準備:

由於社群描述檔需要非常長的時間下載,所以下載描述檔的同時,請先下載、安裝Gephi,然後可以先去泡泡麵,加顆生雞蛋,等泡麵吃完了描述檔差不多也應該下載好了。如果你有1000個朋友,大概要10分鐘左右。

Gephi

 

Gephi是一個專門將社群關係視覺化的軟體,當然只要類似社群關係的資訊都可以視覺,不過我們今天先處理真正的社群,也就是你的社群。你在Facebook當中可能有1,000個朋友,這1,000個可能個別也有1,000個朋友,所以,你透過這1,000個朋友就可以接觸到1,000×1,000=1,000,000個朋友嗎?先不談社群分析了,你聽過安麗嗎?如果你要從事保險,你可能認為這會為你帶來倍數的關係,但實際上你的1000個朋友很多彼此都互相認識,所以繪製出來的圖會是高度彼此互相串連的圖。

啟動Gephi後,會跳出一個開啟視窗,選擇「Open Graph File」,就可以找到剛剛下載描述檔。

在Gephi中開啟檔案

 

一般而言社群關係有兩種,一種是有方向性的,例如在Twitter當中的Follow,另外一種沒有方向性,在Facebook中的朋友關係就沒有方向性,都是雙向的朋友。這個例子我們選擇沒有方向性 Undirected。

我們將關係設定為無方向

 

檔案開啟之後,你就可以看到你的社群關係圖了。別緊張,我們接下來會把它變得更有視覺意義。

Gephi下最原始的Facebook關係圖

 

在左下角有一個區域叫做Layout,其他的你有時間自己可以慢慢試,但我們先選擇 ForceAtlas 2,由於Layout通常是動態一直跑,所以當你覺得已經跑得差不多了請按下Stop。

Gephi下設定呈現方式,選擇Force2

 

此時你應該有一個完全沒有著色但社群關係已經非常清楚的Facebook社群關係圖,每一個群組代表一個彼此互相連結,擁有強連結的社群,你可以數看看你在Facebook當中,處於幾個社群。根據統計,一般人平均在Facebook上會在4個社群當中。但由於很多社群之間彼此連結也很密集,所以我們需要進一步著色,才能看到真正社群有幾個。

Gephi預設介面的右上角有Network Overview,這裡其實挺科學的,我當初修Social Network Analytics時幾乎每一個按下去都是一個考題。本文不解釋每一個的功用,但請你按下Modularity,大概瞬間就可以跑完。

Gephi下

 

之後我們到左上角找到Partition,然後在Nodes下面按下綠色迴轉箭頭 Refresh,再從下拉選單當中找到Modularity Class。我們在前一步已經讓Gephi去算出你的Facebook朋友當中,大概能分成幾個群組,現在就是視覺化的時刻了。按下Apply,你的社群就會被著色。這裡可以看到我的Facebook朋友當中,最大的那個社群就佔了28.56%的人。實際上我在Facebook上,大概也就屬於8個社群左右。

2013-06-08_083536

 

由於剛剛的顏色是系統隨機產生,有時候看不清楚,所以當你點下每一個群組的顏色時,可以自己再挑選,讓接近的社群擁有不同顏色。

2013-06-08_083655

 

我的Facebook社群經過著色之後,看起來就是下面這個樣子。可以看到最下面一大塊裡面有三種顏色,螢光綠、藍色、淺紫色,分別是網路意見領袖(與粉絲)、媒體工作者與公司同事。

一個透過Gephi著色過的Facebook社群網路分析圖

 

到這邊,差不多你已經可以看出來你在哪幾個社群當中,這幾個社群彼此關係怎麼樣。當然,我們畫這個除了讓自己開心之外,也可以看到你跟哪幾個社群當中擁有強連結,社群與社群之間如果訊息要傳播,會怎麼走。以上圖為例,通常一個訊息在淺紫色那群傳遞的時候,我的經驗是螢光色與藍色都可以很快看到,但外面突出的那幾塊未必,反之亦然。你可以判斷一個訊息在社群傳播的時候,你感覺很熱門,但實際上只有影響到哪一個社群。

我們在社群當中還假設,如果大家都在一個「社群」當中,除了跟你有連結(Edge)外,應該跟別人也有連結才對,如果有一個人跟你只有1、2條連結,那麼他跟你通常不是在一個社群當中,這些人不是不重要,但他們跟你比較偏向弱連結的關係,在很多書上都說,這些弱連結通常可以給你「不一樣的資訊」。不過今天我們是要看自己所處的社群,所以可以先把弱連結關係的人過濾掉,這樣圖會比較乾淨。

在Gephi右下角有過濾Filter功能,這裡的過濾條件是拖拉式的,我們找到拓樸 Topology之後,可以把Degree Range往下拉到「Drag Filter here」。然後你就可以看到一個滑動選單,你可以過濾掉弱連結,當然反過來也可以過濾掉強連結。

2013-06-08_084128

 

我將共同連結10個以下的都先過濾掉,這時候社群關係就更清楚了,可以明顯看到大小不一的幾個群組,很多社群之間幾乎沒有人有往來,這時候你其實扮演了不同社群當中弱連結的角色。

一個透過Gephi著色過的Facebook社群網路分析圖,過濾掉沒有關係較少的人

 

在Gephi的左上角還有一個功能叫做Ranking,同樣我們在Nodes下找到Degree(就是六度分離 Six Degree的那個Degree),這裡我們可以讓每一個Facebook上的朋友根據與你之間共同朋友的數量而改變大小,這裡的大小都可以自己亂設,如果你玩出興趣,Spline還可以調整尺寸遞增的原則(我常改用指數遞增)。按下Apply,你就可以看到更多的關係。

Gephi下設定關係人的大小

 

這裡可以看到,跟我有最多共同關係的Facebook聯絡人(未必是真正的朋友哈哈),大多落在公司同事與社群意見領袖(及其粉絲)這兩群。如果覺得太擠,請到Layout下將ForceAtlas2裡面勾選Prevent Overlap然後重跑一次。

一個透過Gephi著色、篩選與調整後的Facebook社群圖

 

由於Netvizz抓下來的描述檔也有性別,所以我們可以看看自己是不是怪叔叔或者花痴…這裡可以看到我的大學同學突然浮出來了,就是右下角那群幾乎都是藍色的…

gephi的facebook性別分析圖

 

Lookinfo.com 在 Facebook上也有粉絲團,歡迎加入。如果你有畫出自己的圖,也歡迎貼上來。

Written by richy

June 8th, 2013 at 10:26 am