Archive for the ‘圖表實作’ Category
HBL 高中籃球聯賽的冠軍隊伍消長
今天不知道為什麼突然對HBL有點興趣,所以看了一下歷年的隊伍表現。肉眼隨便一看,發現常勝隊伍總是那幾隊,但好像有的隊午後來不見了,也有些隊伍一直前幾名但無法拿冠軍。
所以就來畫一畫排名圖。畫完之後發現,真的很多隊伍因為各種原因,突然就不好了,亦或是突然變好了。我個人很相信團隊中少數幾個人就能夠影響全部表現,或者是教練、或者明星球員、或者學校提供資源的主管等等。
我只有繪製曾經得過冠軍的。繪圖工具是……Excel。
屏東高中。曾經應該是HBL的霸主吧。
南山高中,一直很強。
立志工商,後來就不行了。
再興中學,強過一陣子。
三民,近年來都不錯。
新榮,似乎可以看到一個峰跟一個谷
松山,最近也都不錯
能仁應該是這幾年表現最好最穩定的
女生的我就不畫了……
蘋果日報「斷腿開刀奔353公里急診都爆滿南北狂找醫院」新聞時序圖
蘋果日報2013年9月8日的頭版為「斷腿開刀 奔353公里 急診都爆滿 南北狂找醫院」,如果你單看標題,你會以為台灣有一個可憐的病患,發生車禍大腿骨折之後,全台灣到處找醫院都沒有人要幫他開刀。看完導言:
車禍斷腿,竟然流浪南北三市、奔波353公里、前後花了4天才完成開刀。36歲油漆工葉政勳7月11日在新北市淡水區發生車禍,左大腿骨折,但最初收治他的淡水馬偕醫院沒為他開刀,轉診到台北榮總,也因急診塞爆排不上刀,任他在急診室躺了兩天,最後他花1萬2千元包救護車至高雄義大醫院,14日才完成手術。
我的眼淚都流出來了,醫界真黑心啊!台灣是一個沒有醫德的地方!
但,實際上這新聞跟標題與導言企圖營造的氣氛好像不是那麼一樣啊。馬偕醫院深夜收治病患後,已經安排隔天的手術,假如一早就開刀,實際上等於在12小時內就開刀了,醫院急診收了、也安排了開刀,蘋果日報到底是哪來的勇氣在標題說「急診都爆滿,南北狂找醫院」?第一間醫院不就收了嗎?也安排開刀了啊。結果病患自己要轉院到台北榮總。只有這一家爆滿吧!接下來去了高雄義大醫院,義大醫院也是凌晨收治,下午開刀,急診爆滿了嗎?沒有啊。從收治到開刀之間的時間,看起來也跟淡水馬偕差不多啊。
這種新聞,如果蘋果日報當初自己畫圖表,把關係畫清楚,我覺得蘋果應該也不會放上頭版。所以啊,新聞圖表真的很重要啊!
世界各大洲舉辦夏季奧運會的趨勢圖表
日本今天又再度取得夏季奧運的舉辦權,這是奧運歷史以來,日本第三次申請到奧運主辦權,也是亞洲的第五次。
從1896年在希臘雅典重新舉辦現代奧運之後,奧運到現在已經舉辦過27屆,之後還有2屆的舉辦地點也已經確定,另外有3屆因為人類愛打仗而取消。
在32屆的申辦國當中,我們可以看到這個運動逐漸從「歐洲洲際盃運動會」擴大成「西方世界運動會」然後再逐漸地成為世界運動會。以下是我從維基百科取得並加工後的表格。這個表格完全正確,但不容易「看」到趨勢。如果仔細看,可以發現歐洲舉辦的次數逐漸沒有那麼頻繁,然後其他洲漸漸出現,但大部分的人能第一眼看到的東西就僅此而已。
申辦國 | 所屬洲 | 年 | 備註 |
希臘 | 歐洲 | 1896年 | |
法國 | 歐洲 | 1900年 | |
美國 | 北美洲 | 1904年 | |
英國 | 歐洲 | 1908年 | |
瑞典 | 歐洲 | 1912年 | |
德國 | 歐洲 | 1916年 | 因戰取消 |
比利時 | 歐洲 | 1920年 | |
法國 | 歐洲 | 1924年 | |
荷蘭 | 歐洲 | 1928年 | |
美國 | 北美洲 | 1932年 | |
德國 | 歐洲 | 1936年 | |
日本 | 亞洲 | 1940年 | 因戰取消 |
英國 | 歐洲 | 1944年 | 因戰取消 |
英國 | 歐洲 | 1948年 | |
芬蘭 | 歐洲 | 1952年 | |
澳洲 | 大洋洲 | 1956年 | |
義大利 | 歐洲 | 1960年 | |
日本 | 亞洲 | 1964年 | |
墨西哥 | 北美洲 | 1968年 | |
西德 | 歐洲 | 1972年 | |
加拿大 | 北美洲 | 1976年 | |
蘇聯 | 歐洲 | 1980年 | |
美國 | 北美洲 | 1984年 | |
南韓 | 亞洲 | 1988年 | |
西班牙 | 歐洲 | 1992年 | |
美國 | 北美洲 | 1996年 | |
澳洲 | 大洋洲 | 2000年 | |
希臘 | 歐洲 | 2004年 | |
中国 | 亞洲 | 2008年 | |
英國 | 歐洲 | 2012年 | |
巴西 | 南美洲 | 2016年 | |
日本 | 亞洲 | 2020年 |
我心想如果同樣用表格為底,但以各洲為欄,在出現的年份再打上國家名稱,這樣或許可以看出來歐洲是不是逐漸變少、變得多少。其他國家又怎麼樣逐漸變多,頻率如何。我想讓讀者「看」到幾樣東西:
- 每一個洲大致上的數量分布
- 每一個洲在這一百多年中申辦頻率
- 歐洲與非歐洲之間的數量變化
- 重複的申辦國次數
得到的結果如下:
美國已經辦過四次了,是世界上舉辦次數最多的國家,雖然此後一直有申辦,但我想評審大概也不想要讓美國辦很多次,或許可以解釋北美洲長達24年都沒有比賽的原因。
陳水扁、馬英九總統就職演說文字雲
這兩天我看很多人Facebook上都貼上了自己的文字雲分析。原則上我也不需要跑,因為跑出來中間會是一個巨大的 XD 。
文字雲的背後是字頻分析。美國新聞界最常拿來從事字頻分析的時候就是總統就職演說、總統元旦文告等等。然後可以看出不同總統受到當時政治、經濟環境還有個人、政黨立場的影響,有什麼變化、差距如何。
中華民國在台灣從2000年開始總統全民直選後,總統演說的分析也是挺有趣的。可惜沒有一個演說中間有 XD。以下文字雲都是由文章詞彙分析機產出。
2000年陳水扁就職演說文字雲
2004年陳水扁就職演說文字雲
前面兩張有點類似,但跟後面兩張保證不一樣!
2008年馬英九就職演說文字雲
2012年馬英九就職演說文字雲
當然,中文斷字分析本來就是一個巨大的課題,上面四個的字詞斷字都不是百分之百精準,但起碼可以看出兩個總統之間有很大的不同。
想看到更多用視覺呈現資訊的方法與案例,請加入Lookinfo粉絲團。
如何繪製精準的Facebook社群網路圖?
由於台灣非常多人使用Facebook,加上現在許多人幾乎都加了數百甚至幾千個Facebook朋友,我們可以透過視覺化的方式,來看看自己到底處於幾個社群當中,這些社群彼此之間有什麼關係。Facebook上雖然有些社群視覺化的工具,但很多只是畫好玩的,沒有太大意義,接下來我會介紹一種比較專業而且可以持續分析的方法。
在開始之前,請準備:
- 從Netvizz下載自己的Facebook社群描述檔
- 安裝Gephi軟體
- 泡麵一碗
- 生雞蛋一個
由於社群描述檔需要非常長的時間下載,所以下載描述檔的同時,請先下載、安裝Gephi,然後可以先去泡泡麵,加顆生雞蛋,等泡麵吃完了描述檔差不多也應該下載好了。如果你有1000個朋友,大概要10分鐘左右。
Gephi是一個專門將社群關係視覺化的軟體,當然只要類似社群關係的資訊都可以視覺,不過我們今天先處理真正的社群,也就是你的社群。你在Facebook當中可能有1,000個朋友,這1,000個可能個別也有1,000個朋友,所以,你透過這1,000個朋友就可以接觸到1,000×1,000=1,000,000個朋友嗎?先不談社群分析了,你聽過安麗嗎?如果你要從事保險,你可能認為這會為你帶來倍數的關係,但實際上你的1000個朋友很多彼此都互相認識,所以繪製出來的圖會是高度彼此互相串連的圖。
啟動Gephi後,會跳出一個開啟視窗,選擇「Open Graph File」,就可以找到剛剛下載描述檔。
一般而言社群關係有兩種,一種是有方向性的,例如在Twitter當中的Follow,另外一種沒有方向性,在Facebook中的朋友關係就沒有方向性,都是雙向的朋友。這個例子我們選擇沒有方向性 Undirected。
檔案開啟之後,你就可以看到你的社群關係圖了。別緊張,我們接下來會把它變得更有視覺意義。
在左下角有一個區域叫做Layout,其他的你有時間自己可以慢慢試,但我們先選擇 ForceAtlas 2,由於Layout通常是動態一直跑,所以當你覺得已經跑得差不多了請按下Stop。
此時你應該有一個完全沒有著色但社群關係已經非常清楚的Facebook社群關係圖,每一個群組代表一個彼此互相連結,擁有強連結的社群,你可以數看看你在Facebook當中,處於幾個社群。根據統計,一般人平均在Facebook上會在4個社群當中。但由於很多社群之間彼此連結也很密集,所以我們需要進一步著色,才能看到真正社群有幾個。
Gephi預設介面的右上角有Network Overview,這裡其實挺科學的,我當初修Social Network Analytics時幾乎每一個按下去都是一個考題。本文不解釋每一個的功用,但請你按下Modularity,大概瞬間就可以跑完。
之後我們到左上角找到Partition,然後在Nodes下面按下綠色迴轉箭頭 Refresh,再從下拉選單當中找到Modularity Class。我們在前一步已經讓Gephi去算出你的Facebook朋友當中,大概能分成幾個群組,現在就是視覺化的時刻了。按下Apply,你的社群就會被著色。這裡可以看到我的Facebook朋友當中,最大的那個社群就佔了28.56%的人。實際上我在Facebook上,大概也就屬於8個社群左右。
由於剛剛的顏色是系統隨機產生,有時候看不清楚,所以當你點下每一個群組的顏色時,可以自己再挑選,讓接近的社群擁有不同顏色。
我的Facebook社群經過著色之後,看起來就是下面這個樣子。可以看到最下面一大塊裡面有三種顏色,螢光綠、藍色、淺紫色,分別是網路意見領袖(與粉絲)、媒體工作者與公司同事。
到這邊,差不多你已經可以看出來你在哪幾個社群當中,這幾個社群彼此關係怎麼樣。當然,我們畫這個除了讓自己開心之外,也可以看到你跟哪幾個社群當中擁有強連結,社群與社群之間如果訊息要傳播,會怎麼走。以上圖為例,通常一個訊息在淺紫色那群傳遞的時候,我的經驗是螢光色與藍色都可以很快看到,但外面突出的那幾塊未必,反之亦然。你可以判斷一個訊息在社群傳播的時候,你感覺很熱門,但實際上只有影響到哪一個社群。
我們在社群當中還假設,如果大家都在一個「社群」當中,除了跟你有連結(Edge)外,應該跟別人也有連結才對,如果有一個人跟你只有1、2條連結,那麼他跟你通常不是在一個社群當中,這些人不是不重要,但他們跟你比較偏向弱連結的關係,在很多書上都說,這些弱連結通常可以給你「不一樣的資訊」。不過今天我們是要看自己所處的社群,所以可以先把弱連結關係的人過濾掉,這樣圖會比較乾淨。
在Gephi右下角有過濾Filter功能,這裡的過濾條件是拖拉式的,我們找到拓樸 Topology之後,可以把Degree Range往下拉到「Drag Filter here」。然後你就可以看到一個滑動選單,你可以過濾掉弱連結,當然反過來也可以過濾掉強連結。
我將共同連結10個以下的都先過濾掉,這時候社群關係就更清楚了,可以明顯看到大小不一的幾個群組,很多社群之間幾乎沒有人有往來,這時候你其實扮演了不同社群當中弱連結的角色。
在Gephi的左上角還有一個功能叫做Ranking,同樣我們在Nodes下找到Degree(就是六度分離 Six Degree的那個Degree),這裡我們可以讓每一個Facebook上的朋友根據與你之間共同朋友的數量而改變大小,這裡的大小都可以自己亂設,如果你玩出興趣,Spline還可以調整尺寸遞增的原則(我常改用指數遞增)。按下Apply,你就可以看到更多的關係。
這裡可以看到,跟我有最多共同關係的Facebook聯絡人(未必是真正的朋友哈哈),大多落在公司同事與社群意見領袖(及其粉絲)這兩群。如果覺得太擠,請到Layout下將ForceAtlas2裡面勾選Prevent Overlap然後重跑一次。
由於Netvizz抓下來的描述檔也有性別,所以我們可以看看自己是不是怪叔叔或者花痴…這裡可以看到我的大學同學突然浮出來了,就是右下角那群幾乎都是藍色的…
Lookinfo.com 在 Facebook上也有粉絲團,歡迎加入。如果你有畫出自己的圖,也歡迎貼上來。