Archive for the ‘資訊視覺化’ Category
紐約時報Upshot的巨流河,讓你看到美國每一州的居民如何變化
HBL 高中籃球聯賽的冠軍隊伍消長
今天不知道為什麼突然對HBL有點興趣,所以看了一下歷年的隊伍表現。肉眼隨便一看,發現常勝隊伍總是那幾隊,但好像有的隊午後來不見了,也有些隊伍一直前幾名但無法拿冠軍。
所以就來畫一畫排名圖。畫完之後發現,真的很多隊伍因為各種原因,突然就不好了,亦或是突然變好了。我個人很相信團隊中少數幾個人就能夠影響全部表現,或者是教練、或者明星球員、或者學校提供資源的主管等等。
我只有繪製曾經得過冠軍的。繪圖工具是……Excel。
屏東高中。曾經應該是HBL的霸主吧。
南山高中,一直很強。
立志工商,後來就不行了。
再興中學,強過一陣子。
三民,近年來都不錯。
新榮,似乎可以看到一個峰跟一個谷
松山,最近也都不錯
能仁應該是這幾年表現最好最穩定的
女生的我就不畫了……
世界各大洲舉辦夏季奧運會的趨勢圖表
日本今天又再度取得夏季奧運的舉辦權,這是奧運歷史以來,日本第三次申請到奧運主辦權,也是亞洲的第五次。
從1896年在希臘雅典重新舉辦現代奧運之後,奧運到現在已經舉辦過27屆,之後還有2屆的舉辦地點也已經確定,另外有3屆因為人類愛打仗而取消。
在32屆的申辦國當中,我們可以看到這個運動逐漸從「歐洲洲際盃運動會」擴大成「西方世界運動會」然後再逐漸地成為世界運動會。以下是我從維基百科取得並加工後的表格。這個表格完全正確,但不容易「看」到趨勢。如果仔細看,可以發現歐洲舉辦的次數逐漸沒有那麼頻繁,然後其他洲漸漸出現,但大部分的人能第一眼看到的東西就僅此而已。
申辦國 | 所屬洲 | 年 | 備註 |
希臘 | 歐洲 | 1896年 | |
法國 | 歐洲 | 1900年 | |
美國 | 北美洲 | 1904年 | |
英國 | 歐洲 | 1908年 | |
瑞典 | 歐洲 | 1912年 | |
德國 | 歐洲 | 1916年 | 因戰取消 |
比利時 | 歐洲 | 1920年 | |
法國 | 歐洲 | 1924年 | |
荷蘭 | 歐洲 | 1928年 | |
美國 | 北美洲 | 1932年 | |
德國 | 歐洲 | 1936年 | |
日本 | 亞洲 | 1940年 | 因戰取消 |
英國 | 歐洲 | 1944年 | 因戰取消 |
英國 | 歐洲 | 1948年 | |
芬蘭 | 歐洲 | 1952年 | |
澳洲 | 大洋洲 | 1956年 | |
義大利 | 歐洲 | 1960年 | |
日本 | 亞洲 | 1964年 | |
墨西哥 | 北美洲 | 1968年 | |
西德 | 歐洲 | 1972年 | |
加拿大 | 北美洲 | 1976年 | |
蘇聯 | 歐洲 | 1980年 | |
美國 | 北美洲 | 1984年 | |
南韓 | 亞洲 | 1988年 | |
西班牙 | 歐洲 | 1992年 | |
美國 | 北美洲 | 1996年 | |
澳洲 | 大洋洲 | 2000年 | |
希臘 | 歐洲 | 2004年 | |
中国 | 亞洲 | 2008年 | |
英國 | 歐洲 | 2012年 | |
巴西 | 南美洲 | 2016年 | |
日本 | 亞洲 | 2020年 |
我心想如果同樣用表格為底,但以各洲為欄,在出現的年份再打上國家名稱,這樣或許可以看出來歐洲是不是逐漸變少、變得多少。其他國家又怎麼樣逐漸變多,頻率如何。我想讓讀者「看」到幾樣東西:
- 每一個洲大致上的數量分布
- 每一個洲在這一百多年中申辦頻率
- 歐洲與非歐洲之間的數量變化
- 重複的申辦國次數
得到的結果如下:
美國已經辦過四次了,是世界上舉辦次數最多的國家,雖然此後一直有申辦,但我想評審大概也不想要讓美國辦很多次,或許可以解釋北美洲長達24年都沒有比賽的原因。
如何讓你看到「蜜蜂不見關我什麼事」?
我自己有一個小花園,一開始什麼動物都沒有。然後慢慢有了蜜蜂,之後又來了蝴蝶(還有毛毛蟲),鳥。現在還有很多蜻蜓,蜘蛛。這些蜜蜂有些因為負重太多,飛得很慢,還可以看到鼓起來的蜜囊。
美國最近蜜蜂大量減少,突然之間對於很多農家而言造成很大的影響。
美國一個標榜有機的賣場Whole Foods Market為了讓大家知道蜜蜂消失的影響,所以製作了一個活動「Share the Buzz」,這是一個雙關語,Buzz本來就是蜂鳴,後來演變成傳播界使用的「聲浪」,代表民眾的注意或討論。這次Whole Foods Market就希望大家把蜂鳴傳出去。
由於蜜蜂消失這件事情很難被看見,更難說明蜜蜂消失之後的影響,特別是大部分的人在大都市,不會每天看到蜜蜂,也不知道蜜蜂除了提供蜂蜜外,到底有什麼用。所以Whole Foods Market除了製作活動網站外,還在店內拍了兩張照片來比較。上面是一般我們看到的市場,下面那張是一旦沒有蜜蜂幫忙授粉,一般的生鮮市場會少了什麼東西。
大家覺得上面這種方法比較好,還是畫圖表說明蔬果消失的百分比好呢?
Share the Buzz的網站上有很多具體的建議,包含種植可以「招蜂引蝶」的植物,大家也可以嘗試看看。
陳水扁、馬英九總統就職演說文字雲
這兩天我看很多人Facebook上都貼上了自己的文字雲分析。原則上我也不需要跑,因為跑出來中間會是一個巨大的 XD 。
文字雲的背後是字頻分析。美國新聞界最常拿來從事字頻分析的時候就是總統就職演說、總統元旦文告等等。然後可以看出不同總統受到當時政治、經濟環境還有個人、政黨立場的影響,有什麼變化、差距如何。
中華民國在台灣從2000年開始總統全民直選後,總統演說的分析也是挺有趣的。可惜沒有一個演說中間有 XD。以下文字雲都是由文章詞彙分析機產出。
2000年陳水扁就職演說文字雲
2004年陳水扁就職演說文字雲
前面兩張有點類似,但跟後面兩張保證不一樣!
2008年馬英九就職演說文字雲
2012年馬英九就職演說文字雲
當然,中文斷字分析本來就是一個巨大的課題,上面四個的字詞斷字都不是百分之百精準,但起碼可以看出兩個總統之間有很大的不同。
想看到更多用視覺呈現資訊的方法與案例,請加入Lookinfo粉絲團。
誰推誰噓?PTT 《哭笑不得的陸客團隊環島八日游》文的推文態度分析
在PTT的八卦版上有篇文章《哭笑不得的陸客團隊環島八日游》突然很紅。作者是來自天津的tigerWu。身為台灣迷的他(對於很多梗比我還熟),先前來過台灣自助旅行(身為台灣人,覺得這篇也挺有參考價值),這次又參加環島團,然後寫下非常長的旅遊心得。
文章本身沒有太多驚奇之處,因為廉價台灣團就是這樣。比較有趣的是底下回應的立場態度之時間分布。
我自己對於社群的互動一直很有興趣,也偶爾在教這些課,其實去年我教社群媒體的時間比教簡報與圖表加起來還多。這樣的分析我不是第一次做,由於第一眼就看出分布應該很有趣,所以直接來作圖。
因為時間分布很長,所以我只擷取發文後的8小時之內,依照距離發文之遠近來重新計算。只取8小時是因為通常社群上面的資訊大多互動期只有12小時,後面4小時台灣已經夜間了,回應少。由於回應的尖峰發生在發文後大約一小時左右,所以取小時為單位並不好,我改成以20分鐘作為最小單位,然後每小時在視覺上分組一次。在此堆疊與百分比堆疊都可以看到不同意義,我就兩圖一起呈現了。
百分比堆疊圖
因為圖上沒有附上顏色說明,所以補說明如下:
- 綠色:推
- 灰色:->
- 紅色:噓
你可以從 This is Water 學會如何製作更好的簡報
很多簡報的書上都會說,偉大的演講是不能被視覺化的,然後請讀者想像林肯的蓋茲堡演說、馬丁路德金恩的「我有一個夢」等著名演說,一旦是按照現在的方式變成有投影片的簡報,會變成什麼樣的悲劇。
但我還是覺得視覺輔助工具是隨人而用,不見得一定會加分或者扣分。悲劇會發生是因為人的關係,而不是物品或技術。
This is Water
美國作家 David Foster Wallace 在2005年時曾經受邀在凱尼恩學院(Kenyon College)的畢業典禮上演講。這次演講的題目被稱為「This is Water」。兩隻小魚在水中遇到了老魚,老魚問說今天的水況如何,小魚就問另外一隻魚,「什麼是水?」。我覺得這個題目很有趣,而且不知道為什麼充滿了亞洲的智慧。但老實說,下面這段錄音,大部分的台灣人聽了都很痛苦。
這場演講的內容後來變成了一本小書 This Is Water: Some Thoughts, Delivered on a Significant Occasion, about Living a Compassionate Life,原文到處都找得到。
下面這隻影片就不一樣了。製作者從 This is Water 當中擷取了大概一半的程度,等於在原始創作者的腳本上,重新視覺化。
演講與簡報如何視覺化?
這隻9分半的影片,嘗試用另外一種方式呈現This is Water,如果你不知道這原本是大學畢業典禮上的致詞,你會以為是「秘密」這種正面思考的產品。
我想大部分的人不會真的聽完20多分鐘的原版致詞錄音,但上面這隻影片相當推薦。
因為你已經知道這是畢業演講轉譯的影片,建議你看的時候心理想著,如果我簡報的時候希望這裡能夠有視覺輔助,我會用什麼方法呈現?這隻影片這種方法好不好?
這隻影片應該是由Peracciny這間製作公司在沒有事先獲得授權的情況下製作的,但我想現在已經獲得授權了。
請加入Lookinfo的粉絲團,可以持續看到更多關於簡報設計、規劃的最新資訊。
[infographic]30秒了解「黑暗對話工作坊」
黑暗對話工作坊(Dialogue in the Dark)是一個非常獨特的社會企業,雖然訴求的障別是視障,但商業模式非常獨特。
從德國成立以來,很多國家與城市都已經有了當地語言的黑暗對話工作坊,現在台灣也有。
我雖然在台灣引進之前就已經知道黑暗對話工作坊,也認識台灣黑暗對話工作坊的成員,但一直到最近才有機會參加。由於這個經驗相當難得,也不是每個人都有機會參加,所以我就跟大家用Infographic的方式分享黑暗對話工作坊的內容。
由於黑暗對話工作坊不希望在黑暗中發生的事情被公開(很有趣),所以我只能使用網站上官方的文字跟大家分享:「參與者在伸手不見五指的黑暗環境中強迫面對突然失去視覺的情境,重新發掘自已其他感官的功能,並喚醒對個人 力量和個人感知的新觀點。在必需傾聽和對話的環境中,再度訓練生存的基本能力。學習面對挑戰、分享以及關懷,也一起進行解決問題的探討,學習如何經由溝通 與合作邁向成功。」
立法委員表決態度視覺化測試
之前在修Social Network Analysis的時候,就覺得一旦有一天很多政府相關的資料公布出來,老百姓可能有機會知道一些平常看不到的東西。當時修課的時候還有看過一張透過SNA分析出來的美國國會議員立場圖,現在不記得圖在哪了,但可以看到有些人就是比較偏向另外一邊。
今天看到有人將立委的表決記錄公布出來,我測試性地抓了一些表決結果來跑社群網路分析圖,雖然無法代表每個立委的確實態度,但我想很快就會有人將所有表決記錄繪製出來了。我一共抓了19次表決的記錄,除了藍綠壁壘分明的以外,也抓了不少「跑票」或者「自由表決」的記錄。
從投票記錄來看,這一屆親民黨大多選擇與民進黨合作,偶爾與國民黨合作,不知道選親民黨的選民知不知道這一點。
由於投票記錄沒有選擇夠多(我只會手工撈),所以這張圖只能象徵當數據完整後,大致上可以呈現的樣貌。顏色的區分是電腦根據19次表決結果分析出來的,我原本還期待有多種組合,但電腦很果斷地顯示,根據19次表決結果,這些人大概只能分兩種關係。我刻意不用藍、綠來區分,純粹只是要呈現分成兩組的狀況。
當未來資訊可以被計算時,其實我腦袋中還有很多有意義的題目,這是新型態的政治新聞,只希望有一天有機會可以執行。
如何繪製精準的Facebook社群網路圖?
由於台灣非常多人使用Facebook,加上現在許多人幾乎都加了數百甚至幾千個Facebook朋友,我們可以透過視覺化的方式,來看看自己到底處於幾個社群當中,這些社群彼此之間有什麼關係。Facebook上雖然有些社群視覺化的工具,但很多只是畫好玩的,沒有太大意義,接下來我會介紹一種比較專業而且可以持續分析的方法。
在開始之前,請準備:
- 從Netvizz下載自己的Facebook社群描述檔
- 安裝Gephi軟體
- 泡麵一碗
- 生雞蛋一個
由於社群描述檔需要非常長的時間下載,所以下載描述檔的同時,請先下載、安裝Gephi,然後可以先去泡泡麵,加顆生雞蛋,等泡麵吃完了描述檔差不多也應該下載好了。如果你有1000個朋友,大概要10分鐘左右。
Gephi是一個專門將社群關係視覺化的軟體,當然只要類似社群關係的資訊都可以視覺,不過我們今天先處理真正的社群,也就是你的社群。你在Facebook當中可能有1,000個朋友,這1,000個可能個別也有1,000個朋友,所以,你透過這1,000個朋友就可以接觸到1,000×1,000=1,000,000個朋友嗎?先不談社群分析了,你聽過安麗嗎?如果你要從事保險,你可能認為這會為你帶來倍數的關係,但實際上你的1000個朋友很多彼此都互相認識,所以繪製出來的圖會是高度彼此互相串連的圖。
啟動Gephi後,會跳出一個開啟視窗,選擇「Open Graph File」,就可以找到剛剛下載描述檔。
一般而言社群關係有兩種,一種是有方向性的,例如在Twitter當中的Follow,另外一種沒有方向性,在Facebook中的朋友關係就沒有方向性,都是雙向的朋友。這個例子我們選擇沒有方向性 Undirected。
檔案開啟之後,你就可以看到你的社群關係圖了。別緊張,我們接下來會把它變得更有視覺意義。
在左下角有一個區域叫做Layout,其他的你有時間自己可以慢慢試,但我們先選擇 ForceAtlas 2,由於Layout通常是動態一直跑,所以當你覺得已經跑得差不多了請按下Stop。
此時你應該有一個完全沒有著色但社群關係已經非常清楚的Facebook社群關係圖,每一個群組代表一個彼此互相連結,擁有強連結的社群,你可以數看看你在Facebook當中,處於幾個社群。根據統計,一般人平均在Facebook上會在4個社群當中。但由於很多社群之間彼此連結也很密集,所以我們需要進一步著色,才能看到真正社群有幾個。
Gephi預設介面的右上角有Network Overview,這裡其實挺科學的,我當初修Social Network Analytics時幾乎每一個按下去都是一個考題。本文不解釋每一個的功用,但請你按下Modularity,大概瞬間就可以跑完。
之後我們到左上角找到Partition,然後在Nodes下面按下綠色迴轉箭頭 Refresh,再從下拉選單當中找到Modularity Class。我們在前一步已經讓Gephi去算出你的Facebook朋友當中,大概能分成幾個群組,現在就是視覺化的時刻了。按下Apply,你的社群就會被著色。這裡可以看到我的Facebook朋友當中,最大的那個社群就佔了28.56%的人。實際上我在Facebook上,大概也就屬於8個社群左右。
由於剛剛的顏色是系統隨機產生,有時候看不清楚,所以當你點下每一個群組的顏色時,可以自己再挑選,讓接近的社群擁有不同顏色。
我的Facebook社群經過著色之後,看起來就是下面這個樣子。可以看到最下面一大塊裡面有三種顏色,螢光綠、藍色、淺紫色,分別是網路意見領袖(與粉絲)、媒體工作者與公司同事。
到這邊,差不多你已經可以看出來你在哪幾個社群當中,這幾個社群彼此關係怎麼樣。當然,我們畫這個除了讓自己開心之外,也可以看到你跟哪幾個社群當中擁有強連結,社群與社群之間如果訊息要傳播,會怎麼走。以上圖為例,通常一個訊息在淺紫色那群傳遞的時候,我的經驗是螢光色與藍色都可以很快看到,但外面突出的那幾塊未必,反之亦然。你可以判斷一個訊息在社群傳播的時候,你感覺很熱門,但實際上只有影響到哪一個社群。
我們在社群當中還假設,如果大家都在一個「社群」當中,除了跟你有連結(Edge)外,應該跟別人也有連結才對,如果有一個人跟你只有1、2條連結,那麼他跟你通常不是在一個社群當中,這些人不是不重要,但他們跟你比較偏向弱連結的關係,在很多書上都說,這些弱連結通常可以給你「不一樣的資訊」。不過今天我們是要看自己所處的社群,所以可以先把弱連結關係的人過濾掉,這樣圖會比較乾淨。
在Gephi右下角有過濾Filter功能,這裡的過濾條件是拖拉式的,我們找到拓樸 Topology之後,可以把Degree Range往下拉到「Drag Filter here」。然後你就可以看到一個滑動選單,你可以過濾掉弱連結,當然反過來也可以過濾掉強連結。
我將共同連結10個以下的都先過濾掉,這時候社群關係就更清楚了,可以明顯看到大小不一的幾個群組,很多社群之間幾乎沒有人有往來,這時候你其實扮演了不同社群當中弱連結的角色。
在Gephi的左上角還有一個功能叫做Ranking,同樣我們在Nodes下找到Degree(就是六度分離 Six Degree的那個Degree),這裡我們可以讓每一個Facebook上的朋友根據與你之間共同朋友的數量而改變大小,這裡的大小都可以自己亂設,如果你玩出興趣,Spline還可以調整尺寸遞增的原則(我常改用指數遞增)。按下Apply,你就可以看到更多的關係。
這裡可以看到,跟我有最多共同關係的Facebook聯絡人(未必是真正的朋友哈哈),大多落在公司同事與社群意見領袖(及其粉絲)這兩群。如果覺得太擠,請到Layout下將ForceAtlas2裡面勾選Prevent Overlap然後重跑一次。
由於Netvizz抓下來的描述檔也有性別,所以我們可以看看自己是不是怪叔叔或者花痴…這裡可以看到我的大學同學突然浮出來了,就是右下角那群幾乎都是藍色的…
Lookinfo.com 在 Facebook上也有粉絲團,歡迎加入。如果你有畫出自己的圖,也歡迎貼上來。