Archive for the ‘科學圖表’ Category
如何讓你看到「蜜蜂不見關我什麼事」?
我自己有一個小花園,一開始什麼動物都沒有。然後慢慢有了蜜蜂,之後又來了蝴蝶(還有毛毛蟲),鳥。現在還有很多蜻蜓,蜘蛛。這些蜜蜂有些因為負重太多,飛得很慢,還可以看到鼓起來的蜜囊。
美國最近蜜蜂大量減少,突然之間對於很多農家而言造成很大的影響。
美國一個標榜有機的賣場Whole Foods Market為了讓大家知道蜜蜂消失的影響,所以製作了一個活動「Share the Buzz」,這是一個雙關語,Buzz本來就是蜂鳴,後來演變成傳播界使用的「聲浪」,代表民眾的注意或討論。這次Whole Foods Market就希望大家把蜂鳴傳出去。
由於蜜蜂消失這件事情很難被看見,更難說明蜜蜂消失之後的影響,特別是大部分的人在大都市,不會每天看到蜜蜂,也不知道蜜蜂除了提供蜂蜜外,到底有什麼用。所以Whole Foods Market除了製作活動網站外,還在店內拍了兩張照片來比較。上面是一般我們看到的市場,下面那張是一旦沒有蜜蜂幫忙授粉,一般的生鮮市場會少了什麼東西。
大家覺得上面這種方法比較好,還是畫圖表說明蔬果消失的百分比好呢?
Share the Buzz的網站上有很多具體的建議,包含種植可以「招蜂引蝶」的植物,大家也可以嘗試看看。
如何繪製精準的Facebook社群網路圖?
由於台灣非常多人使用Facebook,加上現在許多人幾乎都加了數百甚至幾千個Facebook朋友,我們可以透過視覺化的方式,來看看自己到底處於幾個社群當中,這些社群彼此之間有什麼關係。Facebook上雖然有些社群視覺化的工具,但很多只是畫好玩的,沒有太大意義,接下來我會介紹一種比較專業而且可以持續分析的方法。
在開始之前,請準備:
- 從Netvizz下載自己的Facebook社群描述檔
- 安裝Gephi軟體
- 泡麵一碗
- 生雞蛋一個
由於社群描述檔需要非常長的時間下載,所以下載描述檔的同時,請先下載、安裝Gephi,然後可以先去泡泡麵,加顆生雞蛋,等泡麵吃完了描述檔差不多也應該下載好了。如果你有1000個朋友,大概要10分鐘左右。
Gephi是一個專門將社群關係視覺化的軟體,當然只要類似社群關係的資訊都可以視覺,不過我們今天先處理真正的社群,也就是你的社群。你在Facebook當中可能有1,000個朋友,這1,000個可能個別也有1,000個朋友,所以,你透過這1,000個朋友就可以接觸到1,000×1,000=1,000,000個朋友嗎?先不談社群分析了,你聽過安麗嗎?如果你要從事保險,你可能認為這會為你帶來倍數的關係,但實際上你的1000個朋友很多彼此都互相認識,所以繪製出來的圖會是高度彼此互相串連的圖。
啟動Gephi後,會跳出一個開啟視窗,選擇「Open Graph File」,就可以找到剛剛下載描述檔。
一般而言社群關係有兩種,一種是有方向性的,例如在Twitter當中的Follow,另外一種沒有方向性,在Facebook中的朋友關係就沒有方向性,都是雙向的朋友。這個例子我們選擇沒有方向性 Undirected。
檔案開啟之後,你就可以看到你的社群關係圖了。別緊張,我們接下來會把它變得更有視覺意義。
在左下角有一個區域叫做Layout,其他的你有時間自己可以慢慢試,但我們先選擇 ForceAtlas 2,由於Layout通常是動態一直跑,所以當你覺得已經跑得差不多了請按下Stop。
此時你應該有一個完全沒有著色但社群關係已經非常清楚的Facebook社群關係圖,每一個群組代表一個彼此互相連結,擁有強連結的社群,你可以數看看你在Facebook當中,處於幾個社群。根據統計,一般人平均在Facebook上會在4個社群當中。但由於很多社群之間彼此連結也很密集,所以我們需要進一步著色,才能看到真正社群有幾個。
Gephi預設介面的右上角有Network Overview,這裡其實挺科學的,我當初修Social Network Analytics時幾乎每一個按下去都是一個考題。本文不解釋每一個的功用,但請你按下Modularity,大概瞬間就可以跑完。
之後我們到左上角找到Partition,然後在Nodes下面按下綠色迴轉箭頭 Refresh,再從下拉選單當中找到Modularity Class。我們在前一步已經讓Gephi去算出你的Facebook朋友當中,大概能分成幾個群組,現在就是視覺化的時刻了。按下Apply,你的社群就會被著色。這裡可以看到我的Facebook朋友當中,最大的那個社群就佔了28.56%的人。實際上我在Facebook上,大概也就屬於8個社群左右。
由於剛剛的顏色是系統隨機產生,有時候看不清楚,所以當你點下每一個群組的顏色時,可以自己再挑選,讓接近的社群擁有不同顏色。
我的Facebook社群經過著色之後,看起來就是下面這個樣子。可以看到最下面一大塊裡面有三種顏色,螢光綠、藍色、淺紫色,分別是網路意見領袖(與粉絲)、媒體工作者與公司同事。
到這邊,差不多你已經可以看出來你在哪幾個社群當中,這幾個社群彼此關係怎麼樣。當然,我們畫這個除了讓自己開心之外,也可以看到你跟哪幾個社群當中擁有強連結,社群與社群之間如果訊息要傳播,會怎麼走。以上圖為例,通常一個訊息在淺紫色那群傳遞的時候,我的經驗是螢光色與藍色都可以很快看到,但外面突出的那幾塊未必,反之亦然。你可以判斷一個訊息在社群傳播的時候,你感覺很熱門,但實際上只有影響到哪一個社群。
我們在社群當中還假設,如果大家都在一個「社群」當中,除了跟你有連結(Edge)外,應該跟別人也有連結才對,如果有一個人跟你只有1、2條連結,那麼他跟你通常不是在一個社群當中,這些人不是不重要,但他們跟你比較偏向弱連結的關係,在很多書上都說,這些弱連結通常可以給你「不一樣的資訊」。不過今天我們是要看自己所處的社群,所以可以先把弱連結關係的人過濾掉,這樣圖會比較乾淨。
在Gephi右下角有過濾Filter功能,這裡的過濾條件是拖拉式的,我們找到拓樸 Topology之後,可以把Degree Range往下拉到「Drag Filter here」。然後你就可以看到一個滑動選單,你可以過濾掉弱連結,當然反過來也可以過濾掉強連結。
我將共同連結10個以下的都先過濾掉,這時候社群關係就更清楚了,可以明顯看到大小不一的幾個群組,很多社群之間幾乎沒有人有往來,這時候你其實扮演了不同社群當中弱連結的角色。
在Gephi的左上角還有一個功能叫做Ranking,同樣我們在Nodes下找到Degree(就是六度分離 Six Degree的那個Degree),這裡我們可以讓每一個Facebook上的朋友根據與你之間共同朋友的數量而改變大小,這裡的大小都可以自己亂設,如果你玩出興趣,Spline還可以調整尺寸遞增的原則(我常改用指數遞增)。按下Apply,你就可以看到更多的關係。
這裡可以看到,跟我有最多共同關係的Facebook聯絡人(未必是真正的朋友哈哈),大多落在公司同事與社群意見領袖(及其粉絲)這兩群。如果覺得太擠,請到Layout下將ForceAtlas2裡面勾選Prevent Overlap然後重跑一次。
由於Netvizz抓下來的描述檔也有性別,所以我們可以看看自己是不是怪叔叔或者花痴…這裡可以看到我的大學同學突然浮出來了,就是右下角那群幾乎都是藍色的…
Lookinfo.com 在 Facebook上也有粉絲團,歡迎加入。如果你有畫出自己的圖,也歡迎貼上來。
動物壽命與移動速度的散佈圖
動物移動速度越快就能活得越久、吃得越多、越不容易攻擊嗎?
德國的Golden Section Graphics公司的兩位繪圖師Julia Kontor與Katharina Stipp就將動物的最長壽命(人類放在120歲……)與最高移動速度(人類放在時速40公里……)繪製成散佈圖。德文作品名稱是Lebensgeschwindigkeit,英文叫做Speed of Life。曾經刊登在德國IN GRAPHICS Magazin雜誌(就是Golden Section Graphics自己出版的)。
你看到了什麼趨勢嗎?這幾個區塊代表什麼意義呢?
Hans Rosling教你用巨量的資訊與圖表說很多故事
上週青平台基金會邀請我去為資訊新聞學的營隊上課,除了講資料到資訊、資訊視覺化之外,也另外請我談談最近很流行的「Infographics」。
Infographics或者Information Graphics,其實泛指所有將資訊繪製成圖表的作品,但後來隨著內容行銷興起,突然美國人將一種垂直形式、塞滿很多圖表的作品專稱為Infographic,很多人就以為只有那種東西才是Infographic但其他的東西叫做圖表。事實上並不是那樣的。
我個人覺得那種形式的Infographics對於內容行銷很重要,但對於資訊新聞學而言,不是一個需要討論的題目,甚至最好少看,因為大部分這種充滿行銷目的的Infographics真正的目的是希望使用者看文字、向下拉、看到品牌,經常湊不成故事而且裡面的圖表有半數都有形式上的錯誤。我一直很想找機會針對行銷人談一下內容行銷下的Infographic,但一直抽不出時間。
用大量資料說好聽的故事
由於課程框架是資訊新聞學,最終目的是希望學員有一天能夠從資料當中產出資訊並視覺化,然後可以敘述故事,所以我想說應該給他們看一個具有大量資料,但最後可以漂亮說故事的例子。想著想著,我就想到Hans Rosling了。
Hans Rosling原本是個醫生,後來一腳踏入了國際衛生研究的領域,這不免讓人聯想到John Snow。Hans Rosling有共同開發一套軟體 Gapminder Trendalyzer,後來賣給Google,大家都可以在Google Drive當中使用這個Motion Chart這個功能。Trendalyzer / Motion Chart最大的特點,就是可以將時間這個軸變成動態的,所以可以同時處理3個維度以上的資訊,通常Hans Rosling說故事的時候,都會同時呈現5個或更多的維度。
如果打開 Gapminder 的網站,可以看到非常多可以選擇的資料,基本上一天是玩不完的。
下面這張圖是台灣、香港與中國大陸在過去100多年間人均收入與平均壽命的趨勢圖,其實日本殖民時代後期台灣與中國大陸雖然已經拉很開,但國民黨到台灣之後的40年間,差距反而更大,台灣後來幾乎跟隨香港的腳步,趨勢線幾乎重疊。
有興趣的也可以看看德國與法國在1960年代後,經濟發展與平均每人的核發電量軌跡圖。
Hans Rosling教授應用這麼多不同維度的資訊,可以說許多不同的故事。2006年他在TED的演講為他帶來世界級的普遍知名度,這是一個故事,當然後來「繁衍」出許多不同的故事,單單在TED當中就有9個故事。
我自己覺得Washing Machine這個故事也相當不錯。他後來越來越常使用他自己所說的「類比式視覺化工具」。石頭、箱子都可以拿來用。
後來Hans Rosling又有新的敘事手法,大概可以稱為Holistic Infographic,這目前大概只有透過後製可以達成。
雖然不可能大家都來上我的圖表課,但這些影片都值得看一看,然後參考看看,當你取得巨量、大量、海量或甚至只有少量的資料時,你要如何把故事說好,而不是只想畫一大堆圖表。