Lookinfo 看資訊

資訊、圖表、簡報、故事、視覺化

Archive for the ‘科學圖表’ Category

如何讓你看到「蜜蜂不見關我什麼事」?

without comments

我自己有一個小花園,一開始什麼動物都沒有。然後慢慢有了蜜蜂,之後又來了蝴蝶(還有毛毛蟲),鳥。現在還有很多蜻蜓,蜘蛛。這些蜜蜂有些因為負重太多,飛得很慢,還可以看到鼓起來的蜜囊。

美國最近蜜蜂大量減少,突然之間對於很多農家而言造成很大的影響。

美國一個標榜有機的賣場Whole Foods Market為了讓大家知道蜜蜂消失的影響,所以製作了一個活動「Share the Buzz」,這是一個雙關語,Buzz本來就是蜂鳴,後來演變成傳播界使用的「聲浪」,代表民眾的注意或討論。這次Whole Foods Market就希望大家把蜂鳴傳出去。

由於蜜蜂消失這件事情很難被看見,更難說明蜜蜂消失之後的影響,特別是大部分的人在大都市,不會每天看到蜜蜂,也不知道蜜蜂除了提供蜂蜜外,到底有什麼用。所以Whole Foods Market除了製作活動網站外,還在店內拍了兩張照片來比較。上面是一般我們看到的市場,下面那張是一旦沒有蜜蜂幫忙授粉,一般的生鮮市場會少了什麼東西。

WHOLE FOODS MARKET展示蜜蜂消失後的影響

大家覺得上面這種方法比較好,還是畫圖表說明蔬果消失的百分比好呢?

Share the Buzz的網站上有很多具體的建議,包含種植可以「招蜂引蝶」的植物,大家也可以嘗試看看。

 

Written by richy

June 24th, 2013 at 9:30 am

如何繪製精準的Facebook社群網路圖?

without comments

由於台灣非常多人使用Facebook,加上現在許多人幾乎都加了數百甚至幾千個Facebook朋友,我們可以透過視覺化的方式,來看看自己到底處於幾個社群當中,這些社群彼此之間有什麼關係。Facebook上雖然有些社群視覺化的工具,但很多只是畫好玩的,沒有太大意義,接下來我會介紹一種比較專業而且可以持續分析的方法。

在開始之前,請準備:

由於社群描述檔需要非常長的時間下載,所以下載描述檔的同時,請先下載、安裝Gephi,然後可以先去泡泡麵,加顆生雞蛋,等泡麵吃完了描述檔差不多也應該下載好了。如果你有1000個朋友,大概要10分鐘左右。

Gephi

 

Gephi是一個專門將社群關係視覺化的軟體,當然只要類似社群關係的資訊都可以視覺,不過我們今天先處理真正的社群,也就是你的社群。你在Facebook當中可能有1,000個朋友,這1,000個可能個別也有1,000個朋友,所以,你透過這1,000個朋友就可以接觸到1,000×1,000=1,000,000個朋友嗎?先不談社群分析了,你聽過安麗嗎?如果你要從事保險,你可能認為這會為你帶來倍數的關係,但實際上你的1000個朋友很多彼此都互相認識,所以繪製出來的圖會是高度彼此互相串連的圖。

啟動Gephi後,會跳出一個開啟視窗,選擇「Open Graph File」,就可以找到剛剛下載描述檔。

在Gephi中開啟檔案

 

一般而言社群關係有兩種,一種是有方向性的,例如在Twitter當中的Follow,另外一種沒有方向性,在Facebook中的朋友關係就沒有方向性,都是雙向的朋友。這個例子我們選擇沒有方向性 Undirected。

我們將關係設定為無方向

 

檔案開啟之後,你就可以看到你的社群關係圖了。別緊張,我們接下來會把它變得更有視覺意義。

Gephi下最原始的Facebook關係圖

 

在左下角有一個區域叫做Layout,其他的你有時間自己可以慢慢試,但我們先選擇 ForceAtlas 2,由於Layout通常是動態一直跑,所以當你覺得已經跑得差不多了請按下Stop。

Gephi下設定呈現方式,選擇Force2

 

此時你應該有一個完全沒有著色但社群關係已經非常清楚的Facebook社群關係圖,每一個群組代表一個彼此互相連結,擁有強連結的社群,你可以數看看你在Facebook當中,處於幾個社群。根據統計,一般人平均在Facebook上會在4個社群當中。但由於很多社群之間彼此連結也很密集,所以我們需要進一步著色,才能看到真正社群有幾個。

Gephi預設介面的右上角有Network Overview,這裡其實挺科學的,我當初修Social Network Analytics時幾乎每一個按下去都是一個考題。本文不解釋每一個的功用,但請你按下Modularity,大概瞬間就可以跑完。

Gephi下

 

之後我們到左上角找到Partition,然後在Nodes下面按下綠色迴轉箭頭 Refresh,再從下拉選單當中找到Modularity Class。我們在前一步已經讓Gephi去算出你的Facebook朋友當中,大概能分成幾個群組,現在就是視覺化的時刻了。按下Apply,你的社群就會被著色。這裡可以看到我的Facebook朋友當中,最大的那個社群就佔了28.56%的人。實際上我在Facebook上,大概也就屬於8個社群左右。

2013-06-08_083536

 

由於剛剛的顏色是系統隨機產生,有時候看不清楚,所以當你點下每一個群組的顏色時,可以自己再挑選,讓接近的社群擁有不同顏色。

2013-06-08_083655

 

我的Facebook社群經過著色之後,看起來就是下面這個樣子。可以看到最下面一大塊裡面有三種顏色,螢光綠、藍色、淺紫色,分別是網路意見領袖(與粉絲)、媒體工作者與公司同事。

一個透過Gephi著色過的Facebook社群網路分析圖

 

到這邊,差不多你已經可以看出來你在哪幾個社群當中,這幾個社群彼此關係怎麼樣。當然,我們畫這個除了讓自己開心之外,也可以看到你跟哪幾個社群當中擁有強連結,社群與社群之間如果訊息要傳播,會怎麼走。以上圖為例,通常一個訊息在淺紫色那群傳遞的時候,我的經驗是螢光色與藍色都可以很快看到,但外面突出的那幾塊未必,反之亦然。你可以判斷一個訊息在社群傳播的時候,你感覺很熱門,但實際上只有影響到哪一個社群。

我們在社群當中還假設,如果大家都在一個「社群」當中,除了跟你有連結(Edge)外,應該跟別人也有連結才對,如果有一個人跟你只有1、2條連結,那麼他跟你通常不是在一個社群當中,這些人不是不重要,但他們跟你比較偏向弱連結的關係,在很多書上都說,這些弱連結通常可以給你「不一樣的資訊」。不過今天我們是要看自己所處的社群,所以可以先把弱連結關係的人過濾掉,這樣圖會比較乾淨。

在Gephi右下角有過濾Filter功能,這裡的過濾條件是拖拉式的,我們找到拓樸 Topology之後,可以把Degree Range往下拉到「Drag Filter here」。然後你就可以看到一個滑動選單,你可以過濾掉弱連結,當然反過來也可以過濾掉強連結。

2013-06-08_084128

 

我將共同連結10個以下的都先過濾掉,這時候社群關係就更清楚了,可以明顯看到大小不一的幾個群組,很多社群之間幾乎沒有人有往來,這時候你其實扮演了不同社群當中弱連結的角色。

一個透過Gephi著色過的Facebook社群網路分析圖,過濾掉沒有關係較少的人

 

在Gephi的左上角還有一個功能叫做Ranking,同樣我們在Nodes下找到Degree(就是六度分離 Six Degree的那個Degree),這裡我們可以讓每一個Facebook上的朋友根據與你之間共同朋友的數量而改變大小,這裡的大小都可以自己亂設,如果你玩出興趣,Spline還可以調整尺寸遞增的原則(我常改用指數遞增)。按下Apply,你就可以看到更多的關係。

Gephi下設定關係人的大小

 

這裡可以看到,跟我有最多共同關係的Facebook聯絡人(未必是真正的朋友哈哈),大多落在公司同事與社群意見領袖(及其粉絲)這兩群。如果覺得太擠,請到Layout下將ForceAtlas2裡面勾選Prevent Overlap然後重跑一次。

一個透過Gephi著色、篩選與調整後的Facebook社群圖

 

由於Netvizz抓下來的描述檔也有性別,所以我們可以看看自己是不是怪叔叔或者花痴…這裡可以看到我的大學同學突然浮出來了,就是右下角那群幾乎都是藍色的…

gephi的facebook性別分析圖

 

Lookinfo.com 在 Facebook上也有粉絲團,歡迎加入。如果你有畫出自己的圖,也歡迎貼上來。

Written by richy

June 8th, 2013 at 10:26 am

動物壽命與移動速度的散佈圖

without comments

動物移動速度越快就能活得越久、吃得越多、越不容易攻擊嗎?

德國的Golden Section Graphics公司的兩位繪圖師Julia Kontor與Katharina Stipp就將動物的最長壽命(人類放在120歲……)與最高移動速度(人類放在時速40公里……)繪製成散佈圖。德文作品名稱是Lebensgeschwindigkeit,英文叫做Speed of Life。曾經刊登在德國IN GRAPHICS Magazin雜誌(就是Golden Section Graphics自己出版的)。

你看到了什麼趨勢嗎?這幾個區塊代表什麼意義呢?

生物壽命與移動速度的散佈圖,上面有不同動物

生物的壽命與速度之間到底有什麼關係呢?

 

Written by richy

June 4th, 2013 at 8:43 am

Hans Rosling教你用巨量的資訊與圖表說很多故事

without comments

上週青平台基金會邀請我去為資訊新聞學的營隊上課,除了講資料到資訊、資訊視覺化之外,也另外請我談談最近很流行的「Infographics」。

Infographics或者Information Graphics,其實泛指所有將資訊繪製成圖表的作品,但後來隨著內容行銷興起,突然美國人將一種垂直形式、塞滿很多圖表的作品專稱為Infographic,很多人就以為只有那種東西才是Infographic但其他的東西叫做圖表。事實上並不是那樣的。

我個人覺得那種形式的Infographics對於內容行銷很重要,但對於資訊新聞學而言,不是一個需要討論的題目,甚至最好少看,因為大部分這種充滿行銷目的的Infographics真正的目的是希望使用者看文字、向下拉、看到品牌,經常湊不成故事而且裡面的圖表有半數都有形式上的錯誤。我一直很想找機會針對行銷人談一下內容行銷下的Infographic,但一直抽不出時間。

用大量資料說好聽的故事

由於課程框架是資訊新聞學,最終目的是希望學員有一天能夠從資料當中產出資訊並視覺化,然後可以敘述故事,所以我想說應該給他們看一個具有大量資料,但最後可以漂亮說故事的例子。想著想著,我就想到Hans Rosling了。

Hans Rosling原本是個醫生,後來一腳踏入了國際衛生研究的領域,這不免讓人聯想到John Snow。Hans Rosling有共同開發一套軟體 Gapminder Trendalyzer,後來賣給Google,大家都可以在Google Drive當中使用這個Motion Chart這個功能。Trendalyzer / Motion Chart最大的特點,就是可以將時間這個軸變成動態的,所以可以同時處理3個維度以上的資訊,通常Hans Rosling說故事的時候,都會同時呈現5個或更多的維度。

如果打開 Gapminder 的網站,可以看到非常多可以選擇的資料,基本上一天是玩不完的。

下面這張圖是台灣、香港與中國大陸在過去100多年間人均收入與平均壽命的趨勢圖,其實日本殖民時代後期台灣與中國大陸雖然已經拉很開,但國民黨到台灣之後的40年間,差距反而更大,台灣後來幾乎跟隨香港的腳步,趨勢線幾乎重疊。

有興趣的也可以看看德國與法國在1960年代後,經濟發展與平均每人的核發電量軌跡圖

Hans Rosling教授應用這麼多不同維度的資訊,可以說許多不同的故事。2006年他在TED的演講為他帶來世界級的普遍知名度,這是一個故事,當然後來「繁衍」出許多不同的故事,單單在TED當中就有9個故事

 

我自己覺得Washing Machine這個故事也相當不錯。他後來越來越常使用他自己所說的「類比式視覺化工具」。石頭、箱子都可以拿來用。

 

後來Hans Rosling又有新的敘事手法,大概可以稱為Holistic Infographic,這目前大概只有透過後製可以達成。

雖然不可能大家都來上我的圖表課,但這些影片都值得看一看,然後參考看看,當你取得巨量、大量、海量或甚至只有少量的資料時,你要如何把故事說好,而不是只想畫一大堆圖表。

Written by richy

May 31st, 2013 at 10:17 pm

Posted in 科學圖表,說故事

Tagged with ,