當前位置:首頁
>> 科技創新 >> 人才風采

見微知著 講述數據中的故事

發布日期:2020-08-31 11:10 訪問次數: 信息來源:城西科創大走廊管委會
分享:

“超越摩爾定律的發展速度下,計算機的計算速度越來越快,存儲越來越大,帶寬越來越寬,但是有一個東西幾百年來都沒變過,你知道什麼嗎?”這是之江實驗室融合智能研究中心副研究員傅四維拋出的問題。這個問題與他的研究方向息息相關,也是之江實驗室正在攻堅的技術創新研究領域之一。

 

 

本科時期,傅四維的專業方向是計算數學,畢業論文寫的是Helmholtz方程數值解,是偏微分方程的一種。從小就酷愛數學的他,在解Helmholtz方程數值的過程中,為數字之美深深震撼。“一塘池水,我朝水中扔一顆石頭,會漾起一圈圈漣漪。我要做的就是在一定誤差範圍內,近似計算漣漪在時域上的三維軌跡,再把漣漪最終的形態畫出來,得到的圖像,特別美。”將數值分析的結果可視化出來之後,傅四維直觀感受到了數字之美,原來數字可以演化出這麼完美的視覺感受。碩士期間,傅四維開啟了計算機領域的研究,主攻數據可視化。與本科時用數學畫出漣漪一樣,數據可視化也是一個把數據具象化的過程。傅四維說:“和可視化的緣分,仿佛是冥冥之中注定的。”“當時計算機還不是熱門專業,我個人之前對計算機也並不了解。說實話,我也曾經很迷茫,但是深入研究之後,對計算機有了全新的認識,開始真正喜歡上這個領域。”

 

有些科學研究需要經曆漫長的等待,才可能出結果。但數據可視化不同。傅四維解釋說:“數據導入進來,通過可視化,我很快就能知道數據裏麵有什麼,呈現了什麼樣的故事。這種及時反饋給我帶來了很大的激勵。”2013年,在傅四維讀研期間,大數據行業快速興起,數據可視化的研究前景也隨之變得更為廣闊。讀博期間,他繼續主攻這一領域的研究,發表了4篇一作論文。其中,2篇發表在IEEE TVCG(IEEE Transactions on Visualization and Computer Graphics,計算機圖形學領域的頂級期刊),還有1篇被人機交互頂級會議ACM CHI收錄。

 

臨近畢業時,計算機領域開始急速發展,全球科技行業都身處計算機的熱潮當中,“當時很多人都想轉行做AI,我也在思考,是不是要追隨科技行業的大趨勢,投身AI,放棄可視化。”在迷茫的關口,傅四維開始思考認知科學和人工智能交叉領域的問題。正如他對文章開篇問題的理解,急速發展的存儲和帶寬帶來了海量數據,而人腦對數據的處理和理解能力在近百年來卻沒有較大的變化。如何解決信息科學領域最大的瓶頸之一?傅四維認為,數據可視化、可視分析有望為打破瓶頸開辟一條可行的道路。

 

基於這樣的判斷和理解,傅四維認為,數據可視化領域正處在“黎明前的黑暗”,行業的春天即將來臨。再加上對該領域濃厚的研究興趣,他決定繼續數據可視化的研究之路。進入工業界做應用研究?還是在學術界做基礎研究?傅四維在畢業季拿到了華為等多個大廠的offer,但他都拒絕了。Do something different.這是傅四維的座右銘。“我希望能思人所未思、做人所未做。科研就是這樣,創新是第一要義,永遠要做跟別人不一樣的事情。”秉持這樣的理念,傅四維來到了之江實驗室。 

 

在之江實驗室,傅四維加入了“見微”團隊。“‘見微’來源於‘見微知著’。”傅四維解釋說,“‘微’指的是數據,‘著’指的是挖掘出數據中的故事。”大數據時代,挖掘數據中的故事,就是希望數據可視化能夠為決策提供重要支撐,發揮數據中隱藏的價值,實現真正的人機交互。“見微”團隊目前正在進行的項目是“大數據可視分析平台構建”。該項目致力於為可視分析係統的開發搭建一個底層平台,“我們的平台涵蓋了數據分析的全鏈路,包括數據導入、清洗、建模、可視化、導出等幾大核心模塊。使用者隻需要導入數據,就能快速生成一個可視分析係統,並且導出成外部可訪問的網頁,或生成Word報告。”利用這個平台,可根據需求快速定製出一個可視分析係統。

 

基於這個項目,“見微”團隊改變了行業內的純手動可視分析,實現了半自動的可視分析,並致力於突破全自動的可視分析,讓人與數據的實時交互成為可能。

大屏是公眾最常見的可視化展示載體之一。滿屏的數據與圖表,看似簡單明了,但是對於受眾來說,隻是被動接受,沒辦法根據自身需要實時與數據進行交互。舉個例子,如果想了解目前全球的疫情狀況,大屏上隻會顯示全球各國確診病例數據,如果你想了解某個最感興趣的國家,大屏無法單獨呈現。而基於“見微”團隊構建的係統,你隻要輸入一句自然語言:“某國疫情的發展趨勢”,係統就能選擇最合適的圖表生成該國的疫情數據與發展趨勢。另外,大數據可視分析平台的多個圖表支持實時聯動。比如界麵上有散點圖和柱狀圖,當你選擇折線圖中的一個點時,柱狀圖中與這個點相對應的數據也會被點亮。新冠肺炎疫情期間,研究團隊就利用這套係統對當前的疫情狀況進行了可視化分析。

 

這個應用場景背後的技術難點有不少。首先,如何解析這句話的自然語言與任務?疫情的趨勢,要包含時間與疫情數據,還要將所選國家的疫情數據從全球的疫情數據中篩選出來。其次,理解透徹之後,要用什麼樣的圖表呈現才最合適?目前,“見微”團隊正著力攻克相關技術難點,並已取得了相當大的進展。另外,針對海量數據渲染的挑戰,“見微”團隊開發了一個全球領先的海量圖數據可視化工具庫,實現了1000萬圖視覺元素的實時渲染,通過FPS效率測試,該庫的渲染效率超過了D3、Cytoscape、Sigma、Stardust四個國際知名圖可視化工具。

 

 



見微知著 講述數據中的故事

時間:2020-08-31 11:10

“超越摩爾定律的發展速度下,計算機的計算速度越來越快,存儲越來越大,帶寬越來越寬,但是有一個東西幾百年來都沒變過,你知道什麼嗎?”這是之江實驗室融合智能研究中心副研究員傅四維拋出的問題。這個問題與他的研究方向息息相關,也是之江實驗室正在攻堅的技術創新研究領域之一。

 

 

本科時期,傅四維的專業方向是計算數學,畢業論文寫的是Helmholtz方程數值解,是偏微分方程的一種。從小就酷愛數學的他,在解Helmholtz方程數值的過程中,為數字之美深深震撼。“一塘池水,我朝水中扔一顆石頭,會漾起一圈圈漣漪。我要做的就是在一定誤差範圍內,近似計算漣漪在時域上的三維軌跡,再把漣漪最終的形態畫出來,得到的圖像,特別美。”將數值分析的結果可視化出來之後,傅四維直觀感受到了數字之美,原來數字可以演化出這麼完美的視覺感受。碩士期間,傅四維開啟了計算機領域的研究,主攻數據可視化。與本科時用數學畫出漣漪一樣,數據可視化也是一個把數據具象化的過程。傅四維說:“和可視化的緣分,仿佛是冥冥之中注定的。”“當時計算機還不是熱門專業,我個人之前對計算機也並不了解。說實話,我也曾經很迷茫,但是深入研究之後,對計算機有了全新的認識,開始真正喜歡上這個領域。”

 

有些科學研究需要經曆漫長的等待,才可能出結果。但數據可視化不同。傅四維解釋說:“數據導入進來,通過可視化,我很快就能知道數據裏麵有什麼,呈現了什麼樣的故事。這種及時反饋給我帶來了很大的激勵。”2013年,在傅四維讀研期間,大數據行業快速興起,數據可視化的研究前景也隨之變得更為廣闊。讀博期間,他繼續主攻這一領域的研究,發表了4篇一作論文。其中,2篇發表在IEEE TVCG(IEEE Transactions on Visualization and Computer Graphics,計算機圖形學領域的頂級期刊),還有1篇被人機交互頂級會議ACM CHI收錄。

 

臨近畢業時,計算機領域開始急速發展,全球科技行業都身處計算機的熱潮當中,“當時很多人都想轉行做AI,我也在思考,是不是要追隨科技行業的大趨勢,投身AI,放棄可視化。”在迷茫的關口,傅四維開始思考認知科學和人工智能交叉領域的問題。正如他對文章開篇問題的理解,急速發展的存儲和帶寬帶來了海量數據,而人腦對數據的處理和理解能力在近百年來卻沒有較大的變化。如何解決信息科學領域最大的瓶頸之一?傅四維認為,數據可視化、可視分析有望為打破瓶頸開辟一條可行的道路。

 

基於這樣的判斷和理解,傅四維認為,數據可視化領域正處在“黎明前的黑暗”,行業的春天即將來臨。再加上對該領域濃厚的研究興趣,他決定繼續數據可視化的研究之路。進入工業界做應用研究?還是在學術界做基礎研究?傅四維在畢業季拿到了華為等多個大廠的offer,但他都拒絕了。Do something different.這是傅四維的座右銘。“我希望能思人所未思、做人所未做。科研就是這樣,創新是第一要義,永遠要做跟別人不一樣的事情。”秉持這樣的理念,傅四維來到了之江實驗室。 

 

在之江實驗室,傅四維加入了“見微”團隊。“‘見微’來源於‘見微知著’。”傅四維解釋說,“‘微’指的是數據,‘著’指的是挖掘出數據中的故事。”大數據時代,挖掘數據中的故事,就是希望數據可視化能夠為決策提供重要支撐,發揮數據中隱藏的價值,實現真正的人機交互。“見微”團隊目前正在進行的項目是“大數據可視分析平台構建”。該項目致力於為可視分析係統的開發搭建一個底層平台,“我們的平台涵蓋了數據分析的全鏈路,包括數據導入、清洗、建模、可視化、導出等幾大核心模塊。使用者隻需要導入數據,就能快速生成一個可視分析係統,並且導出成外部可訪問的網頁,或生成Word報告。”利用這個平台,可根據需求快速定製出一個可視分析係統。

 

基於這個項目,“見微”團隊改變了行業內的純手動可視分析,實現了半自動的可視分析,並致力於突破全自動的可視分析,讓人與數據的實時交互成為可能。

大屏是公眾最常見的可視化展示載體之一。滿屏的數據與圖表,看似簡單明了,但是對於受眾來說,隻是被動接受,沒辦法根據自身需要實時與數據進行交互。舉個例子,如果想了解目前全球的疫情狀況,大屏上隻會顯示全球各國確診病例數據,如果你想了解某個最感興趣的國家,大屏無法單獨呈現。而基於“見微”團隊構建的係統,你隻要輸入一句自然語言:“某國疫情的發展趨勢”,係統就能選擇最合適的圖表生成該國的疫情數據與發展趨勢。另外,大數據可視分析平台的多個圖表支持實時聯動。比如界麵上有散點圖和柱狀圖,當你選擇折線圖中的一個點時,柱狀圖中與這個點相對應的數據也會被點亮。新冠肺炎疫情期間,研究團隊就利用這套係統對當前的疫情狀況進行了可視化分析。

 

這個應用場景背後的技術難點有不少。首先,如何解析這句話的自然語言與任務?疫情的趨勢,要包含時間與疫情數據,還要將所選國家的疫情數據從全球的疫情數據中篩選出來。其次,理解透徹之後,要用什麼樣的圖表呈現才最合適?目前,“見微”團隊正著力攻克相關技術難點,並已取得了相當大的進展。另外,針對海量數據渲染的挑戰,“見微”團隊開發了一個全球領先的海量圖數據可視化工具庫,實現了1000萬圖視覺元素的實時渲染,通過FPS效率測試,該庫的渲染效率超過了D3、Cytoscape、Sigma、Stardust四個國際知名圖可視化工具。