奧推網

選單
科技

5條重要提示幫你選擇正確的分析專案、保障資金供給、獲取實現技術

這5條重要提示,也許能幫助各位製藥業高管開啟通往資料科學之旅的大門。以此為引導,你將逐步瞭解如何選擇正確的分析專案、保障資金供給、建立早期團隊、獲取資料並選擇有效

實現技術。

2011年,谷歌內部對於深度學習技術的潛力仍普遍持懷疑態度。很明顯,時任Google Brain團隊負責人的吳恩達要說服大家在這一全新人工智慧(AI)方向上投入資源,必須克服艱鉅的挑戰。

吳恩達決定從小處入手消解阻力。

他最先在語音識別團隊中獲得了初步支援。該團隊在谷歌中的關注度遠不及搜尋或廣告業務部門,但吳恩達至少以此為起點幫助第一位內部客戶獲得了價值回報,讓深度學習在谷歌語音搜尋中得到早期應用。也正是憑藉這成功的第一步,深度學習技術得到了在谷歌地圖中一試身手的機會,負責提高資料質量。

每個專案的成功都在鞏固人們的信心。最終,飛輪效應全面啟動,令深度學習成為谷歌之內一股不可阻擋的洪流。如今,深度學習已經為谷歌的大多數產品提供著強大的支援,包括搜尋、相簿、YouTube乃至地圖等等。

這個故事同樣能夠為製藥行業的高管們提供寶貴經驗,啟發大家立足所在組織一步步探索資料科學領域。

每一家希望掌握高階分析之力的組織,都必須經歷五大關鍵步驟。雖然說起來非常簡單,但不同行業的高管人士往往未能對這些步驟給予應有的重視。

TPS Global臨床與戰略運營執行副總裁Syed Shah表示,“令我感到驚訝的是,藥學領域一直存在大量可用資料,但真正得到成功使用的資料量卻非常有限。”透過示例,我們將共同瞭解這五個步驟如何幫助您為製藥行業建立起可靠的資料科學實踐。

1. 剋制挑戰“登月”的雄心,先從唾手可得的成果中做出選擇

在選擇資料科學之旅的啟動專案方面,企業往往會犯下同一類錯誤——傾向於選擇那些緊急但缺乏戰略影響,或者說有趣但鮮有實際回報的專案。

更糟糕的是,企業最終選擇的專案往往過於複雜。請注意,最重要的是應該透過早期的一個個小成功快速展示業務價值,而非一上來就選擇那些前景無比宏偉、但卻充滿不確定性風險的“登月”級專案。

Roche Diagnostics公司商務智慧兼分析主管K。M。A。 Omar表示,“在製藥企業中選擇啟動專案時,並不一定非得從營銷、銷售或者財務等角度切入。研究等領域的實施阻力往往更低,而且同樣能夠為患者帶來可觀的價值。此外,這部分員工們對於生物統計學乃至資料的應用概念擁有良好的理解。實際上,他們往往對組織在高階分析方法方面的嘗試充滿熱情。”

2. 透過量化業務投資回報、而非給出模糊的預測結果,保障資金供給

根據Gartner的調查,資料分析專案中的資金短缺已經成為首席資料官(CDO)們面臨的最大障礙之一。Syed Shah指出,“為了獲取資金,首先需要明確專案的最終收益。”

Shah補充道,“然而,確實有不少專案缺乏明確的投資回報(ROI)或者成本節約效用。對於這類專案,最重要的自然是歸納其帶來的無形收益,例如消除由低質量產品帶來的返工成本。”

舉例來說,假定你已經建立起一套資料科學解決方案,可以自動對細胞進行計數以加快藥物發現速度。一般認為,這類解決方案能夠縮短研發週期或者降低生物學家們的工作強度。對此,最合理的方法自然是計算專案帶來的潛在成本節約與投資回報。只要以由此得出的近似估算值作為投資回報起點,你的專案就能在企業中獲得必要的關注與預算支援。

3. 為你的早期資料科學團隊配備技術通才,而非急於引入純資料科學家

每個資料科學團隊都需要五種專業角色。但在早期階段,通才往往位元定領域的專家更具價值。一般來說,通才屬於公司內的現有人員,而且對製藥領域及組織動態都擁有深刻的理解。

美國食品藥監局CDO Ram C Iyer表示,“很多新任領導者都低估了組織內已經擁有的人才儲備。大多數與健康相關的組織都擁有著掌握各類分析技術與工具知識的高階知識分子乃至博士群體。”

資料領導者們必須發揮自己的人才發掘能力,快速找到那些精通數字、充滿好奇心且樂於學習的員工。Iyer還補充道,這部分人才將成為啟動初期專案、建立長期資料科學部門當中的重要基礎。

4. 從少量資料起步,不要坐等完美資料倉庫的落實

如果沒有規模可觀、質量穩定且經過良好組織化的資料作為依託,資料科學根本無法實現。但在早期階段,大多陣列織都拿不出如此奢侈的資源儲備。那麼,製藥行業的高管們是不是該推遲自己的資料科學探索,直至準備好強大的資料工程層?

Omar認為,“我強烈建議大家不要等待,因為所謂完美的資料可用性永遠不可能到來。”

他還補充稱,這些早期專案可以幫助大家建立起可重用資料資產建立案例。你可以藉此吸引到人們對於資料質量問題的關注。從起步階段開始,大家就必須關注資料架構層面的差距,並將這部分問題充分體現在資料工程的待辦清單當中。

例如,你可以使用臨床試驗資料表格發現關於患者行為、募集與留存的可行性洞見。你需要評估資料的可用性與質量,並在確定這些指標均高於可接受閾值後正式啟動高階分析之旅。

5. 在運用AI力量之前,先從簡單的資料分析方法入手

我們能不能在第一個資料科學專案中就充分運用人工智慧的潛力?Shah認為,“千萬別被那些流行語和趨勢性表述所誤導。請堅持您的直覺判斷、不斷探索真相、總結出自己的洞見並據此做出決定。在大多數情況下,初步探索並不需要特別複雜的技術或者統計資料。”

在Roche Diagnostics,“AI本身並不屬於獨立的議程,它只是我們用於實現戰略目標的工具與部分功能。”根據該公司CIO Werner Boeing在《麻省理工學院斯隆管理評論》中發表的報告,正是這種將AI視為常規工具之一的舉措,幫助Roche Diagnostics獲得了結合實際需求使用AI功能的靈活性。

例如,計算機視覺可以檢查影片源中是否存在藥品生產或包裝問題,藉此提高藥品製造質量。但作為更適合的起步專案,大家不妨先嚐試透過簡單的迴歸演算法快速提高藥物良品率。

資料科學之旅中的第一波衝刺

選擇正確的資料科學專案、獲取資金供給、組建團隊、獲取資料併產生可行洞見,這些都是相當艱難的挑戰。而即使完成了這些目標,資料科學的探索之旅仍然沒有徹底完成。

只有將解決方案應用於實際決策,資料科學才能真正為大家創造價值。要想衝過這道終點線,大家需要保證你的專案已經得到使用者們的實際採用,包括與業務支持者們通力合作、為終端使用者提供影響並不斷獲得一項項成果,藉此在製藥企業之內維持住良好的資料科學發展勢頭。

Shah總結道,“只有當領導者們能夠看到自己的資料,體會到資料背後那一個個引人入勝、但以往根本沒有被發現過的故事時,他們才算真正體會到資料科學的現實力量。”