近年在深度學習(Deep Learning)模型技術的導入下,讓人工智慧(AI)大放異彩,吸引眾多雲端平台與晶片廠商的關注和投入。TrendForce旗下拓墣產業研究院最新研究指出,「深度學習」的發展重點除了軟體模型架構的改善,還須仰賴強大的硬體運算能力,以及大量的有效數據資料才能達成。其中數據資料直接攸關AI模型訓練完畢的辨識精準度水準為何,成為國際大廠角逐AI應用市場的重點所在。
拓墣統計,從目前AI中機器學習的應用發展來看,以金融與資訊安全、數位廣告科技比重最高,分別達20%與18%,其他產業的應用也正快速發展中。
大廠積極掌握重要資料或獲取資料使用權
觀察目前布局AI應用市場的廠商,主要為谷歌、AWS、臉書、IBM、微軟、蘋果、百度、騰訊、阿里巴巴等雲端或軟體平台大廠,其共同優勢是擁有大量用戶數據庫使用權,利於發展AI相關API、SDK等軟體工具。
拓墣分析師林貞妤指出,數據庫的擁有者與數據庫使用權未必畫上等號,廠商有時只是獲得資料的使用權,卻不擁有資料本身。AWS、谷歌或微軟的Azure,同時提供公有雲與私有雲的服務,但通常都不擁有客戶的數據資料,只在用戶為特定目的使用雲端API等工具輸入資料,廠商才一面提供服務,一面使用這些數據進行自家雲端API工具的效能優化。
林貞妤也表示,由於深度學習的實踐仰賴豐富的數據資源,廠商為發展出更多元的AI服務,也將開源框架(Open Source Framework)視為重要戰略之一。因為若能掌握軟體開發環境,就有機會拓展後續軟硬體服務,所以無論是谷歌的TensorFlow、臉書的Torch、微軟的CNTK,或英特爾併購開發Neon的Nervana Systems,越來越多廠商都試圖穩固自有的軟體開發環境,透露其中潛在的角力關係。
發展專業領域AI系統,專業知識(Domain Knowledge)與數據是關鍵
若希望利用數據訓練出符合某項專業領域的需求且具高信賴度的AI系統,掌握該領域的專業知識(Domain Knowledge)便成為系統發展的關鍵。舉例而言,若要訓練AI系統透過影像辨識找出病灶,就必須先取得足量且攸關的病灶影像數據進行AI系統訓練才能達成。因此,掌握專業領域關鍵資料的廠商重要性將日益增加。
就以集邦科技為例,作為專業調研機構,除了累積過去逾十多年的資料庫能量外,仍持續累積科技產業各領域的關鍵資訊,在產業全面邁向人工智慧數據化的同時,未來期能提供客戶更高的價值。