多模態預訓練大模型(OmModel)是基于大規模自監督學習的多模態人工智能算法,融合語言和視覺模態理解,實現下一代認知域人工智能應用場景落地。已完成基于行業的億級圖片、萬級視頻、十億級圖文大規模預訓練,實現用更小的標注樣本數量,融合更多的模態信息,獲得更為準確的AI模型,性能國際先進。
技術特性
多模態大模型
基于大規模自監督學習技術,已經完成在在上億圖片、數萬小時視頻和50億字符上的大規模多模態數據,具有強大多模態認知理解能力。
小樣本學習能力
利用多模態協同學習算法,實現基于入門級別標注數據進行快速AI建模,降低人工智能算法的擁有成本。
多模態融合技術
通過收到信息算法進行多模態學習,從向量空間融合各類模態數據,實現多媒體場景下信息融合分析、關聯檢索、異常發現等核心技術。