數(shù)據(jù)處理方法、裝置、芯片以及計算機可讀存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202010142406.9 | 申請日 | - |
公開(公告)號 | CN111814983A | 公開(公告)日 | 2020-10-23 |
申請公布號 | CN111814983A | 申請公布日 | 2020-10-23 |
分類號 | G06N20/00(2019.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 闖小明;楊龔軼凡;鄭瀚尋;高雷;鐘居哲 | 申請(專利權)人 | 深圳芯英科技有限公司 |
代理機構 | - | 代理人 | - |
地址 | 518057廣東省深圳市南山區(qū)粵海街道科技生態(tài)園10棟B座5-15 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明實施例公開了一種數(shù)據(jù)處理方法、裝置、芯片以及計算機可讀存儲介質(zhì),用于加速深度學習模型訓練中批標準化層的運算。通過將多維張量數(shù)據(jù)按照預設規(guī)則存入第一存儲器,再以二維數(shù)據(jù)的形式取出來并進行運算,并通過寄存器組以及第二存儲器配合使用構建出第四矩陣,通過將第一矩陣和第四矩陣進行矩陣相乘可同時求出第一矩陣中的每一行各自的元素和與元素乘積和,實現(xiàn)了求元素和與求元素乘積和的并行計算,從而加速批標準化層中的計算,解決了批標準化層運算過程中因數(shù)據(jù)量過大而導致運算耗時長的問題。最終使批標準化操作的運算速度得以提高,極大地縮短了深度學習模型訓練整體所需的時間。?? |
