目前,視頻會議設備對音頻與視頻的通信質量要求很高,尤其是在電腦硬件和網絡帶寬難以支持的條件下。如何在畫面和降噪等技術上取得突破?這是音視頻行業不斷探索的問題,故而,AI人工智能得以在視頻會議領域大放異彩。
然而,視頻會議的未來發展顯然不止于此,至少在可預見的時間內,還能在交互方面進一步突破發展。特別是隨著AI人工智能時代的到來,以及在各領域日益發揮著重要應用價值,也必然會深刻影響并參與視頻會議領域的變革。下面,我們將重點探討AI在視頻會議設備上的初步應用及影響。
初級AI在攝像頭上的機會
AI人工智能是新一代“通用目的技術”,對企業的發展能產生深刻影響。雖然在初級人工智能階段,其在短時間內對業績的貢獻有限,但應用到企業內部經營過程,會為企業帶來變革機遇。而在視頻會議領域,尤其是在攝像頭設備上,AI的普及將顯著加速視頻通訊技術的發展,這幾乎是包含所有的會議情境。
從人臉抓拍到檢測、跟蹤、識別及行為分析等,AI在攝像頭上優勢是巨大的,因為即便是復雜的會議環境,AI技術的應用都能顯著提升攝像頭拍攝的準確度、性能、效率以及穩定性。隨著AI技術迅速演進發展,深度學習算法日新月異,如Auto-Framing、Speaker-Tracking、Presenter-Tracking,在新算法和技術的支持下,人與攝像頭的人機交互及人與人之間的協作將更加自然真實。
Auto-Framing原理及應用
Auto-Framing即智能取景,也稱為自動框選,是一項在會議攝像頭或者會議一體機上已經十分普及的技術。Auto-Framing智能取景技術分兩步進行,自動取景和實時變焦控制。實現自動取景的圖像處理可分為四個步驟:圖像預處理、運動區域的提取、膚色匹配、計算目標位置,經過復雜的算法處理,攝像頭能夠識別視野范圍內人員的變動并將所有人囊括在內,然后再進行實時變焦控制,即改變成像鏡頭的焦距和視場,使得所有人員以合適的大小出現在視場中心。
簡單來說,Auto-Framing技術有點類似自動EPTZ功能,允許用戶以數字方式縮放攝像頭的可視區域和視頻圖像,移動并裁剪該畫面,以獲得最佳會議視角及構圖。蘋果公司在新發布的Studio Display中也置入了此項技術,人物居中功能讓你在來回走動時依然你保持在畫面中間,有人加入或離開畫面,鏡頭視角則會相應擴大或拉進。Auto-Framing的應用,讓視頻會議變得更加智能。
Speaker-Tracking其技術特點
Speaker-Tracking發言人追蹤,是一項聲音和視覺結合的追蹤技術,大多數用于人機交互領域和機器人領域。其技術特點是,攝像頭內置麥克風先對聲音信號進行數據采集,經AI算法實現對聲音信號方位的定位,然后攝像頭轉向被測發言人,攝像頭采集圖像傳給視覺追蹤系統,視覺追蹤系統會立刻生成特征物體,當物體發聲移動之后,聲音追蹤系統會立即對被測物體進行重新方位定位,同時視覺追蹤系統會在攝像頭的視野范圍內尋找特征圖像,尋找到后再把結果顯示在屏幕上。
然而,現實的會議環境中,聲音信號很容易被環境中的噪聲和低頭交談聲等干擾,并且發言人的聲音信號往往比周圍環境中的噪聲等聲音強度要小很多,因此,對有用聲音信號的放大是聲音信號追蹤過程中需要同步進行的操作。值得稱贊的是,當不同發言人分別進行發言時,畫面還能實現在發言人之間的順滑切換。
Presenter-Tracking算法與優化
目標跟蹤是利用一個視頻或圖像序列的上下文信息,對目標的外觀和運動信息進行建模,從而對目標運動狀態進行預測并標定目標位置的一種技術。其應用已經滲透到各個領域,包括智能監控、智能人機交互、視頻會議等方面。
Presenter-Tracking演講者跟蹤,是目標跟蹤算法在視頻會議領域的一種應用方式,其改進了早期基于濾波的跟蹤算法通過響應圖確定的目標位置不夠準確的問題。Presenter-Tracking演講者跟蹤利用深度學習技術,通過提取目標特征,無論人臉朝向何處,都能實現流暢的人形跟蹤,適用于會議發言人需要移動講解的視頻會議場景。
相關推薦
- 12-17 騰訊會議最新資訊
- 12-16 加入騰訊會議,開啟高效溝通的全新旅程!
- 12-13 解鎖安全高效協作 - 探索Teams的數字防護盾
- 12-12 Microsoft Teams:賦能遠程協作的幾大亮點功能
- 12-10 【協作新風尚】微軟Teams:數字化工作空間的新亮點
- 12-09 未來辦公新篇章:微軟Teams
- 12-06 Webex實時翻譯功能怎樣?
- 12-05 WebEx在金融服務行業有哪些應用案例?
- 12-04 Webex支持哪些特殊增強功能?
- 12-03 WebEx功能百科
- 本月熱門
-
- 視頻會議系統解決方案的優勢有哪些?
- 公司想上一套視頻會議系統,打聽了一下硬件的價格太貴,有沒有性價比高的視頻會議軟件推薦一下?
- “面對面通話”Starline要來了,谷歌惠普明年促進全息視頻聊天技術商業化
- [華萬智慧辦公]:微軟 Teams 開放自定義表情:每人最多使用 5000 個
- [華萬智能會議]:VooV Meeting通知:Pro版上線與免費版調整說明202407
- [華萬智能會議]:谷歌Goole Meet更新支持全高清錄制會議(Google Workplace)
- 微軟旗下 GroupMe 迎來更新,已集成 Copilot AI
- [華萬智慧辦公] 了解新版 Google Meet 應用
- 最近發表