影音處理框架FFmpeg 8.0新增Whisper過濾器,讓影片轉檔可同步語音轉錄Hao Chen Lu幾秒鐘前讀畢需時 1 分鐘Source: IThome新聞影音處理框架FFmpeg在即將發布的8.0版本中,加入一項名為Whisper的音訊過濾器,讓開發者在影片轉檔或串流處理的流程中,可直接進行語音轉錄。 這項功能整合了OpenAI的Whisper語音辨識模型,透過內建的過濾器機制,能在不中斷處理流程的情況下,將音訊內容轉換成文字,並輸出為字幕或結構化資料。影音處理框架FFmpeg在即將發布的8.0版本中,加入一項名為Whisper的音訊過濾器,讓開發者在影片轉檔或串流處理的流程中,可直接進行語音轉錄。 這項功能整合了OpenAI的Whisper語音辨識模型,透過內建的過濾器機制,能在不中斷處理流程的情況下,將音訊內容轉換成文字,並輸出為字幕或結構化資料。 See more: https://www.ithome.com.tw/news/170645
Ai2發表MolmoAct行動推理模型,以三階段空間感知推進機器人空間推理Source: IThome新聞 人工智慧研究機構Ai2開源MolmoAct模型,其被定位為行動推理模型(Action Reasoning Model,ARM),針對機器人在三維空間中的動作規畫與理解而設計。 MolmoAct模型採用三階段空間感知流程,結合視覺與語言能力,...
搭二代Transformer引擎,輝達推Blackwell伺服器GPU加速卡Source: IThome新聞 今年3月GTC大會期間,輝達宣布3款商用GPU產品導入Blackwell架構,並將這些機型稱為RTX Pro Blackwell系列,5月先推出其中兩款桌上型工作站GPU,另一款是資料中心GPU產品RTX Pro 6000...
數發部將強化醫療領域關鍵基礎設施資安,衛福部擬為中小型醫療機構建立區域聯防機制Source: IThome新聞 今年初國內醫療產業受到駭客CrazyHunter的勒索軟體攻擊,馬階、彰基等知名醫院都受害,為加強醫療領域關鍵基礎建設安全,數發部今天(8/15) 與衛福部聯手,數發部宣布將以紅藍隊跨國攻防演練、人才培育、機關輔導等策略多管齊下,強化國內醫...
Comments