Descript:會用 Google 文件,你就能剪輯 podcast 和影片!

| |

如果你也參與了今年台灣的 podcast 大爆發,一定會發現製作節目最昂貴的成本不是錄音設備,而是時間。現在,Descript 希望幫創作者省下更多時間,降低剪輯門檻。

和傳統的音檔處理軟體 Audacity、GarageBand 或 Audition 相比,Descript 可以一站式解決錄音、影音剪輯、語音轉文字,如果你會用 Google 文件,那一定會用 Descript。只要靠一般人都熟悉的文字編輯方式,像是複製、貼上、刪除…等,音軌就會同步調整,即使是看到波形編輯器就有心理障礙的初學者也能上手。

多講、漏講或講錯的都有救

Descript 最受關注的莫過於刪除贅字(Filler Words)和聲音合成(Overdub)兩大功能。首先是我覺得最實用的 Filler Words,幫後製者去蕪存菁,收聽體驗更流暢,也為內容增加信服力。Descript 會偵測並在逐字稿標註 “um”、“ah” 等語助詞,可以一鍵刪去這些影音片段,堪稱 podcaster 救星。Pro 版的語助詞庫就更豐富了,囊括 “you know”、“like”、“kind of” 等贅字。

不只冗詞贅字,許多人最怕或恨的還有漏講和口誤,Overdub 功能便是為了解決這一大困擾。你需要先照指定腳本錄音至少十分鐘以提供 AI 訓練素材,為求提升準確度,官方建議最好能錄製 30 至 90 分鐘。當你想「無中生有」,例如換句話說或修正口誤,可以直接調整逐字稿, Descript 便會用 AI 學習後產生的合成音修改,免去重新錄音的麻煩,且為求自然,會根據原句聲音的情感和語調做相應調整。1 這也能幫助優化節目製作流程,podcaster 可以先用 Overdub「試聽」腳本草稿,從實際聽起來的感覺評估是否需要調整,不用等錄完音才耗費更多力氣後製。

Overdub 這項功能讓 AI 學習你的聲音後產生合成音,可直接修改音檔。(來源:Descript)

整合影音編輯、團隊協作功能

除了語音,Descript 在 2020 年 10 月加入完整的影像編輯與螢幕錄製功能,如果要新增圖片、字幕或音樂等,也可以直接拖曳到腳本的介面上。同時提供遠端錄音與多人共同編輯,Zoom 會議通話亦能自動轉成文字,使用者可以加上註解、取得編輯版本紀錄、同步儲存雲端、離線處理…等,總之你熟悉的 Google 文件功能,Descript 幾乎都沒落下。

另外,透過它的螢幕錄製功能可以自由選取畫面並一鍵匯入,也適用 Descript 的編輯選項。例如你想和其他人快速分享一個有趣的片段,相較於 YouTube 的時間戳記, Descript 的螢幕錄製功能則強化團隊協作與精準溝通。(官方也有提醒請在不侵權的前提下善用此功能哦。)

如果想在社群媒體分享 podcast 片段,Audiogram 功能則讓你從逐字稿選取所需段落並套用模板,就能快速製作精美小廣告,彌補 podcast 在視覺吸引力上的不足。

我的試用心得是 Descript 的操作很直觀,介面易懂、跟著示範教學就很好上手。而且咬字及收音狀況良好的話,語音轉文字的辨識度也頗為準確。現在推出的使用方案分成三種:

  1. 免費方案:可編輯或錄製一個專案、20 次螢幕錄影與三小時的逐字稿;
  2. Creator 方案:15 美元/月或 144 美元/年,每月逐字稿長度上限 10 小時,其他則不受限。
  3. Pro 方案:30 美元/月或 288 美元/年,提供最有差異化的兩大強項 Overdub 和完整的 Filler Words ,有七天免費試用期。

考量目前 Descript 的功能和費率,暫時無法威脅 Adobe Premiere 或 Audition 等主流工具的地位,不過可以吸引一些使用者選擇 Descript 快速初剪和協作,再輸出原始檔與編輯紀錄到慣用的剪輯軟體進行混音等進階功能。

從 Groupon 到 Descript :Andrew Mason 的連續創業之路

Descript 其實和曾為市場龍頭的團購網站 Groupon 擁有同一個「爸爸」—— Andrew Mason。他 2013 年離開 Groupon 後加入 Y Combinator 擔任兼職合夥人,同年創立旅遊語音導覽服務 Detour(於 2018 年 4 月被 Bose 收購),而 Descript 的前身就是 Detour 的內部工具。

Andrew Mason
Descript 與 Groupon 的創辦人都是 Andrew Mason。(來源:Y Combinator

2014 年時,Detour 團隊開始希望製作語音產品更有效率,「如果可以編輯『文字』而非波形,那處理音檔就會更容易又快速了吧。」經過兩年半研究開發,技術漸趨成熟, Andrew Mason 意識到 Descript 不該再附屬於 Detour,於是將其拆分為獨立公司,更從矽谷知名創投 Andreessen Horowitz 募得種子輪 500 萬美元(約合新台幣 1.42 億元)。2017年,Andrew Mason 正式投入經營 Descript,並於 2019 年收購加拿大新創 Lyrebird 為 AI 技術部門,打造 Overdub 功能。

從 Groupon 到 Descript ,看似天差地別,但其實 Andrew Mason 在美國西北大學正是主修音樂,也有錄音室的工作經驗。他在《The Verge》的採訪中提到:「Podcast 是最容易產製的內容,卻也是最難編輯的類型之一。」當 Youtuber 搶做 podcast、podcaster 也忙著把節目上架到 Youtube,搶奪眼球和耳朵注意力的戰線已經拉長,內容創作者對跨平台編輯工具的需求勢必越來越強烈,但市場也變得更擁擠了。

下一步的挑戰

Descript 除了要和 Otter.ai、Scribe、Vimeo 2、Biteable 等同類型競爭者搶道,還有資訊真偽的挑戰要克服 —— Overdub 背後的「深偽」(Deepfake)技術免不了受輿論質疑該如何避免被有心人濫用,成為假消息傳播的幫兇,Descript 強調,為防止聲音被任意合成 , Overdub 只在編輯個人語音及獲得聲音所有者授權下才能啟用 3

推出以來,Descript 的潛力仍被看好,也在 2019 年 9 月完成 1500 萬美元(約合新台幣 42.8 億元)的 A 輪募資,由 Andreessen Horowitz (a16z)和 Redpoint 參投,使用者包括《NPR》、《華盛頓郵報》、《紐約時報》等。比較可惜的是 Descript 目前僅支援英文,未來若能支援多語系,對創作者一定是天大的好消息。

參考資料:
Andrew Mason’s Descript snags $15M, acquires Lyrebird to let users type text to create audio in their own voices
Descript’s new podcast editor includes an AI voice double for dubbing over mistakes
Descript, Andrew Mason’s platform to edit audio by editing text, now lets you edit video, too
Introducing Descript


  1. Overdub 的運作機制可以參考官方 blog 分享的技術說明 

  2. Vimeo 於 2020 年 1 月 新增使用 AI 技術的短影音編輯平台 

  3. 針對 Overdub 淪為雙面刃的潛在風險, Descript 對此在官網發表了倫理聲明 

本文依 CC 創用姓名標示 - 非商業性 - 相同方式分享 4.0 國際釋出

(文章代表圖片來源:Descript )

Previous

科技創業週報 #256:為何我們還是需要大齡工程師?

《星箭廣播》81 集——歡迎光臨桃源二村

Next
Share via
Copy link
Powered by Social Snap