從聲音到文字
隨著當前大環(huán)境的變化,許多會議和教學都轉到了線上進行。特別是對于留學生來說,雖然就讀的是國外大學,但上課卻是以網(wǎng)絡授課的方式在進行著,這也是目前在短期內(nèi)很難改變的現(xiàn)狀。
從線下面授,轉變到線上過程中最常見的就是收音問題,例如麥克風嘯叫,拾音不清晰,距離遠不穩(wěn)定等等,從而導致后續(xù)的一系列的問題產(chǎn)生。最尷尬的場面是,線上教授多次讓你重復前面的回答,因為他聽得很模糊。
如何解決這些問題呢?最簡單的方法就是通過外置麥克風來改善筆記本的拾音條件,但這也只是改善拾音問題,課后的筆記整理依舊相當花時間。我也嘗試過使用錄屏或錄音軟件將上課內(nèi)容給保留下來,可是也并不能提高筆記的整理效率,而且視頻和錄音也不支持檢索,來回拖動的效率也不高。
那么如何提升上課或會議的效率呢?接下來就分享一款我最近剛入手的商務類產(chǎn)品--科大訊飛智能全向麥克風M2。盡管名稱中帶有麥克風字眼,但畢竟是科大訊飛旗下的產(chǎn)品,語音識別和翻譯是其強項,這也就導致麥克風M2并不是只有簡單的拾音功能,還支持自動記錄語音內(nèi)容,轉寫文字。
轉寫與翻譯體驗
有線模式,享受免費轉寫
盡管訊飛智能麥克風M2支持即插即用,無需安裝任何的驅動,但還是得搭配“訊飛聽見客戶端”才能享受轉寫服務。
打開“訊飛聽見”客戶端后,我們可以看到軟件集成了遠程云會議、云空間、語音轉文字、翻譯等功能,整體UI界面比較簡潔。
訊飛智能麥克風M2自帶免費轉寫、小語種識別和方言識別權益,也就是說在“訊飛聽見客戶端”上的轉寫操作是不必再二次付費的。
作為一家在智能語音技術方面深耕多年的公司,科大訊飛不僅讓M2支持中、英、日、韓、俄、西、越等8種國家語言轉寫,還支持粵語、四川話、重慶話、云南話、河南話等12種地方方言,以及維吾爾語和藏語,中文轉寫準確率高達98%。哪怕普通話不標準,也不必糾結語種問題。
例如現(xiàn)在選取一段真人閱讀作為拾音范本。大致原文如下:流沙、毒箭、毒蟲、險坑等等數(shù)不勝數(shù)。到了明代,受到西洋奇技淫巧的影響,一些大墓甚至用到了西洋的八寶轉心機關。尤其是清代的帝陵,堪稱集數(shù)千年防盜技術于一體的杰作。大軍閥孫殿英想挖開東陵,用里面的財寶充當軍餉,動用大批軍隊連挖帶炸,用了五六天才得手,其堅固程度可想而知。
轉寫后與原文進行對比。大部分的內(nèi)容都沒有問題,不能完美轉寫的地方主要出現(xiàn)在同音和語氣差異處,如“西洋奇技淫巧”變成了“夕陽奇跡銀翹”,“幕”和“墓”,這些問題都可以理解,同音不同字。
更換另一個播音員的聲音。引用的原文如下:聞著酒香閉上眼睛抽了抽鼻子,一臉陶醉,正他娘的香。一發(fā)狠,他走過去尋了一條唯一空著的凳子,一屁股坐下,咬著牙使出最后的力氣喊,“小二,上酒?!鄙磉叧龀腔蛘哌M城中途歇息的酒客,都嫌棄這衣著寒酸的一主一仆,刻意坐遠了。生意忙碌的店小二,原本聽著聲音要附和一聲,好勒,可一看主仆二人的裝束立刻就拉下臉了,出來做買賣的沒個眼力見兒怎么能成?
這段內(nèi)容的轉寫就很有意思,將一些不好的內(nèi)容直接簡寫為了“tnd”,但大部分內(nèi)容也都沒問題,就是標點符號無法區(qū)分,與官方所說的98%識別率相吻合。從轉寫的結果來看,人工校對的工作量很小,后期整理文檔來說很方便,會議記錄工作也能從此變得非常高效。
值得一提的是,軟件中提供了匹配關聯(lián)操作,輸入紀要文字后能夠自動跳轉到段落,在需要檢索內(nèi)容信息時相當好用,不過可惜此功能目前只支持中文。
轉寫完畢后,可以下載保存為Word文檔或txt,并自動打包成ZIP壓縮包,也可以生成二維碼或在線鏈接,便于我們輕松地將內(nèi)容分享出去。
自動字幕組掛件
由“訊飛聽見客戶端”的實時翻譯,再配合訊飛智能麥克風M2而衍生出的字幕組功能,算是一個極具特點的“學習”模式。開啟方式就在會議記錄中,多點一下“字幕模式”項。
啟用“字幕模式”后,會以字幕條的形式在屏幕上顯示實時轉寫和翻譯內(nèi)容,有點類似QQ音樂或網(wǎng)易云音樂的歌詞秀。
字幕的字體大小,顏色以及透明度可以調(diào)節(jié),位置也同樣是可以任意拖動。顯示的內(nèi)容上,可以在轉寫、翻譯、轉寫+翻譯共三種結果中切換。
如果要問能否替代字幕組的功效,那么還是有一點差距的。主要是轉寫有延后,翻譯結果也不會完美地分斷行呈現(xiàn),但如果是用來看生肉劇,發(fā)布會,課程之類的也夠用了,而且還起到了鍛煉閱讀的效果。
“字幕模式”能兼容各類音視頻、在線聊天、會議軟件等。特別是運用到當前的網(wǎng)絡授課中,掛個字幕在屏幕下方,作為翻譯助手或者題詞器使用,上課時也不必擔心教授在那里說些“云里霧里”的內(nèi)容了。課后還能回放教授錄音和保存筆記,作為課后的知識點復習用。
另外,雖然訊飛智能麥克風M2是3W的功率,但是揚聲器的外放效果倒是相當洪亮。即使最大音量也沒有出現(xiàn)破音,實屬難得。
麥克風M2外觀細節(jié)
科大訊飛智能全向麥克風M2(以下簡稱訊飛智能麥克風M2)的外包裝盒比較大,是比較有商務范的禮盒裝。
開盒后我們可以看到內(nèi)部的物件不算多,附有智能麥克風M2主體、說明書、收納包以及數(shù)據(jù)線。其中數(shù)據(jù)線是C to C與USB-A二合一設計,取下USB-A套頭即為雙C接口,算是新老設備通吃吧。
而收納包也讓我在外出攜帶時變得更方便,即便是隨意丟到背包中也不用擔心各種磕碰,考慮得很周到。
訊飛智能麥克風M2采用正方體設計,外表為一體化沖壓成型金屬面板,整體尺寸120mm x 120mm,厚度約29mm左右,給人感覺非常輕巧,也略有些商務。
實際上手后重量也確實很輕,也就罐裝可樂的重量,拿在手中或隨身放在背包中都非常輕巧。
整個表面由大面積的圓形孔洞覆蓋,只在邊緣處留有一塊放置功能按鍵。根據(jù)官方數(shù)據(jù),訊飛智能麥克風M2配備了高保真揚聲器,確保聲音能夠清晰地傳送到會議室或教室里的每一個角落。
之所以諸如手機、筆記本、平板等設備的外放音質(zhì)差,主要還是與揚聲器的體積過小有關。盡管訊飛智能麥克風M2不能替代傳統(tǒng)的音箱,但作為以上設備的會議“助手”,已完全夠用。
頂部邊緣處的四個觸摸鍵并無文字標識,從左至右依次為音量減、通話按鍵 、靜音鍵以及音量加。在操作邏輯無任何問題,并且勝在功能簡單,屬于一看即可上手的那種。
此外,在按鍵的邊緣處還設計有狀態(tài)指示燈條,我們可以通過燈條的不同顏色來掌握當前的工作狀態(tài)。例如訊飛智能麥克風M2在藍牙連接狀態(tài)時是藍色燈常亮,有線USB連接時則為淺藍色,麥克風關閉狀態(tài)為紅色常亮……整體還是比較直觀的。
值得一提的是,訊飛智能麥克風M2支持無線藍牙和免驅有線連接,即插即用,連接過程相當方便。而內(nèi)置的2500mAh容量電池,可為訊飛智能麥克風M2在無線狀態(tài)下維持15小時工作時長,即便每次開會2小時,也能滿足一周一充。
為了確保拾音的清晰度與范圍,訊飛智能麥克風M2在機身的四個圓角處各設有一枚麥克風,組成4陣列麥克風配置,其拾音半徑可達5米。這對于普通的會議室或教室來說已算是全覆蓋了,而且是360°無死角拾音,能確保每個角落的發(fā)言和聲響都能被清晰拾取和收錄,不必擔心會錯過談話細節(jié)。
再配合內(nèi)置的專業(yè)數(shù)字信號處理(DSP)芯片+智能降噪算法,通過人聲增益、噪聲抑制和回聲消除等技術,有效地提升了通話質(zhì)量。在我實際使用過程中,并無嘯叫、環(huán)境聲過大、含糊不清等問題。
在機身的后側設有電源鍵、藍牙鍵、狀態(tài)指示燈和Type-C接口。其中接口承載了數(shù)據(jù)傳輸與充電的作用,支持邊充邊錄。
底部為大面積的硅膠腳墊覆蓋,可提供不錯的摩擦力,讓麥克風在拾音時更加穩(wěn)定。畢竟工作環(huán)境還是比較多變得,可能是木質(zhì)桌面,也可能是光滑的玻璃表面,擺放不穩(wěn)定時會為拾音過程帶來許多不確定因素,從而導致錄質(zhì)的效果不佳。
寫在末尾
作為一款拾音類產(chǎn)品,訊飛智能麥克風M2用在會議記錄中有奇效,不僅會議內(nèi)容能夠全程記錄,還能分段分人物輸出文字,讓后續(xù)的會議內(nèi)容整體變得十分高效。從實際的拾音效果來說,5米內(nèi)的范圍都能正常完整錄制,沒有人聲模糊,錄音質(zhì)量低劣等問題。
關于訊飛智能麥克風M2的應用方式,并不局限于會議場景中,對于我們這種培訓機構或者是有涉外工作內(nèi)容的用戶來說,也非常實用。例如在網(wǎng)絡授課過程中記錄教授的上課內(nèi)容,通過轉寫功能高效地完成課后筆記,最主要是可以經(jīng)由轉寫內(nèi)容跳轉到音頻段落,聽不懂聽不明白的地方都可以在課后復習,也算是變相的開小灶了。
當然,訊飛智能麥克風M2也有令人不滿意的地方,例如對于無網(wǎng)絡環(huán)境時只能作為音箱使用。簡單說,訊飛智能麥克風M2是麥克風類產(chǎn)品,主打的是優(yōu)質(zhì)拾音,遠距離收音,客戶端免費轉寫,高效會議記錄和智能字幕模式等。我是尼古拉斯lalala。