成人av在线资源一区,亚洲av日韩av一区,欧美丰满熟妇乱XXXXX图片,狠狠做五月深爱婷婷伊人,桔子av一区二区三区,四虎国产精品永久在线网址,国产尤物精品人妻在线,中文字幕av一区二区三区欲色
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    特寫 正文
    發私信給游瑞
    發送

    12

    錄音轉文字,聽道可能成為速記終結者嗎?

    本文作者: 游瑞 2015-12-02 09:14
    導語:機器替代人工速記,有何不可。

    在很多重要的場所或者對話過程中,需要用到速記,它的特點就是記錄速度快、效率高,可以用比漢字快三倍以上的書寫速度來記錄別人的對話。但速記畢竟是個技術活,不是人人都可以輕松掌握的一項技能,另外專業速記人員不好請(現場速記略貴)也是一個不爭的事實,所以在很多場景下,將現場錄音轉交速記人員轉錄成文字成了不二之選。

    那么將錄音轉錄為文字,能不需要人工嗎?將語音轉化為文字,對目前的技術而言并非難事,很多語音助手都有較高的語音識別度,就連微信也能直接將語音翻譯為文字,就更別說那些能支持語音輸入的輸入法們,所以要將將錄音轉為文字,是可以讓機器完成的。

    90后創業團隊聽道在做就是這個,用創始人董建成自己的話說就是“我們自己的‘初心’就是讓更多需要技術來解決問題的人能用得上高新技術,而不是讓技術成為擺設,有困難的人還是得不到解決,所以我們定位是在技術層到應用層的企業“。錄音轉文字,聽道可能成為速記終結者嗎?

    雷鋒網:語音識別技術是自己做的嗎?

    董建成(公眾號:ting dao):目前采用的語音識別技術雖然不是自己做得,但也不是哪一家的,而是同時選用了多家語音識別的技術。之所以不自己做,是這塊如果沒有個一二十年的積累,肯定是做不出來的,尤其是對于小團隊來說,第一沒這個能力做,第二即便現在去做,也做不過別人。

    選擇多家技術的糅合也不是沒有章法的,經過研究對比,我們發現每個引擎(語音識別技術)都有自己擅長處理的一個領域,有的善于處理KTV環境下的錄音,有的對大馬路上的錄音處理效果好,不同環境下,不同領域內的詞匯偏重,都會影響最終的轉錄效果。

    降噪部分我們自己做,有單獨的算法,不但降噪還能自動把每句話是時間點精確地自動地切分好,提高識別效率,不過音源肯定是清晰度越高越好,因為即使有降噪,也會降低識別準確度,音源清晰發音清晰最好

    我們還能通過對錄音環境的甄別,領域的劃分,對比結果后選擇最好的文字呈現給用戶,但是對于口音暫時沒有自動區分。引擎與最終結果的選擇,是系統自動完成的。

    雷鋒網:讓電腦自己去做對比選擇,這是怎么做到的?它如何去判斷這個錄音是在KTV里面錄的還是在大馬路上錄的?它又怎么能知道這個錄音說的是科技領域內的東西還是娛樂圈里面的?

    董建成:首先在噪音處理這塊,是我們自己做的,所以通過噪音的頻譜以及響度可以大概區分出來是處于哪個環境,然后再去初選引擎。

    每個引擎會對自動的對自己識別的結果給出一個評分,也就是置信度,分數越高表示結果越準確,所以置信度的高低決定了最終會選用哪個結果。

    最終的結果還會跟用戶修改后的文字進行對比,一并收納進大數據庫。若下次再在遇到同樣的結果時,就能直接在我們這邊直接給出更符合用戶需求的文字。

    雷鋒網:你們跟這些引擎之間有協議嗎?

    董建成:引擎方提供SDK,其中包含了使用協議,而我們則是直接使用他們的API做了一個應用,即便是用于商業化也沒有問題,微信就是這樣做的。

    雷鋒網:你們的轉化率如何?

    董建成:主要是出于兩點考慮,第一個就是之前所說的通過不斷地收集修改前后的文字對比,來完善最終文字。另一點的話,就還是通過選擇多種引擎來提供最為合適的結果。

    錄音轉文字,之所以轉化率低,不是因為引擎不行,而是錄音這一塊出的問題會比較多。很多引擎說自己的轉化率能達到95%或者99%,其實也沒錯,不過前提是錄音清晰的情況下。

    用微信說話的時候,一般都是拿著手機講,距離比較近,所以轉錄效果非常好。而正常錄音的話,一般距離較遠,環境也會更加復雜,這樣一來就容易造成錄音不清晰,噪音比較大。

    未來,我們可能推出自動定向的錄音麥克風,采用四點麥克風陣列,誰在說話時就調整陣列,只收集說話人的聲音,算法我們已經驗證過了,可行,效果也可以。

    錄音轉文字,聽道可能成為速記終結者嗎?

    雷鋒網:與錄音寶如何競爭?

    董建成:錄音寶做到比較好的地方是能實時錄音,能夠顯示錄音時的地址,按時間軸存儲文件,一件轉錄文字,也可以一鍵導出音頻與文字。但錄音筆實際上是偏重于日常生活,對于處理工作中一小時,兩小時的長時間錄音的話,它就不是那么方便。比如說,在一段很長的錄音文件中,中間可能有一段錄音是不需要的,但是卻沒辦法刪掉,只能導出來之后,手動修改。

    而在我們的網頁版上,就能在導出之前勾選你說需要的或者不需要的內容。而且能夠就這每一句話聽錄音編輯修改轉錄出來的文字。另外一個就是,我們轉錄出來的文字是帶有時間節點的,可以直接生成字幕格式。比如說,你要發布一個視頻,那么你就不要再去配字幕了,直接就能用。

    我們的定位主要是專業軟件,能夠多平臺同步處理,只要錄音文件上傳到了云端,那么用戶無論是在家還是辦公室,只要打開這個軟件,就能繼續編輯,這樣的話,就能不受限于工作地點與電腦。我們不是純做技術,我們是底層技術研發和解決用戶實際問題之間的橋梁,是為了將現有的技術真實用來解決用戶實際需求的。

    對于文字的編輯這塊,我們也有獨特的地方,比如說對每一句話的起點與終點劃分,十分準確,而且是修改哪一行,就能播放哪一句聲音。如果在文字內容修改時按回車,不僅文字內容會拆分,音頻內容也會自動分段,依據是語音與文字對應的頻率,還有時間點。其他基本的文字編輯功能與技巧與常有的WORD差不多。

    雷鋒網:你們會代替速記這個工種嗎?

    董建成:將來發展是有可能替代速記的,但會很久,目前是幫助速記。

    就目前的平臺處理速度而言,一小時的文件,需要10分鐘才能出稿。以后,會采用分段處理的方式,將一段錄音分解成無數小段,同時轉錄,雖然會消耗服務器大量的計算能力,但能保證一小時文件一分鐘左右完成轉錄。

    小結

    從成本身而言,現在人力成本太高,請一個速記人員到現場除了要按字付錢之外,還得額外給出勤費,按日計算的。時間成本也高,現場速記可不是當場結束就能當場給出的,速記人員還得回過去校隊一次,要不然很多東西是看不懂的,而錄音給速記人員去轉錄文章的話,1小時的錄音最快也得花一小時轉錄出來。

    機器轉錄的話,目前基本上都是免費的,以后收費也可能是在精度,處理速度與存儲空間上做文章,所以不用太擔心。時間現在差一點的一小時文件可能上傳,轉錄,導出算一起不到20分鐘的樣子,未來會更快。至于,轉化率的問題,人工速記的精度并高,還是需要用戶再次校對,那么隨著機器轉錄的置信度的提高,需要用戶校對的地方也只會越來越少。

    人工速記定會被機器取代,這一點是可以確定的,但這個速記終結者是不是聽道,就不要一定了,或許是引擎們的可能性更大。

    雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知

    分享:
    相關文章

    編輯

    雷鋒網上海新聞中心,編輯。關注智能硬件、汽車科技,致力創業者服務,微信號:OI23432。
    當月熱門文章
    最新文章
    請填寫申請人資料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說