国产 亚洲 中文字幕 久久网

    1. <center id="6zswr"></center>

    <code id="6zswr"><small id="6zswr"></small></code>
    <del id="6zswr"><small id="6zswr"></small></del><big id="6zswr"><em id="6zswr"></em></big>
    1. 
      

        <center id="6zswr"><em id="6zswr"></em></center>
        <th id="6zswr"><option id="6zswr"><progress id="6zswr"></progress></option></th>
      1. <center id="6zswr"><em id="6zswr"><track id="6zswr"></track></em></center>
      2. <object id="6zswr"></object>
      3. 免費試用

        免費預約解決方案專家

        預約解決方案專家,一對一為您服務

        億歐專訪丨建十億級聲紋庫!快商通李稀敏分享聲紋如何“治騙”

        2018-04-25 18:44  未知    閱讀:

        李稀敏博士專訪|一文看懂時下最火的聲紋識別技術

        人的聲音各有不同,我們用耳朵就能分辨出周圍人聲音的不同,但這樣的“不同”該如何呈現出來呢?第二次世界大戰后期,貝爾實驗室研究和發明了“音響光譜圖像顯示器”,把聲波用光譜圖像加以顯示,這樣的圖像稱為語譜圖,后來又命名為聲紋。

        通過可見的語譜圖,貝爾實驗室實現了人工說話人識別。上世紀60年代,貝爾實驗室又提出了基于模式匹配和概率統計方差分析的說話人識別方法,此后聲紋識別技術得到快速發展,從單模板模型發展到多模板模型,從模板模型發展到矢量量化模型、高斯混合模型、隱馬爾可夫模型,再到人工神經網絡……

        21世紀以來,“聲紋識別技術主要有3次突破。”李稀敏說。李稀敏是清華大學在職博士,人機對話與聲紋識別領域資深專家,同時他也是廈門快商通科技股份有限公司的AI研發中心總監、快商通聲紋研發團隊的核心成員。

        聲紋識別技術的三個分水嶺

        除了上述的身份外,李稀敏還是一名知乎“樓主”,他開通的 “聲紋識別的應用實踐”專欄,詳細介紹了聲紋識別的技術、資源、應用等,目前還在不斷更新中。在接受億歐采訪時,為了便于理解,李稀敏將近年來聲紋識別技術的發展總結為3個分水嶺。

        李稀敏博士專訪|一文看懂時下最火的聲紋識別技術

        (近年聲紋識別技術發展的3個分水嶺)

        第一個分水嶺是2000年。在2000年以前,進行聲紋識別驗證,主要是基于模板匹配,這種算法基于信號比對,通常要求比對雙方的內容相同,比如要驗證說“床前明月光”的人是誰,那驗證人也必須要說“床前明月光”才能驗證,如果他說“疑似地上霜”的話,驗證就不能完成。2000年以后,開始出現基于高斯混合模型的聲紋識別算法,高斯混合模型是典型基于統計學習理論的方法,該算法采用大量數據為每個說話人訓練模型,使用高斯混合模型驗證已經與文本無關了,即要驗證“床前明月光”的說話人時,說“疑似地上霜”也能夠驗證成功。之后產生的許多主流研究方法都是在高斯混合模型的基礎上改進的,但高斯混合模型注冊語音的時間過長,無法滿足實際應用場景的需求,因此需要新的技術來突破限制。

        第二個分水嶺是2010年左右,這時候出現了iVector/PLDA算法。iVector最大的亮點在于,把語音映射到了一個固定的且低維的向量上,這意味這所有機器學習的算法都可以用來解決聲紋識別的問題了,因此這是一個巨大的進步。PLDA是一種信道補償算法,因為在iVector中,既包含說話人的信息,也包含信道信息,而我們只關心說話人的信息,所以才做信道補償,目前PLDA是最好的信道補償算法,但噪聲對結果依然有很大的影響。

        第三分水嶺是在2011年,在第十一屆全國人機語音通訊學術會議上,鄧力分享了他在微軟DNN-based speech recognition的研究結果,將識別率提升了30%,這將聲紋識別的準確率一下子提升了一個層次。DNN能從大量樣本中學習到高度抽象的說話人特征,并對噪聲有很強的免疫力,至此深度學習被引入業界,國內對聲紋識別技術的關注點也放到了深度學習上。

        聲紋識別在公共安全領域大有用途

        將深度學習引入聲紋識別領域后,經過了幾年的發展,目前聲紋識別技術已經相對完善,那么聲紋究竟可以怎么用呢?相對于其他身份認證方式,聲紋識別具有易采集、非接觸、高可靠等特點,操作簡單,且驗證內容可變化,因此在公共安全領域大有用途。

        “最重要的一個應用場景是電信反欺詐。”李稀敏說,電信詐騙是通過電話、網絡或短信的方式編造虛假信息,設置騙局,是一種非接觸性的詐騙。根據相關統計,超過50%的電信詐騙是通過打電話進行的,“所以電話是重災區,”李稀敏說:“而聲紋識別也是一種非接觸式的方法,可以直接在電話里就識別出說話人的身份,有效減少電信詐騙的發生。”目前快商通聲紋已經與公安局、電信公司展開合作,建立了動態聲紋數據庫,支持十億級聲紋庫實時檢索,能夠快速進行1:N大規模檢索。“十億差不多就是中國網民的數量,目前能支持這個級別的聲紋實時檢索的,我們是業內首家。”李稀敏告訴億歐。

        在公共安全領域,除了電信反欺詐外,司法社區矯正也是聲紋識別的一個典型應用場景。社區矯正是指針對判處管制、宣告緩刑、裁定假釋、暫予監外執行這四類犯罪行為較輕的對象所實施的非監禁性矯正處罰。盡管我國從2009年開始在社區矯正中啟用信息化管理手段,但實際操作中仍存在脫管、漏管現象,“采用聲紋對矯正人員身份進行驗證,可以有效解決‘人機分離’的問題。”李稀敏說,而且只需通過電話即可完成驗證,這極大地降低了司法所的工作強度,對矯正對象而言,這樣的方式也更能體現出對人格的尊重,有助于其順利回歸社會。

        解決借貸黑中介的良方

        除了公共安全領域外,金融領域也對聲紋識別有著強烈的需求,“特別是在金融借貸方面。”李稀敏介紹道,在消費金融行業,大部分壞賬來源于黑中介主導的產業鏈式詐騙,黑中介利用社交媒體、路邊小廣告等騙取借款人信任,以協助辦理貸款為名,提供全套虛假貸款資質證明材料。因此如何在審查環節及時鑒別出黑中介,成為降低消費金融公司壞賬率的關鍵因素,“聲紋識別就是一種很好的辦法。”

        日前快商通聲紋與國內某民營金融集團上線了聲紋信貸反欺詐系統,目的就在于用聲紋識別出黑中介,降低金融公司損失,目前快商通已取得聲紋反欺詐在金融領域應用的專利證書。

        李稀敏介紹道,當貸款訂單進入電核環節,系統會自動提取聲紋并與系統黑名單做對比,同時與最近的或同區域訂單的聲紋做交叉對比,如果命中黑名單,或發現重復的聯系人信息,系統則會提示該人有重大欺詐嫌疑。

        李稀敏博士專訪|一文看懂時下最火的聲紋識別技術

        (快商通聲紋信貸反欺詐系統架構)

        “當時在打造這個系統的時候,如何在誤報和漏報之間找到平衡點,是一個難題。”李稀敏說,誤報和漏報就像是一個蹺蹺板的兩端,如果漏報率高了,誤報率就會降低,反之亦然。“問題就在于,如果漏報率太高了,抓不住黑中介,那么這個系統就失去意義了;但如果誤報率太高,那么這個系統的報警系統會響個不停,這也是不現實的。”最終,快商通聲紋團隊根據實際應用需要,將該系統的誤報率降到萬分之五以下,漏報率控制在20%左右。

        快商通聲紋業務將迎來井噴式增長

        雖然目前聲紋識別已經能在多個領域落地應用,但聲紋識別技術仍面臨著許多挑戰。其中一個比較常見挑戰是跨信道的識別,李稀敏說,不同的設備、傳輸通道會造成信道的不同,不同的信道有不同的噪音,編碼方式也存在差異,因此給聲紋識別的算法加大了難度。除此之外,還有語音合成、口音變化等問題也會給聲紋識別帶來挑戰。

        李稀敏博士專訪|一文看懂時下最火的聲紋識別技術

        (快商通聲紋識別結構圖)

        “所以我們也一直在想辦法提升自己的技術水平。”而要想有技術的成果,人才是關鍵。李稀敏告訴億歐,最近一位全球語音領域的權威專家加入了快商通聲紋團隊,擔任公司首席科學家,負責人才培養及公司戰略布局指導等工作,這位專家曾擔任過全球自然語言處理和計算機語言學領域的國際頂級學術會議ACL和語音通信領域的國際頂級學術會議InterSpeech的大會主席。

        快商通聲紋研發團隊核心成員100%具有國內外名校博士學位,目前通過快商通聲紋引擎建立的聲紋模型數已超過五千萬,在穩定性、識別率和處理速度上處于業界領先位置。

        “今年是投資聲紋識別的元年。”李稀敏認為,國內的聲紋識別還處于起步階段,隨著技術的成熟,未來聲紋識別將在越來越多的領域得到應用,“我預計今年快商通聲紋的業務會有井噴式增長。”李稀敏透露,今年快商通聲紋將繼續深耕公共安全和金融安全兩大重點領域,進一步推進聲紋在這些領域的應用。

        “當然,我們AI研發中心也不是只做聲紋。”李稀敏告訴億歐,快商通正在籌備一個開放平臺。“現在用戶更希望企業能提供一籃子的解決方案,不想把服務器放在自己那里,而是在需要的時候,調用云上的接口。”李稀敏告訴億歐,目前該平臺只是各個研發組算法的集成,尚未完全開放,但未來快商通會看準需求爆發的時機,真正開放這個平臺。而未來依托這個大的開放平臺,快商通的聲紋業務也許會有更大的發展空間。

        (內容來源:億歐,唐鈺婷)

        權威認證

        ISO27001信息安全管理 高新技術企業 CMMI3

        聯系我們

        服務熱線:400-900-1323

        售后QQ:800054885

        地址:廈門市集美軟件園三期B20棟11-13層

        掃碼關注微信公眾平臺

        僅需10秒,立即免費試用!
        企業
        行業
        • 請選擇行業
        • IT/通訊/電子
        • 電商行業
        • 互聯網
        • 房地產/建筑業
        • 工藝美術
        • 婚紗攝影
        • 交通/運輸/物流/倉儲
        • 教育行業
        • 金融業
        • 旅游/餐飲/娛樂/休閑/購物
        • 貿易/批發/零售/租賃業
        • 能源/礦產/環保
        • 農、林、牧、漁業
        • 生產/加工/制造
        • 食品業
        • 文化/傳媒/體育
        • 醫療/美容
        • 醫藥行業
        • 政府/非盈利機構
        • 咨詢業
        • 醫療行業
        • 服務業
        • 其他
        ×
        ×
        国产 亚洲 中文字幕 久久网
        1. <center id="6zswr"></center>

        <code id="6zswr"><small id="6zswr"></small></code>
        <del id="6zswr"><small id="6zswr"></small></del><big id="6zswr"><em id="6zswr"></em></big>
        1. 
          

            <center id="6zswr"><em id="6zswr"></em></center>
            <th id="6zswr"><option id="6zswr"><progress id="6zswr"></progress></option></th>
          1. <center id="6zswr"><em id="6zswr"><track id="6zswr"></track></em></center>
          2. <object id="6zswr"></object>