靈雲

靈雲

靈雲 是一種可以用語音、手寫、拍照,手勢,將來甚至可使用腦波識別等智能手段來操作、感知手機、計算機等數字設備的網路雲服務,讓人機交互像人與人溝通一樣的簡單自然!

簡介


靈雲是一種可以用語音、手寫、拍照,手勢,將來甚至可使用腦波識別等智能手段來操作、感知手機、計算機等數字設備的網路雲服務,讓人機交互像人與人溝通一樣的簡單自然!靈雲由北京捷通華聲語音技術有限公司創造推出,是全球第一個感知雲!
靈雲平台是基於雲計算技術和分散式存儲技術,將TTS、ASR、OCR、 HWR、MT等HCI技術全面整合的綜合智能雲服務平台。
通過移動網際網路、網際網路隨時隨地享受靈云為您提供的“聽、說、讀、寫、譯……”等全方位的智能人機交互技術服務。

平台技術


靈雲所提供的HCI技術可以為人與機器之間的交流,提供更加智能和人性化的操控方式,改變原有的通過滑鼠和鍵盤,並以眼睛為主要操控手段的控制方式,這是繼微軟推出windows開創視窗時代,蘋果推出iPhone開創觸控時代之後,又一個全新的智能人機交互時代的來臨。
在這個嶄新的時代,人們操控數字設備的方式得到了革命性的改變,鍵盤滑鼠不再是唯一的交互與控制方式,以語音、手寫為代表的HCI技術將逐漸取代鍵盤和滑鼠在網際網路時代的絕對地位,作為獲取信息最重要的人體器官——眼睛,將得到前所未有的解放。人們可以通過語音、手寫來完成相應的控制工作,眼睛將會獲得更多的信息,從而讓設備產生更大的生產力,帶來更大的娛樂價值和學習價值。
靈雲使用了全球最好的HCI技術,並將之按照人類最自然的方式,以雲+端的方式提供給用戶。為終端用戶提供HCI技術雲服務,包括語音合成雲服務(TTS)、手寫識別雲服務(HWR)、文字識別雲服務(OCR)、語音識別雲服務(ASR)、自動翻譯雲服務(MT)等。
靈雲是一個應用於網際網路和移動網際網路的HCI技術雲服務平台,其主要目標是:
1) 實現可面向網際網路及移動2G/3G網路提供HCI雲服務的伺服器,在捷通華聲現有技術條件的基礎上為移動終端應用程序提供多路併發的語音合成、手寫識別、文字識別功能,通過架設在網際網路的雲端伺服器,用戶可以隨時隨地獲得高質量的HCI技術雲服務;
2) 實現基於移動終端以及桌面平台的HCI技術應用客戶端,提供統一的HCI技術應用開發介面,通過該介面用戶可以方便、快速地開發語音應用;同時,靈雲也將開放一些基於移動以及桌面平台的HCI技術應用,用於展示靈雲平台的功能和使用方法,讓用戶直接體驗到最新HCI技術的魅力。
靈雲提供了架構於網際網路的HCI技術雲服務,以及一套移動網際網路HCI技術解決方案、應用示例,把HCI技術服務的應用範圍拓寬到移動網際網路領域,為HCI技術服務產品走向移動網際網路市場開闢全新的應用模式。
靈雲系統採用分散式架構,可以滿足行業級應用的高可靠性、高可用性要求。針對傳統HCI技術應用集成開發困難,業務設計繁瑣的問題,靈雲產品大大簡化了集成開發和業務開發的複雜度,為系統集成人員和業務開發人員提供了便捷、高效的開發環境。
“靈雲”平台的雲服務帶來的一個重大變革是從以設備為中心轉向以技術服務為中心。硬體的過時,應用軟體的過時,在雲上都不再是一個問題,只要有網際網路或移動網際網路,就可以享受到多種多樣、高質量、免更新打擾和個性化的HCI服務。現有的“靈雲”平台支持TTS(語音合成)、ASR(語音識別)、HWR(手寫識別)、OCR(圖像識別)、NLP(自然語言處理)等多項HCI技術,並在持續更新性能和添加其他的功能。
“靈雲”是為用戶提供HCI智能人機交互服務的平台,它拉近了用戶與機器之間的距離,簡化了用戶獲取信息的方式。在網際網路已經普及的今天,“靈雲”更將滲透到每一個角落。想讓機器與人溝通變得更加靈活、自然,“靈雲”便是最好、最適合用戶的選擇。“靈雲”讓人的五官感知從10米以內延伸到整個世界!
靈雲能力
靈雲能力

系統架構


靈雲平台由平台分散式服務節點、業務運營支撐系統、開發者社區組成。基本架構圖如下所示:
1.分散式服務節點:

物理架構


隨時隨地享受靈云為您提供的“聽、說、讀、寫、意……”等全方位的智能人機交互技術服務。
物理架構
物理架構

特點


一站式解決
靈雲平台是一個綜合性的智能人機交互雲服務平台,可以提供TTS、ASR、HWR、OCR、NLP等多種智能人機交互技術服務,使用者可以在靈雲同時獲得多項服務支撐,一站式解決了需要到不同智能人機交互技術提供商獲取服務的繁瑣過程,讓智能人機交互技術簡單化,實用化。
一站式解決
一站式解決

能力介紹


TTS(語音合成)技術
捷通華聲的TTS技術在國內處於領先水平,產品市場佔有率達50%,金融行業市場佔有率達80%,並且在高鐵各站點、奧運會、世博會等多個大型項目中得到成功應用。
捷通華聲TTS可以提供中文引擎、英文引擎,以及其他語種引擎以及提供通過大規模錄音數據的處理而形成的語音資料庫。
ASR(語音識別)技術
語音識別,就是讓機器通過分析和理解過程把語音信號轉變為相應的文本或命令的尖端技術。語音識別是一門交叉學科,所涉及的領域包括:信號處理、模式識別、概率論資訊理論、發聲機理和聽覺機理、人工智慧等等。語音識別技術與語音合成技術一同成為實現人機語音通信,建立有聽和講能力的語音系統所必需的兩項關鍵技術。
捷通華聲ASR核心引擎是針對特定語言的識別軟體模塊,該軟體模塊是整個ASR軟體的核心模塊。核心模塊接收其他模塊的設置,並根據設置內容對語音數據進行識別,並將識別結果列表返回給調用模塊。返回的識別結果列表,包含一組識別結果--識別信心值對,以供調用模塊使用。
靈雲
靈雲
OCR(光學字元識別)技術
OCR(光學字元識別),是通過圖像處理和模式識別技術對光學的字元進行識別的意思,是自動識別技術研究和應用領域中的一個重要方面。OCR主要是指文字識別軟體,它是一種能夠將文字自動識別並錄入的軟體技術。
捷通華聲OCR核心引擎是針對特定語言的識別軟體模塊,該軟體模塊是整個軟體的核心模塊。核心模塊接收其他模塊的設置,並根據設置內容對文字圖片數據進行識別,並將識別結果列表返回給調用模塊。
HWR(手寫識別)技術
手寫識別,是指將在手寫設備上書寫時產生的有序軌跡信息化轉化為漢字內碼的過程,實際上是手寫軌跡的坐標序列到漢字的內碼的一個映射過程。
捷通華聲HWR以先進的識別演演算法、多核融合技術、大容量字典裁減壓縮技術、高性能字元切割演演算法和語言模型技術為基礎,是一種能夠在任何時間、任何地點,向任何人實時、準確地提供手寫識別服務的高效便捷手段,非常符合信息時代動態更新和個性化查詢的需求。
NLU(自然語言處理)技術
自然語言處理(Natural Language Understanding,簡稱NLU)技術,涵蓋領域非常廣泛,包括句子檢測,分詞,詞性標註,句法分析,文本分類/聚類,文字角度,信息抽取/自動摘要,機器翻譯,自動問答,文本生成等多個領域。
捷通華聲利用多年來在語音語義數據和演演算法方面的積累,推出了自己的自然語言處理技術,並適時推出了利用自然語言處理技術的智能客服、智能意圖控制等產品。這些產品在市場上得到了廣泛應用,業務涉及通訊、政府、電子商務、智能家電和汽車等行業,在智能人機交互(文本、語音等)領域處於行業領先地位。