2010-06-25

Google Voice Search

Google Search 應該已經成為很多人生活的一部分(不要用 Yahoo 的啦,已經被置入性行銷、多給點錢就可以讓搜尋結果排前面一點),Google 甚至變成了一個新的「動詞」,代表的是上網搜尋某項資訊。自從手機能夠上網之後,除了那些會主動透過網路更新的服務(氣象、股市、郵件和行事曆),或是需要時才打開的 LBS (Location-based Service,根據你所在位置提供附近的相關資訊服務),最常用的還有上網搜尋。像是看到某個想買的東西,能上網就會習慣上 Y 拍或 PChome 比價;想吃東西看到某家餐廳,會想 Google 一下看有沒有食記推薦或評價;玩耍臨時要找住宿或景點,以前是打給同學上網幫忙查電話地址,現在隨時能在幾秒內自己找到,手機加上能網路搜尋,真的是給出門在外又很隨性的人很大的方便。不過仍有一點點麻煩的是:要敲入搜尋的關鍵字,輸入還是要多花一點時間,要叫出虛擬鍵盤、用輸入法敲入字符和選字,雖然才又多花幾秒,但如果能偷懶、不用敲鍵盤用「說的」,當然就更棒啦~

回到主題,語音辨識對中文來說一直有些難以突破的障礙,因為每個人取樣、聲音高低和腔調都不同,中文裡還有破音字及一些通用說法,長久以來都缺乏有效和正確的識別方式。最有名常見的是 IBM 的 ViaVoice,不過麻煩的是使用前還要先「學習」、強迫使用者唸個一狗票句子,辨識率才能提高到勉強能接受的程度,而且要建立很多取樣規則和資料庫,用越久正確率才會越高。說實話,對掌上型裝置來說(尤其是手機),輸入時還要叫出輸入法和鍵盤實在不方便,能透過語音輸入才是王道啊~但基於當下識別技術的瓶頸,要完全取代鍵盤不大可能,可是如果只拿來做搜尋的關鍵字輸入,感覺起來就還算可行了。因此 Google 把這個想法和他們專長的 Google Search 相結合,並鎖定使用的平台在手機上(電腦上應該只有不會敲鍵盤的人會用吧),一年多前先推出了實驗性的 Google Voice Search,剛推出只支援英文,在技術越來越成熟後,再搭配現在最火紅的「雲端技術」,終於在這個月推出了其他的語言版本(包含正體中文),在手機上優先支援和完美整合的,當然是 Google 的 Android 平台,透過更新,手機上的 Google 服務就能直接用語音搜尋啦!不管是單純的輸入關鍵字上網搜尋、還是在 Google Map 裡面找地址、或 Google 翻譯裡查單字,這些比較短的字串輸入,直接用嘴巴唸的就好啦!

直接在手機桌面就可以用語音進行 Google 搜尋、在 Google Map 裡面找地址一樣可以用

上面提到,傳統的語音辨識技術,不是要學習、建立樣板、還有比對資料庫嗎?在手機上有限的儲存空間和運算能力,怎麼解決以上的限制哩?這就要扯回剛剛講到的「雲端技術」啦!當使用者說出一段話,Google Voice Search 取樣完會送上 Google 的伺服器,用 N 台的伺服器幫忙做分析和運算,再和 N 台儲存設備裡的聲音樣板和資料庫比對,最後把結果送回你的手機,看似複雜但能在一瞬間靠一堆設備串接完成的技術,這就是「雲端」啦~和傳統方法類似的是,只要用的人越多、取樣和比對資料庫越大,辨識的速度和效果就越棒,這可不是一般傳統的「語音辨識軟體」的做到的啊!

最早揭露中文語音輸入(在北京、用的是簡體中文)到正式推出約莫半年,正體中文的 Voice Search 最近也悄悄地在 Android 上推出了(只支援 Android 1.6+,還好我刷韌體到 2.1 了),速度還不錯、而且是免費的!雖然我用的感覺、辨識效果還 OK 而已,但可以預期的是辨識率應該會越來越好,目前附加功能還比不上賽微的語音辨識(人家有語音命令、撥號、搜尋和字典),但看在其免費和與 Google 服務的整合,Google Voice Search 後勢還是看漲啊!

回應: 1

匿名 提到...

Hi 你好,
因為這裡在貼文討論iPhone上的語音辨識相關主題,所以小弟假設你們有興趣更多語音辨識相關技術與產品.. :) 如果造成困擾,請包涵...

http://www.wretch.cc/blog/VoacLtd/7464988
http://itunes.apple.com/tw/app/id399744584?mt=8

語音輸入行事曆 你的貼身秘書
瀚語科技 讓你說了算

大事記得,小事忘記…美其名是不拘小節…嚴格說來是記性太差,或甚至於行事不solid.無法給人值得倚靠與信賴的印象… 但,你每天那麼忙,事情那麼多,怎麼有可能記得所有事?!那,怎麼辦? 瀚語科技知道你的苦~

以下的情境,你一定遇到過,而且搞不好常常遇到,天天遇到~但苦無解決之道…
- 當你在開車時,剛好客戶打電話約你下星期六早上6點打球,你要怎麼輸入這件事到手機行事曆裡,以避免忘記?車停在路邊,然後慢慢輸入到手機?不可能…下車後,記得要輸入?!下車後,往往趕著去另一個地方…通常,就這麼忘了…
- 洗澡時,發現沐浴乳快沒了,明天出門得去買才行…這種小事,明天真的會記得嗎? 總不可能連這種小事也要輸入行事曆以避免忘記吧? 在這種情況下,一則你現在發現然後馬上去買,不然想要改天再順便去買,真的買到手不知道何年何月…
- 回家後,家裡一片漆黑,又被台電斷電了…老婆幾個禮拜前就交待 "記得到便利商店繳電費",結果每次到7-11,總是只買一包菸,好像有件事沒做,卻總是想不起來…回到家老婆問起時,才想起這件事…
- 睡覺前想起,同事已經提醒幾次要把向他借的書帶去還他,起床後匆匆忙忙出門,看到同事時,又只能擺出一張愧對的臉…

你是不是常常習慣性回想… "我好像有件事還沒做?"
生活與工作上的大事,你會花時間慢慢利用手寫輸入或注音輸入到手機的行事曆裡,以做好時間分配與事件管理.但,如果重要的事因為當時不方便輸入,而後不小心忘記了呢? 此外還有一堆生活上的小事,你大概都不會大費工夫的慢慢記錄在行事曆裡.為什麼?..."因為輸入真的好麻煩!我想我會記得…"但實際生活經驗告訴你,你總是會忘記那些小事…直到小事變大事~

你,到底可以記住多少事? 你沒那麼勤勞的輸入每一件事到手機的行事曆裡…但不這麼做,你又怎麼可能記得工作與生活上的一切?你,是不是曾經期待有個秘書隨身跟著你,可以替你記錄你生活中的所有大小事,讓你成為一個solid的人?

語音輸入行事曆,就是你的貼身秘書!
你只要開口告訴他,他就準確、忠實、完整的替你記錄你生活、工作上的大小事!透過瀚語語音輸入行事曆,若你想輸入一個事件到行事曆裡,你只要click button 3次,你就搞定了! (如果依照傳統的方式輸入事件到手機的行事曆,你必須click botton至少100次! 難怪你不想輸入!)


讓你在哪裡都可輕鬆的輸入,準確的辨識!
你以前也許有用過類似語音輸入的電子產品(如手機上有查找通訊錄的功能),但總覺得很難用,而後放棄不用…因為即便在安靜的環境下對著機器大吼個三遍,他還是辨識錯誤!倒不如慢慢按按鈕還比較快.瀚語科技的語音辨識系統,只要你用正常講電話的方式進行語音輸入,即便你在吵雜的大馬路上,即便你在充滿悅耳音樂的車裡,瀚語語音輸入行事曆依舊可以準確的辨識出正確的結果!真有這麼神奇? 承襲國內最高學府/研究機構的基礎,超過8年以上關於語音辨識系統抗噪技術的研發,讓這一切變得可能!

一個你可以信賴,依靠的好幫手!
當你下載使用後,你或許會有疑問…為什麼只辨識日期,為什麼不能將我所敘述的事件也轉成文字而後記錄下來? 因為瀚語科技相信,如果無法將辨識準確率提升到一定的程度,那你不會信賴此系統,你也不會依賴此工具.而在手機如此低的運算能量上,在整句文字內容辨識的準確度,的確在短時間內無法有效提升以符合你的需求.當你說出…"7月8號晚上10點,我必須打電話給Sally,告訴他飛機降落時間改成下午4點",如果辨識系統將記錄成 "1月發號晚上4點,我逼需打電話給鯊魚,告訴他非機降路時間改辰下午10點".你覺得這樣會對你比較有幫助嗎? 手機的運算功能與記憶體有限,不容易將整句式語音辨識效果做大幅的提升.但瀚語科技秉持"推廣語音辨識系統進入人們生活”的信念,先將日期辨識做到最好,且準確的記錄你的聲音進入行事曆裡.因為對於日期有極高辨識率與高抗噪的特色,他將是你值得信賴的夥伴,它將成為你solid 的貼身秘書!

“簡單生活,你說了算!”
再者,高準確率的整句式的語音辨識系統對於瀚語來說,並非遙不可及的目標.但的確需要時間與經費進行研究與發展.透過您下載的支持,瀚語承諾你的期待,將指日可待.瀚語科技,以高辨識度與高抗噪能力的語音辨識演算法為根基,推廣以語音輸入為主的人機介面模式,讓你的生活更簡單.讓你的生活,你說了算!

張貼留言

歡迎隨便亂哈啦留言或發表意見,不過要理性不做人身攻擊~匿名的朋友得到回應的速度會比較慢喔~
請注意發問相關的禮貌和規矩,不當留言、和本文無關的回應可能會被直接刪除無視喔!