|
分享到 Facebook 推至Plurk 推至twitter 初試秒聽錄音,久違地接上通話那端的聲音
文、圖/黃靖騰
語音轉文字,很多人拿來開會、上課、做訪談,當成節省時間的工具。放進我的生活裡,它更像另一雙耳朵,讓我有機會多聽見一點世界的聲音。
我常常看著別人談笑風生,自己卻慢半拍,甚至整段對話落空。搭公車時,廣播一閃而過,毫無覺察;買東西時,店員一句急促的話語沒接收到;朋友幾個人同時聊天,我未必插得上話;還有講電話,幾乎早就和我無緣。
我是視聽障者,和外界互動很依賴語音轉文字,也就是即時字幕。這幾年一直在摸索更好用的工具,也持續關注這類技術的發展。現在最常用的,是 iPad 接上 KONIX 無線麥克風,再開啟系統內建的 Siri 聽寫。近距離、一對一、環境安靜時效果還算不錯;但環境稍微複雜,限制就很明顯了。停頓久一點沒說話,辨識自動中斷;說話的人距離稍遠,聲音常常收不進來,畢竟這原本是偏向語音輸入的功能;如果是手機另一端的通話聲、外放影片的聲音或廣播聲,辨識內容也常零碎不全,前一句有、後一句沒有,偏偏漏掉重要的地方。
前幾天,我下載了「秒聽錄音 Tinrec」,本來只是想測試辨識效果如何。它目前有每月 60 分鐘的免費方案,可以先實際試幾輪,不必一開始就付費碰運氣。官網公開的功能包括即時逐字稿、AI 整理會議重點、多語言自動辨識,也能解析 YouTube、TikTok 等影片連結內容;除了 iPhone、iPad 有 APP 可下載,也支援 Android 版和網頁版。
我先測了一下基本辨識,感覺準度不錯,官方資料寫可達 95% 以上。接著突發奇想,不妨直接拿最難的一關來試:通話。
於是我用手機打 LINE 給好友豪哥。接通之後,豪哥從另一端傳來的聲音,iPad 上的秒聽錄音真的一行一行穩穩變成文字,出現在我眼前。我一邊看、一邊回,居然能順利跟上了!豪哥也很驚訝,「怎麼突然打電話,是不是聽力恢復了,還是旁邊有人幫忙翻譯?」
這通電話其實沒聊什麼大事,也不是什麼重要通知,但這種「你一句、我一句」的自然對話,似乎已離我很遠很遠。久違到幾乎有點陌生,卻又熟悉得讓人笑出來。
很多工具一開始不是為障礙者設計,卻會在某個地方剛好補上障礙者最需要的缺口。像 AI 影像辨識,本來不是只為視障者存在,卻能幫助視障者理解圖片;一般代步工具不是專門為肢障者發明,卻也可能成為重要的移動支持。秒聽錄音也是如此。它原本是一款錄音、即時轉文字,再交給 AI 整理重點的工具,拿來做會議、課堂、訪談記錄都很實用。錄音結束後能自動生成摘要,整理主要結論與待辦事項,也支援多語言逐字稿。當它放進聽障者的生活裡,意義就不只停在整理資料而已。像我所需要的,是平常就能接住語言資訊:看懂店員剛剛回了什麼、醫生交代了哪些注意事項、即時知道廣播在說哪一站,還有,和家人朋友好好講完一通電話。
除了語音辨識準確度高,秒聽錄音也正好補足我原本使用 iPad 內建聽寫在複雜環境裡的缺陷,因為它的靈敏度非常高,收到什麼語音都照單全收,廣播聲、影片外放全不遺漏。
然而,實際用下來,它也不是沒有限制。最直接的一個就是時數。免費 60 分鐘很適合試用,但只要真的放進生活,很快就不夠了。因此我直接聯絡官方客服,談談聽障者長時間使用的需求。客服回覆,目前原價 99 美元的 Pro 年卡,他們願意承擔一些社會責任幫助障礙者,因此提供完成聽障認證的使用者六折優惠,以 59 美元(約 1800 台幣)購買年卡,另外再送 2 個月,等於 14 個月;每月提供 1200 分鐘,也就是 20 小時的時數,若超過還可以另外加購。
這樣算下來,價格確實比原本約 2990 台幣友善不少,但如果是高度依賴即時字幕生活的人,20 小時仍不算寬裕。語音資訊不只出現在正式場合,它散落在整天的日常裡:和家人聊天、搭車、買東西、看醫生,甚至只是接一通電話,都在消耗時數。
另一個我很在意的,是閱讀介面。因為我不只有重度聽障,也有重度視障。語音轉文字再準,最後還是要看得清楚、跟得上速度,工具才能真正融進生活。現在很多逐字稿頁面的預設字體,對視力正常的人也許剛好,對我卻太小。若用 iPad 內建縮放功能閱讀,畫面雖然變大,閱讀卻不一定順暢,橫向拖移也容易拖慢速度,很難追上正在前進的對話。所以字體大小、背景與文字的對比、能否依自己的速度手動滾動,都是長期使用的重要條件。
我把低視能閱讀的需求一起跟官方說明。讓我驚喜的是,他們沒有只回一句制式感謝,而是很快開會討論後提出方向:除了聽障者可享有認證優惠外,若累積到 10 位聽障用戶確認有購買需求,他們會推進下一階段的介面優化,包含字體大小、字體與背景色設定,並支援手動滾屏。
原本只是想找一個辨識比較穩的工具,沒想到最後遇到一個願意聽使用者說話、也願意持續調整的團隊。從聽障優惠、認證機制,到閱讀介面,甚至未來更多使用者進來後可能爭取到的額外方案……工具不一定一開始就非常完善,但只要有人使用、有人反映、開發者願意回應,它就會慢慢變得更好。
如果你是聽障者,平常也需要靠即時字幕理解別人說話、跟上現場內容,我覺得秒聽錄音很值得試試。先將免費的 60 分鐘,測你最在意的情境:通話、面對面聊天、搭車廣播、看醫生、聽活動說明,看它能不能跟上你的生活節奏。假如試過覺得不錯,也有身心障礙手冊,目前官方已釋出聽障者認證、以六折優惠付款的頁面;如果之後有更多聽障朋友一起使用,也許不只價格更有空間,功能也會一步一步更貼近障礙者的需求。
我也把它推薦給一位聽障朋友。他先用免費時數處理會議內容,原本只是抱著試試看的心情,沒想到會後再看 AI 整理出的重點時很驚訝:整場會議的脈絡、重點事項與待辦幾乎都能掌握,後來也決定繼續使用。
如果你不是障礙者,只是在找一款能處理課堂筆記、會議記錄、訪談整理的工具,它其實也很夠用了。
秒聽錄音最打動我的,是它把生活裡原本斷掉的一些互動,一點一點接了回來。那種失而復得的喜悅,像是換了一種方式與世界連結。所以我也決定付費使用,成為第一批聽障用戶。希望未來有更多聽障朋友一起加入,讓這個工具在生活裡被打磨、被修正,慢慢長成更貼近我們需要的樣子。
|