您的位置:首页手机教程 → Google开源即时转录原始编码让更多开发者以此打造丰富语音工具

Google在今年2月推出名为「即时转录(Live Transcribe)」的语音工具,让使用者能即时将口说或播放的语句内容快速识别转换为文字内容,让听力有问题的人也能快速知晓。而在稍早时候,Google更进一步将此项语音工具开源,让更多开发者能借此打造便利的应用工具。

「即时转录」的技术源自Google Cloud Platform所提供的Cloud Speech API,除了藉由云端协同运算提高语音内容识别精准度,同时也能藉由Android装置进行前期运算,让实际识别转换效果更好。

Google开源即时转录原始编码让更多开发者以此打造丰富语音工具

其实在今年准备释出正式版本更新的Android Q (10.0)所搭载的Live Caption功能,在背后运作其实也采用相同运作模式,但可藉由Android装置进行简单运算,即便在没有连网情况下也能完成一定程度的语音内容识别、转换,而配合连网运作则可让实际识别正确率提高,同时也能以更快效率完成转换。

目前Google进一步将「即时转录」工具编码内容开源,自然希望能藉由更多开发者已此打造更丰富的实用语音工具。

而为了让「即时转录」有更好应用表现,Google更进一步降低背后需要使用网路频宽,在不影响识别转换精准度情况下,约让网路频宽使用量缩减为原本的10%,同时为了让即时语音识别效率提升,并且减少反应延迟表现,Google也藉由自订Opus编码器降低延迟问题。

在现阶段里,「即时转录」已经支援中文、日文、英文在内70种语言,但部分语言在内容识别仍有其局限,例如日文暂时还难以判断完整语句的结尾,因此实际辨识结果可能会变成所有语句均连接在一起,难以分辨前后句的情况。

最新文章

    关于我们|免责申明|商务合作|友情链接|网站地图

    @2019- QHmanhua.com 清欢网 All Rights Reserved