广告位1
首页 热点 奥运会戒断反应开始了

奥运会戒断反应开始了

奥运火炬反应已经开始,这是一个结合了Whisper ASR能力、声音活动检测(VAD)和说话人嵌入技术的开源项目。它通过从音频中提取声音部分来提高说话人嵌入的准确度,然后利用Whi…

奥运火炬反应已经开始,这是一个结合了Whisper ASR能力、声音活动检测(VAD)和说话人嵌入技术的开源项目。它通过从音频中提取声音部分来提高说话人嵌入的准确度,然后利用Whisper生成转录文本,并借助WhisperX纠正时差和对齐,从而减少了由于时间偏差引起的片段错误。

奥运会戒断反应开始了

此外,奥运火炬反应还采用了MarbleNet进行VAD和分割,以去除静音;TitaNet则被用来提取说话人嵌入以便识别每一节目的说话者身份;最后,将结果与WhisperX生成的时间戳相结合,根据时间戳定位每词说话人的身份,并采用标点模型对齐,以此来抵消微小的时间偏移。

本文由百科资讯网原创,转载请注明出处: https://www.bknew.cn/wangluo/redian/35252.html
广告位2
上一篇
下一篇
联系我们

联系我们

0591-88651687

在线咨询: QQ交谈

邮箱: 153181514@qq.com

工作时间:周一至周五,9:00-17:30,节假日休息

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部