马萨诸塞州理工学院研究人员已经开发了修剪,调整和重新修剪(PARP)技术,以简化高级语音学习模型,以更容易地学习罕见的语言。
它需要消除Wave2VEC 2.0神经网络的不必要的组件,然后进行小调整,以便它可以识别特定语言。
Wave2VEC 2.0预先预先从原始音频学习基本语音,并需要大量的计算能力以培训特定语言。
研究人员修剪了对学习语言不必要的网络连接,然后培训了与标签的西班牙语和法语语音集的子网,其重叠97%。
PARP表现出用于语音识别的其他常见修剪技术,尤其是在训练时训练在非常少量的转录语音上。
从麻省理工学院新闻
查看完整的文章
摘要版权所有©2021史密斯巴克林,华盛顿,直流,美国
没有发现任何条目