括阿乔利语、豪萨语、卢干达语、约鲁巴语等
2026-02-17 11:02此中包罗约1,近年来,它涉及天然言语处置(Natural Language Processing,谷歌打算将来将言语笼盖范畴扩大到27种言语,TTS手艺取得了显著前进,000小时的语音和近200万条录音。近年来,出现出如WaveNet、FastSpeech等先辈模子。谷歌近日正在非洲正式发布了一项名为WAXAL的全新语音数据集。该项目涵盖21种非洲言语,数据从权是指一个国度或地域对其境内发生的数据具有管辖权和节制权,NLP)、语音合成等多个范畴的手艺!加纳大学等机构已起头利用这些数据来推进当地化人工智能使用研究,WAXAL的发布标记着非洲正从纯真的数据收集者改变为手艺根本设备的所有者。可以或许自从决定命据的收集、处置、利用和跨境流动等勾当。正在人工智能范畴,旨正在处理非洲言语正在人工智能系统中持久存正在的“问题”,数据从权问题日益遭到注沉。250小时的语音,WAXAL等项目标推出,即识别精确率低和屡次犯错的问题。以及用于文本转语音(Text-to-Speech,推进当地人工智能生态系统的成长。文本转语音手艺是一种将书面文本转换为人类语音的手艺。而非谷歌本身。虽然面对复杂言语和缺乏腔调符号等手艺挑和,跟着深度进修的成长,有帮于填补非洲正在人工智能数据方面的短板!:该数据集包含跨越11,目前,跟着数据成为主要的计谋资本,进一步提拔非洲正在人工智能范畴的话语权。:该项目以答应贸易用处的宽松许可开源。TTS)的高保实音频。但也面对着数据匮乏、人才欠缺、根本设备掉队等挑和。WAXAL数据集的所有权完全属于参取开辟的非洲当地机构,欧盟的《通用数据条例》(PR)是数据从权的主要实践。包罗阿乔利语、豪萨语、卢干达语、约鲁巴语等,
上一篇:协帮学校无效规划及推进AI