M2UGen是一个由腾讯和新加坡国立大学共同研发的多模态音乐生成模型,它具备音乐生成、理解和编辑的能力。具体来说,M2UGen可以接收文字、图片、视频或音频作为输入,然后生成与之.
逗哥配音是一款500w+达人热推的的AI配音软件,独有的AI智能配音技术,更专业,更完美贴近真人配音。内置丰富的短视频创作工具,文案提取、人声分离等短视频必备功能,逗哥配音是你短视频创作不二的选择!
网易云音乐·X Studio
Riffusion是一个利用人工智能生成音乐的工具,它可以根据用户输入的任何文本,创作出相应的音乐片段。它的原理是将文本转换成声音的图像,也就是频谱图,然后再将频谱图转换成音频。
NaturalReader:通过人工智能的声音为在线、移动应用、商业许可和教育提供免费的文本到语音转换。
Audio Jam 官方网站,Audio Jam 最新下载地址
百度文心,产业级知识增强大模型,包含基础通用大模型及面向重点领域和重点任务的大模型,同时有丰富的工具与平台支撑高效便捷的应用开发,学习效率高,可解释性好,大幅降低AI开发与应用门槛.